개발차
[Pandas] Pandas05 - Housing Market 풀이
Housing MarketIntroduction:This time we will create our own dataset with fictional numbers to describe a house market. As we are going to create random data don't try to reason of the numbers.Step 1. Import the necessary librariesIn [4]:import pandas as pd import numpy as np import random Step 2. Create 3 differents Series, each of length 100, as follows:¶The first a random number from 1 to 4 Th..
[Pandas] Pandas05 - Fictitious Names 풀이
Fictitious NamesIntroduction:This time you will create a data againSpecial thanks to Chris Albon for sharing the dataset and materials. All the credits to this exercise belongs to him.In order to understand about it go here.Step 1. Import the necessary libraries¶In [1]:import pandas as pd Step 2. Create the 3 DataFrames based on the followin raw dataIn [2]:raw_data_1 = { 'subject_id': ['1', '2',..
[핸즈온 머신러닝] 제 10장 연습문제 풀이
Exercise Part. 10Neural_Network 1. 초창기 인공 뉴런을 사용해 A+B(+는 XOR연산)를 계산하는 인공신경망을 그려보세요.EC DA B처럼 아래서 위로 네트워크가 진행된다고 했을 때,(not A) and B = DA and (not B) = CC or D = E ( A + B (XOR) )2. 고전적인 퍼셉트론보다 로지스틱 회귀 분류기가 일반적으로 선호되는 이유는 무엇인가요? 퍼셉트론을 어떻게 수정하면 로지스틱 회귀 분류기와 동등하게 만들 수 있나요?고전적인 퍼셉트론은 선형적으로 구분될 때만 수렴하고 확률을 추정할 수 없다. 하지만 로지스틱은 선형적으로 구분되지 못해도 클래스 확률을 잘 출력할 수 있다. Activation은 softmax로 바꾸고, 경사 하강법을 사용하여 훈련..
[Projects] 1-3. 시바견과 진돗개를 구분해보자!
시바견과 진돗개 구분하기 3Pretrained Inception-v3 을 이용해 볼 것이다.https://sefiks.com/2017/12/10/transfer-learning-in-keras-using-inception-v3/m그 전에 데이터를 다시 정제했기에, 기존 네트워크로 한 번 실행해볼 것이다.Stanford의 dog breed classification 처럼 class당 데이터의 갯수를 줄여보았다.어느 네트워크를 적용하나 데이터에 문제가 있다고 판단하여 2탄에서 pretrained를 적용하고 여기서 마무리 할 것이다.시바견과 비글다른 견종을 넣었을 때는 성능이 더 높아질 것 같아서 넣어보았다. 실제 육안으로도 쉽게 구별 가능한 비글과 시바견을 분류 대상으로 정했다.필요한 모듈먼저 부르기In [..
[NLP] Day 40 - Final
NLP 마무리 음절, 어절, 문장, 문단 및 담화의 차이점에 대하여 설명하시오 *음절이란, 소리가 나는 최소한의 단위로 낱글자 하나이고, 어절은 띄어쓰기의 단위로 구분이 되고, 어절이 모여서 문장이 되는 것이고, 문장들이 모여서 문단이 생기게 된다. 그리고 문단들의 의미가 생기면서 의미를 담고 있는 담화가 만들어지게 된다. 토큰화(Tokenization)에 대하여 설명하시오 *전처리에서 필요한 과정이다. 대문자,소문자, 기호를 제거하려고 실행한다. 구두점도 분리하는등 정제하는 데 필요하다. 의미를 가지는 최소한의 단위를 얻기 위함이다. 지프(Zipf)의 법칙과 힙스(Heaps)의 법칙에 대하여 설명하시오 *자기 순위와 빈도를 역순으로 가져가는데 고빈도 / 저빈도로 나뉜다. 너무 잘나오거나 너무 희귀한 단..
[NLP] Day 39 - Word_Embedding
머신러닝 자연어 처리 기술Word_Embedding¶In [109]:import numpy as np words = ["I","like","enjoy","deep","learning","NLP","flying","."] X = np.array([[0,2,1,0,0,0,0,0], [2,0,0,1,0,1,0,0], [1,0,0,0,0,0,1,0], [0,1,0,0,1,0,0,0], [0,0,0,1,0,0,0,1], [0,1,0,0,0,0,0,1], [0,0,1,0,0,0,0,1], [0,0,0,0,1,1,1,0]]) U,Sigma,V = np.linalg.svd(X,full_matrices=False) In [110]:Sigma Out[110]:array([2.75726275, 2.678248 , 1.892..