개발차
[Pandas] Pandas04 - US Crime Rates 풀이
United States - Crime Rates - 1960 - 2014Introduction:This time you will create a dataSpecial thanks to: https://github.com/justmarkham for sharing the dataset and materials.Step 1. Import the necessary librariesIn [1]:import pandas as pd Step 2. Import the dataset from this address.Step 3. Assign it to a variable called crime.In [2]:url = 'https://raw.githubusercontent.com/guipsamora/pandas_exe..
[NLP] Day 33 - LDA
LDA 이제는 hard clustering이 아닌 soft clustering으로 각각의 토픽들이 확률로서의 값을 가진다.M개의 문서, 각각의 문서의 토픽 분포 θm (갯수 K) 에서 각각의 토픽내의 확률값에 따라 단어(w_1,w_2) N개 를 뽑아낸다. Z와 join해서. 그래서 W(단어)가 나오게 된다.N : M번째 문서에서 나온 단어의 수K개의 토픽을 고를 때, alpha가 관여하고, N개의 단어를 뽑을 때 beta가 관여함이를 Graphical model이라고 부를 것이다.각 단어 W에 대해서, 어떤 토픽분포에서 파생된 Z에서 왔는지를 찾는 것이 목표이다. generative process θi : Dirichlet(α)를 통해 결정. 특정 문서내에서 "토픽분포". i=0,1,2,⋯,M ( M: ..
[Qwiklabs] 1. Introduction to APIs in Google
Introduction to APIs in Google Google의 다양한 API에 대해서 알아보고 HTTP 구조와 JSON를 작성하고 API를 조금 이용해보는 시간을 가졌다. 이번 Qwiklabs에서는 Coursera처럼 중간중간에 퀴즈를 풀도록 하여 이해한 내용을 점검하도록 도왔다. HTTP의 GET,PUT,POST,DELETE 에 대해 다시금 이해했지만 이를 Qwiklabs에서는 적용하지 않았다! 뒤의 Objectives들 또한 마찬가지로 글을 읽으며 가볍게 이해하기 좋았다. 설명을 따라가면서 실습을 진행한다면 막힐 것이 없을 것 같다!
[Coursera] 3. Generalization and Sampling
마지막 강의인 Generalization and Sampling을 Google BigQuery를 통해 이해해보았다. Google BigQuery를 처음 접해봐서 낯선점이 있었지만 또 새로운 언어를 접했다는 것에 신기하고 좋은 경험이었다. 코스를 다 마치면 이렇게 수료증이 발급이 된다. Coursera의 Launching into Machine Learning의 경우에는 완전 초심자가 듣기보다는 어느정도 배경지식이 있는 상태에서 듣는다면, 복습이 되면서 지식을 확인하게 되는 기회가 되는 것 같다. 또한 Google BigQuery에 대해 몰랐다면 강의를 따라서 천천히 이해하기에 좋은 것 같다. 단기간에 강의를 다 들을 수 있었을 정도로, 짧지도 길지도 않은 알짜배기 ML 강의인 것 같다.(95%인건 마지막..
[논문읽기] 01-1. GAN with Tensorflow
GAN with MNIST https://github.com/golbin/TensorFlow-Tutorials/blob/master/09%20-%20GAN/02%20-%20GAN2.py위의 Tutorials를 통해 GAN을 구현해볼 것이다. In [45]:# 필요한 모듈 먼저 불러오기 import tensorflow as tf import matplotlib.pyplot as plt import numpy as np tf.reset_default_graph() 데이터 불러오기In [46]:from tensorflow.examples.tutorials.mnist import input_data mnist = input_data.read_data_sets("./mnist/data",one_hot=True) ..
[논문읽기] 01. Generative Adversarial Nets : GAN
" 생성사(Generator)와 식별자(Discriminator)의 선의의 경쟁 " 0. Abstract 두 명의 플레이어가 하는 "minmax-game"의 형태이다.D는 G의 성능을 minimize하는 것, G는 D가 실수할 확률을 최대화(max)하는 것이 학습 과정이다.최선의 Solution은 G가 기존 training data 분포에서 뽑아내고 D가 식별 할 때, 12로 서로의 성능이 동일하다.전체 과정은 Backpropagation으로 학습 가능하다. 1. Introduction 이전의 생성 모델들은 큰 임팩트가 없었는데, MLE와 다른 관련된 과정에서 발생하는 계산 에 있어서, 계산 불가한 확률 연산이 많아서 추정하기가 어려웠기..