개발차
[핸즈온 머신러닝] 제 2장 정리
Keywords를 살펴보기 전에 머신러닝의 프로젝트 순서를 알아보자 큰 그림을 보고 데이터를 구하고 데이터로 부터 통찰을 얻기 위해 탐색하고 시각화한다. 머신러닝 알고리즘을 위해 데이터를 준비 모델을 선택하고 훈련시킴 모델을 상세하게 조정한다 솔루션을 제시 시스템을 론칭하고 모니터링하고 유지 보수 Keywords 평균 제곱근 오차(RMSE : Root Mean Square Error) : 오차가 커질수록 이 값은 커짐, 예측에 얼마나 많은 오류가 있는지 가늠하게 해줌, 제곱항을 합한 것의 제곱근(RMSE)는 “유클리디안 노름”에 해당, L2 / 노름의 지수가 클수록 큰 값의 원소에 치우치며 작은 값은 무시되는데 이 때문에, MAE보다 조금 더 이상치에 민감함. (이상치가 드물경우 RMSE가 good) 평..
[CS231n] 2. Image Classification Pipeline
Image Classification은 어떻게 하는 것 일까? 우선 입력 이미지를 받는다. 그리고 시스템에는 미리 정해놓은 카테고리 집합이 존재한다. 이미지를 보고 어떤 카테고리에 속할지 고르는 것. 컴퓨터에게는 이미지는 그저 숫자의 집합에 불과하다. 카메라를 조금만 옮겨도 모든 픽셀 값이 달라진 것이다. 그렇기에 우리가 만드는 알고리즘은 이런 상황에데 대해 강인해야한다. ( 조명,자세,가려짐, 배경과 비슷할 때 또한 마찬가지이다. ) 직관적이고 명시적인 알고리즘은 존재하지 않는다. 이미지를 보고 edges를 계산하고 , corners와 edges를 각 카테고리로 분류한다. -> 하지만 이런 알고리즘은 “확장성”이 없는 것이다. 다른 물체를 인식하려면 다시 처음부터 진행해야 하는 것이 문제이다. 그래서 ..
[CS231n] 1. Introduction to Convolutional Neural Networks for Visual Recognition
1 ~ 16강으로 이루어진 CS231n의 강의를 듣고, 이해한 내용을 토대로 정리할 것이다. 강의를 들으면서 떠오르는 Idea들과 접목시켜 생각해보면 유익할 것 같다. CS231n은 Stanford University에서 진행하는 Computer Vision에 대한 강의이다. Computer Vision은 매우 다양한 분야에서 적용이 되고 있고, 적용이 될 수 있다. 이번 1강에서는 Computer Vision의 간략한 역사와 CS231n의 개요에 대해 알아볼 수 있다. 과거에는 고대 생물들은 시각(비전)이 존재하지 않았다.그래서 시각이 존재하기 이전에는 먹이를 찾아서 먹지 못하고, 수동적으로 살아왔다. 하지만 종이 폭발적으로 늘어난 시기가 있었다. 이러한 발전의 이유를 "시각(비전)"에서 찾았다. 한 ..
[모두의 딥러닝] TensorFlow를 AWS에서 GPU와 함께 돌려보자
Sung Kim 님의 "모두의 딥러닝" 강의노트입니다좋은 강의 감사드립니다!https://www.youtube.com/watch?v=mQGwjrStQgg&list=PLlMkM4tgfjnLSOjrEJN31gZATbcj_MpUm&index=5 AWS를 이용하여 매우 효율적으로 사용하자! 학습시간에 많은 시간이 소요된다. -> GPU를 사용하는 것 그래픽의 효율을 높이기 위한 것인데, metric 계산을 빠르게 할 수 있다. GPU가 없을 때는 Cloud service를 이용하면 된다. 클라우드에 올려서 빠르게 실행시키는 것이다. AWS를 이용해서 돌려볼 것이다. Oregon이 가장 저렴하다. ( 구글 윤석찬님 영상 도움된다! ) EC2에 들어가서 lunch instance를 누른다. 가장 많이 사용되는 Ub..
[모두의 딥러닝] RNN with Time Series Data
Sung Kim 님의 "모두의 딥러닝" 강의노트입니다좋은 강의 감사드립니다!https://www.youtube.com/watch?v=mQGwjrStQgg&list=PLlMkM4tgfjnLSOjrEJN31gZATbcj_MpUm&index=5RNN을 이용해서 Time-Series data를 예측할 것 이다. Time-series란 말 그대로 시간이 지나면서 값이 변하는 것을 말한다. 대표적인 것이 주식가격이다. 다음과 같은 형태로 RNN이 나타날 것 이다. 7일 이전의 데이터를 넣어 8일째의 가격을 예측할 수 있는 것이다. 7일 데이터 만으로 예측하는 것 보다, 이전의 데이터들을 모두 이용하여 어떤 영향을 미친다 라는 가설을 이용하는 것이 many to one의 idea이다. Input_dim은 5가 된다 ..
[모두의 딥러닝] Dynamic RNN
Sung Kim 님의 "모두의 딥러닝" 강의노트입니다좋은 강의 감사드립니다!https://www.youtube.com/watch?v=mQGwjrStQgg&list=PLlMkM4tgfjnLSOjrEJN31gZATbcj_MpUm&index=5 RNN의 가장 큰 장점 : Sequence data를 잘 다룰 수 있다는 것 sequence는 항상 정해져있었다. 하지만 정해지지 않을 때가 있다. 각각이 원하는 입력값들이 가변한다. 그래서 문자열들의 갯수가 달라지게 된다. -> 기존에는 빈 공간에 padding을 이용했다! 하지만 weight들이 들어있기 때문에, 이 것이 loss를 헷갈리게 할 수 있다. 그래서 배치에 대해 sequence_length를 알려주어야 한다. 그래서 loss가 헷갈리지 않도록 도와준다...