[CS231n] 1.  Introduction to Convolutional Neural Networks for Visual Recognition
📗강의노트/CS231n

[CS231n] 1. Introduction to Convolutional Neural Networks for Visual Recognition

728x90
반응형

1 ~ 16강으로 이루어진 CS231n의 강의를 듣고, 이해한 내용을 토대로 정리할 것이다. 


강의를 들으면서 떠오르는 Idea들과 접목시켜 생각해보면 유익할 것 같다.




CS231n은 Stanford University에서 진행하는 Computer Vision에 대한 강의이다. 




Computer Vision은 매우 다양한 분야에서 적용이 되고 있고, 적용이 될 수 있다. 



이번 1강에서는 Computer Vision의 간략한 역사와 CS231n의 개요에 대해 알아볼 수 있다. 



과거에는 고대 생물들은 시각(비전)이 존재하지 않았다.

그래서 시각이 존재하기 이전에는 먹이를 찾아서 먹지 못하고, 수동적으로 살아왔다.



하지만 종이 폭발적으로 늘어난 시기가 있었다. 

이러한 발전의 이유를 "시각(비전)"에서 찾았다.



한 학자는 시각이 생겼기 때문에 이러한 발전을 이룩할 수 있었다고 주장했다.

시각(비전)이 생기고 생물들이 능동적으로 행동하고 생각하고 판단하기 시작했다는 것이다. 

그렇게 시각의 중요성이 매우 부각되었다.



그러던 와중 물체를 어떻게 인식하는지에 대해 궁금증이 생기기 시작했다. 

그래서 고양이가 물체를 어떻게 인식하는지 연구를 시작했다.

연구결과, 물체를 보는 단순한 세포들이 있었고, 이를 통해 얻어진 정보들이 뒤에가서는 

매우 복잡한 형태로 나타난다는 것을 알아냈다. 


그렇게 물체를 있는 그대로가 아닌 특징을 잡아낸 모습으로 인식하기 시작했다.

그렇기에 물체를 인식하고 만들어내기에는 여러 과정이 필요하다고 주장했다.





물체를 먼저 인식하고, 경계,커브,선등으로 구분하는 Primal Sketch 과정을 먼저 거친다. 


기본 개념은 다음과 같았다.


"모든 객체는 단순한 기하학적 형태로 표현할 수 있다."


좌측의 그림처럼 사람을 원통을 조합해서 만들 수 있고, 우측처럼 관절을 이루어진 모양을 만들 수 있다고 말했다. 


그렇게 이미지를 detection하기 위한 많은 노력들이 이행되었다. 


그 중에서도 Face Detection이 성과를 보였다.




Detection을 하던 도중, 사물을 인식할 때마다 달라지는 광도, 각도등이 문제를 일으킬 것 이라고 생각했다.


하지만 생각보다 물체가 가지는 특별한 특징들은 불변적인 특성을 가지고 있었다. 

 


PASCAL , ImageNet의 Challenge를 통해 우리는 image에 대해 더 정확하게 인지할 수 있게 되었다. 

이 때 부각된 것이 CNN이다. ( 이 떄 등장한 것은 아님, 기존에 90년대에 개념이 존재 )


사람의 오차율이 5.1%였지만 CNN의 경우는 이보다 더 낮은 3.57%의 오차율을 기록해 사람들을 놀래켰다. 



--------------


CS231n은 image classification에 집중할 것이다. 


object detection, image captioning 등 다양한 형태로 나타날 수 있다. 



CNN은 이제 object recognition에서 가장 중요한 도구가 되었다. 


위의 사진을 통해 CNN이 하룻밤만에 등장한 것이 아니라는 것을 알 수 있다.


기존의 1998년의 모델과 유사한 모습을 보인다. 하지만 더 많은 labeling data 와 성능이 더욱 발달된 컴퓨터의 도래가 이와 같은 결과를 불러일으켰다.



사람들은 잠깐 이 이미지를 보고서도 다음와 같은 글을 써내려갈 수 있다. 

아무것도 아닌 것 처럼 보이지만 짧은 시간내에 정보를 Detect했다는 것은 매우 대단한 것이다. 


인공지능 또한 수많은 훈련을 거치고,  image detect를 통해 특성을 잡아내고 맥락을 파악해낼 수 있을 것이다. 



이번 강의를 통해 Image Detection의 중요함, 널리 활용될 수 있는 무궁무진함을 알았다.


그리고 가장 중요한 것은 직접 이용한 Model들이 어떻게 작용하는지, 어떨 때 사용해야하는지를 잘 파악해야겠다. 

728x90
반응형