모플로 2021. 9. 6. 18:06
반응형

CV와 Graphics의 관계

  • CV: image에서 정보를 추출한다
  • Graphics: 정보를 통해 image를 생성한다

Visual perceptron

  • 왼쪽 이미지만 보면 사람의 얼굴에대해 그렇게 큰 이상함을 느끼지 못하고 뒤집어져 있는줄 안다.
  • 하지만 원래대로 돌려보면 이상한 느낌을 받는다
  • 우리가 뒤집어져있는 사람의 사진을 본 경우가 많지 않기때문에 우리의 시각 기능이 일반 정면 얼굴 사진에대해 편향되어있다고 예측해볼 수 있다

CV의 MachineLearning과 DeepLearning

  • MachineLearning: 과거의 머신러닝으로 사람이 이미지에대해 특징을 추출하여 식을 만들었고, 작은 규모의 classification을 했다.
  • DeepLearning: 사람이 눈으로 추출하지 못하거나 수식으로 옮기지 못하는 것들이 있기 때문에 특징 추출부터 컴퓨터가 찾아준다.

Image Classification

  1. KNN(K-Nearest-Neighbors)
  • 우리가 마냑 이세상의 모든 데이터를 가지고있다면 이러한 방법으로 접근할 수 있다.
  • classifies a query datat point according to reference points closet to the query
  • 검색문제

ex) 이러한 상황이면 star는 action movie가 된다 

출처: 허민석님 유튜브

  1. CNN
  • 기존엔 FC(Fully Connected) Layer로 사용했지만 FC는 이미지의 모든 부분을 같은 가중치로 학습하기 때문에 아래와 같은 경우 제대로 찾지 못한다

  • 그래서 나온게 CNN이다

  • FC는 pixel by pixel로 parameter가 필요하지만 CNN은 Locally 즉 조금의 영역만큼씩 추출해서 그 영역들의 수만큼만 parameter가 필요하기 때문에 사용되는 parameter가 많이 줄어든다.
  • 물체의 위치가 바뀌더라도 큰 문제없이 최종적인 결론에 도달할 수 있다

CNN 역사

  1. Alexnet
  • Alexnet은 당시의 GPU 메모리의 한계로 2개의 컴퓨터로 네트워크 통신을 하면서 학습했다
  1. VGGnet
  • simple한 구조로 3x3 conv filter와 2x2 max pooling레이어만 사용했음
반응형