반응형
CV와 Graphics의 관계
- CV: image에서 정보를 추출한다
- Graphics: 정보를 통해 image를 생성한다
Visual perceptron
- 왼쪽 이미지만 보면 사람의 얼굴에대해 그렇게 큰 이상함을 느끼지 못하고 뒤집어져 있는줄 안다.
- 하지만 원래대로 돌려보면 이상한 느낌을 받는다
- 우리가 뒤집어져있는 사람의 사진을 본 경우가 많지 않기때문에 우리의 시각 기능이 일반 정면 얼굴 사진에대해 편향되어있다고 예측해볼 수 있다
CV의 MachineLearning과 DeepLearning
- MachineLearning: 과거의 머신러닝으로 사람이 이미지에대해 특징을 추출하여 식을 만들었고, 작은 규모의 classification을 했다.
- DeepLearning: 사람이 눈으로 추출하지 못하거나 수식으로 옮기지 못하는 것들이 있기 때문에 특징 추출부터 컴퓨터가 찾아준다.
Image Classification
- KNN(K-Nearest-Neighbors)
- 우리가 마냑 이세상의 모든 데이터를 가지고있다면 이러한 방법으로 접근할 수 있다.
- classifies a query datat point according to reference points closet to the query
- 검색문제
ex) 이러한 상황이면 star는 action movie가 된다
- CNN
- 기존엔 FC(Fully Connected) Layer로 사용했지만 FC는 이미지의 모든 부분을 같은 가중치로 학습하기 때문에 아래와 같은 경우 제대로 찾지 못한다
- 그래서 나온게 CNN이다
- FC는 pixel by pixel로 parameter가 필요하지만 CNN은 Locally 즉 조금의 영역만큼씩 추출해서 그 영역들의 수만큼만 parameter가 필요하기 때문에 사용되는 parameter가 많이 줄어든다.
- 물체의 위치가 바뀌더라도 큰 문제없이 최종적인 결론에 도달할 수 있다
CNN 역사
- Alexnet
- Alexnet은 당시의 GPU 메모리의 한계로 2개의 컴퓨터로 네트워크 통신을 하면서 학습했다
- VGGnet
- simple한 구조로 3x3 conv filter와 2x2 max pooling레이어만 사용했음
반응형
'부스트캠프 AI Tech 2기 > 2기 CV U-Stage' 카테고리의 다른 글
CNN Visualization (0) | 2021.09.13 |
---|---|
Object Detection (0) | 2021.09.10 |
Semantic Segmentation (0) | 2021.09.09 |
CV의 DL 발전(2) (0) | 2021.09.07 |
Annotation Data Efficient Learning (0) | 2021.09.06 |