반응형
1. OCR Technology
1.1 OCR - Optical Character Recognition
요즘 STR(scene text recognition)이라고 부르기도함
글자를 찾고, 찾은 글자를 인식한다
OCR = 글자 영역찾기 + 영역 내 글자 인식 = 글자를 읽는다
1.2 Text Detector
글자 영역 다수 객체 검출
- 영역이 글자인지 아닌지만 알려주는 단일 클래스 문제 (클래스정보가 필요없고 글자인지 아닌지만, 굳이말하면 1개의클래스)
객체 검출과의 차이점
- 영역의 종횡비 : 바운딩 박스가 가로로 길기 때문에 이에 맞게 모델을 설계해야한다
- 객체 밀도 : 논문같은거는 다 글씨다
1.3 Text Recognizer
글자 인식기는 Computer Vision과 Natural Language Processing의 교집합 영역
Image Captioning(이미지를 설명하는 문장을 만들어냄)과 유사함
1.4 Serializer
자연어 처리 모듈 중 가장 많이 사용되는 것은 기 정의된 key들에 대한 value 추출
1.5 Text Parser
BIO 태깅을 활용한 개체명 인식 : 문장에서 기 정의된 개체에 대한 값 추출
2. OCR Services
2.1 Text Extractor
Copy & Paste
2.2 Text Extractor + Natural Language Processing
Search
- Google Photo
2.3 Key-value Extractor
카드번호? 유효기간?
EKYC
반응형