1. 데이터의 중요성
1.1 데이터의 양과 질
1.2 양질의 데이터를 확보하려면?
2. CV 데이터 제작 서비스들
2.1 Labelme
• MIT CSAIL (Computer Science Artificial Intelligence Laboratory) 에서 공개한 image data annotation 도구를 참고하여 만든 오픈소스
• polygon, circle, rectangle, line, point의 annotation 수행 가능
• 장점
• 설치하기가 용이하다.
• python으로 작성되어있어, 추가적인 기능 추가가 가능하다.
• 단점
• 공동작업이 불가능하다. (다수의 사용자가 사용할 수 없다.)
• object, image에 대한 속성을 부여할 수 없다.
2.2 CVAT
• Intel OpenVINO 팀에서 제작 한 공개 computer vision 데이 터 제작 도구
• image, video 등 일반적인 computer vision task 에서 필 요한 annotation 기능을 모두 포함.
• 주로 object detection, image segmentation, image classification
• automatic annotation으로 model output이 annotation 되어 있지만, 정확하 지 않아 수정합니다
• 굳이 초기에 annotation automation을 하지 않아도, 실시간으로 인퍼런스 결과를 가져올 수 있습니다.
• 장점
• 다양한 annotation을 지원한다.
• automatic annotation 기능으로, 빠른 annotation이 가능하다.
• 온라인에서 바로 사용하거나, 또는 오픈소스도 제공되어있어 on-premise로 설치하여 이용가능하다.
• multi-user 기반 annotation이 가능하며, Assignee, Reviewer 기능이 제공된다.
• 단점
• model inference가 굉장히 느리다.
• object, image에 대한 속성을 부여하기가 까다롭다.
2.3 Hasty Labeling Tool
•앞에서 설명드린 도구와 유사한 CV annotation 도구
• 대신, annotation 도구는 전체 솔루션의 일부이고, 데이 터제작/모델학습/서빙/모니터링까지 전체를 쉽게 할 수 있는 솔루션 제공
• 회원가입을 통해서 사용 가능
• 특정 action을 이용할 때마다 비용 발생
• 장점
• 다양한 annotation을 지원한다.
• semi-automated annotation 기능을 지원한다.
• cloud storage를 활용할 수 있다. (유료) • multi-user 기반 annotation이 가능하며, Assignee, Reviewer 기능이 제공된다.
• 단점
• 서비스 자체가 free credit을 다 소진한 이후에는 과금을 해야한다.
• annotator가 수동으로 이미지마다 review state로 변경해주여야 한다.
• Hasty 플랫폼에 강하게 연결되어 있어, annotation 도구에 대한 커스터마이징이 불가능하다.
2.4 서비스 비교
'부스트캠프 AI Tech 2기 > 2기 CV 데이터제작' 카테고리의 다른 글
성능 평가 방식 (0) | 2021.11.14 |
---|---|
Annotation Guide (0) | 2021.11.09 |
데이터 소개 (0) | 2021.11.09 |
Text Detection 소개 (0) | 2021.11.09 |
데이터 제작의 중요성 2 (0) | 2021.11.09 |