프로젝트 주제 성별(남,여), 마스크착용(착용, 미착용, 대충착용), 연령대(30세 이하, 31세~59세, 60세 이상) 18개의 class를 classification 하자 프로젝트에 사용된 기술 Pytorch WandB Data Augmentation: TTA (TestTimeAugmentation) face recognition k-fold cutmix soft ensemble Multi-Class Model Concatenation 사용한 모델 Rexnet Efficientnet Regnety 진행 요약 1주차 첫주차때는 개인전으로 개인이 직접 Zero base부터 구성하는 작업을 했다. 이 기간을 나는 파이토치에 대한 감을 잡는 시간으로 활용했다. EDA를 통해 데이터가 어떻게 분포되어있고 활용..
1일차 EDA 2일차 Data Set 처음 주어진 vanilla data의 변환이 필요하기 때문에 Data Set이 필요하다 전처리 작업에 많은 resource가 소요됨 이미지 Bounding box 필요 이상으로 많은 정보를 가지고 있기 때문에 crop해준다 Resize 도메인에 따라 형식에 따라 다양한 case가 존재한다 Generalization Bias & Variance Train / Validation 데이터가 줄어들어 오히려 언더피팅이 되지않나 라고 생각하지만 학습에 이용되지 않은 데이터 셋으로 검증을 해야만 한다. validation set도 train에 관여해서 일반화 되기때문에 학습이 끝난 이후의 test set도 필요하다. Data Augmentation 주어진 데이터가 가질 수 있는..