[CV Project] 마스크 착용 상태 분류 - check Point 정리🌓
Date:
Model 구현 시 check 사항 정리
Problem Definition
-
Target 설정
-
Data 분석
- 데이터 형태 확인
- 분포 확인
- Target을 도출하기 위한 Data
약점
을 파악
- 약점 : Data 불균형, Data 수, Data Miss Matched, Data 누락&훼손
- Data를 보완할 만한 기법 고민
- Augmentation 방법 설정, Transform, batch Size
Data Augmenetaion
외부데이터 사용
- Kaggle, Dacon 등 외부 대회에서 사용한 Public DataSet 사용
transform
- cutmix -> Cut mix의 경우
- randaug(albumentation하고는 조금 다름)
- randerase (50% 일 때 잘 동작) -> 쓸만한 거 2~3개 정도 추려서 사용
Hyperparameter
Batch Size
- 커질 수록
sharp
하게 수렴, 작아질 수록flat
하게 수렴 - Batch Size가 작아지면 전체 Data에 대한 설명하는 부분이 작아지기 때문에 Noise가 발생하고, Local minimum에 조금은 더 둔감해짐
- Batch Size가 커지면 전체 Data에 대해서 상대적으로 설명을 잘하기 때문에 Noise가 적어짐
- 작으면
underfitting
가능성이 높아지고, 클 수록Overfitting
가능성이 높아짐
Learning Rate
- scheduler를 활용하여 Learning Rate를 변경하여 사용할 수 있음
- ex :
scheduler = optim.lr_scheduler.CosineAnnealingLR(optimizer, T_max=10, eta_min=0)
model
Ensemble
- Overfitting 방지 효과
- Model averaging – hard or soft voting
- (Strafied) K-fold Cross Validation
- Test Time Augmentation (TTA)
- Hyperparameter Optimization
Code 작성
- 코드작성 시 설명 중요
- 코드본다면 디테일하게
- Competition 에서 공유 문화에 적응하기
- Paper자료
📌reference
- boostcourse AI tech
💡 수정 필요한 내용은 댓글이나 메일로 알려주시면 감사하겠습니다!💡
지원여부 | Image Format |
---|---|
읽기/쓰기 모두 지원 | BMP, DIB, EPS, GIF, ICNS, ICO, IM, JPEG, JPEG 2000, MSP, PCX, PNG, PPM, SGI, SPIDER, TGA, TIFF, Webp |
읽기만 지원 | BLP, CUR, DCX, DDS, FLI, FLC, FPX, FTEX, GBR, GD, IMT, IPTC/NAA, MCIDAS, MIC, MPO, MCD, PIXAR, PSD, WAL, WMF, XPM |
쓰기만 지원 | PALM, PDF, XV Thumbnails |
댓글