코딩 기록들
04. Image augmentation 본문
Data augmentation 이란?
- 갖고있는 데이터셋을 여러방법으로 augment하여 실질적인 학습데이터셋의 규모를 키울수있는 방법(수집할수있는 데이터량이 한계적임)
- computer vision 작업은 더많은 데이터 사용할수있음(-> data augment는 coputer vision의 성능 향상시키는 기술의 일종)
Data augmentation 목적
- 한정적 데이터 증강시켜 퍼포먼스 높이고, 과적합문제 해결 (epoch가 증가할수록 training error와 testing error 줄어든다)
하지만, training 데이터가 충분하지못하거나, imbalance불균형 하다면, -> overfitting 문제 발생할수있다(데이터가 많은쪽에 치우친다)
Test Time Augmentation
- training 단계에서 많이 사용되며, test 단계에서도 사용이 가능함 (=TTA)
- 한 쌍의 test image를 여러장으로 증강시켜 inference를 시킨뒤 output을 ensemble하는 방식
- Kaggle과 같은 대회, 챌린지에서 많이 사용되는, 합법적인 기
참고하기 좋은 사이트
albumentations-team/albumentations: Fast image augmentation library and an easy-to-use wrapper around other libraries. Documentation: https://albumentations.ai/docs/ Paper about the library: https://www.mdpi.com/2078-2489/11/2/125 (github.com)
Data augmentation 종류
'이미지다루기및 데이터셋 구축' 카테고리의 다른 글
[Dataset 구현] 1. customdataset (1) | 2023.01.05 |
---|---|
CNN (0) | 2022.12.28 |
인공신경망 (0) | 2022.12.23 |
이미지다루기_넘파이에 대하여 (0) | 2022.12.06 |
다양한 데이터 처리방법 (0) | 2022.12.03 |