코딩 기록들

04. Image augmentation 본문

이미지다루기및 데이터셋 구축

04. Image augmentation

코딩펭귄 2022. 12. 16. 21:05

Data augmentation 이란?

- 갖고있는 데이터셋을 여러방법으로 augment하여 실질적인 학습데이터셋의 규모를 키울수있는 방법(수집할수있는 데이터량이 한계적임)

- computer vision 작업은 더많은 데이터 사용할수있음(-> data augment는 coputer vision의 성능 향상시키는 기술의 일종)

 

Data augmentation 목적

- 한정적 데이터 증강시켜 퍼포먼스 높이고, 과적합문제 해결 (epoch가 증가할수록 training error와 testing error 줄어든다)

하지만, training 데이터가 충분하지못하거나, imbalance불균형 하다면, -> overfitting 문제 발생할수있다(데이터가 많은쪽에 치우친다)

 

한번에 여러가지 이미지를 학습시키고싶을때 : object detection 에서 많이 사용

 

 

Test Time Augmentation

  •  
  •  
  • training 단계에서 많이 사용되며, test 단계에서도 사용이 가능함 (=TTA)
  • 한 쌍의 test image를 여러장으로 증강시켜 inference를 시킨뒤 output을 ensemble하는 방식
  • Kaggle과 같은 대회, 챌린지에서 많이 사용되는, 합법적인 기

 

 

 

 

 

 

참고하기 좋은 사이트

albumentations-team/albumentations: Fast image augmentation library and an easy-to-use wrapper around other libraries. Documentation: https://albumentations.ai/docs/ Paper about the library: https://www.mdpi.com/2078-2489/11/2/125 (github.com)

Data augmentation 종류

 

'이미지다루기및 데이터셋 구축' 카테고리의 다른 글

[Dataset 구현] 1. customdataset  (1) 2023.01.05
CNN  (0) 2022.12.28
인공신경망  (0) 2022.12.23
이미지다루기_넘파이에 대하여  (0) 2022.12.06
다양한 데이터 처리방법  (0) 2022.12.03