1. 들어가며 - 딥러닝 모델을 학습 시키기 위해서는 대량의 데이터를 확보해야 한다. - 대표적인 이미지 데이터셋인 이미지넷(ImageNet)은 약 1,400만장의 이미지를 갖고 있다. - 분류 대상 클래스가 10개라 상대적으로 간단해 보이는 CIFAR-10도 몇 만장의 데이터를 가지고 있다. - 미리 공개되어 있는 데이터셋 외에도 우리가 원하는 문제를 풀 때는 이에 맞는 데이터가 필요하다. - 하지만 이런 데이터를 몇 만장씩 구축하는데는 많은 비용과 시간이 필요하다. - 이 때, 제한된 데이터셋을 최대한 활용하기 위해서 augmentation이라는 방법을 사용할 수 있다. - 그럼 augmentation은 어떻게 사용하고, 어떤 효과를 줄 수 있을까? 2. 데이터셋의 현실 - 대량의 데이터셋 1) 이미..