Augmentation 2

Going Deeper(CV)_DJ 4 : 이미지 어디까지 우려볼까?

1. 데이터 불러오기 - 이번 노드에서는 augmentation을 텐서플로우 모델 학습에 어떻게 적용할 수 있는지 공부한다. - 지금까지 모델을 훈련시키기 전, 데이터를 전처리해 입력값으로 사용해 왔다. - Augmentation도 이처럼 입력 이미지의 데이터를 변경해주는 과정이므로 일반적인 이미지 데이터 전처리 방법과 활용방법이 동일하다. - 코드를 통해 필요한 라이브러리를 불러오고, GPU 상태를 확인했다. - 그리고 사용할 데이터셋을 불러온다. 이번에는 stanford_dogs 데이터셋을 사용했다. - stanford_dogs 데이터셋에는 120개 견종의 이미지가 포함되어 있다. 총 20,580장의 이미지에서 12,000장은 학습셋, 나머지 8,580장은 평가용 데이터셋이다. - 데이터를 처음 사용..

공부/AIFFEL 2021.04.13

Going Deeper(CV)_DJ 3 : 잘 만든 Augmentation, 이미지 100장 안 부럽다

1. 들어가며 - 딥러닝 모델을 학습 시키기 위해서는 대량의 데이터를 확보해야 한다. - 대표적인 이미지 데이터셋인 이미지넷(ImageNet)은 약 1,400만장의 이미지를 갖고 있다. - 분류 대상 클래스가 10개라 상대적으로 간단해 보이는 CIFAR-10도 몇 만장의 데이터를 가지고 있다. - 미리 공개되어 있는 데이터셋 외에도 우리가 원하는 문제를 풀 때는 이에 맞는 데이터가 필요하다. - 하지만 이런 데이터를 몇 만장씩 구축하는데는 많은 비용과 시간이 필요하다. - 이 때, 제한된 데이터셋을 최대한 활용하기 위해서 augmentation이라는 방법을 사용할 수 있다. - 그럼 augmentation은 어떻게 사용하고, 어떤 효과를 줄 수 있을까? 2. 데이터셋의 현실 - 대량의 데이터셋 1) 이미..

공부/AIFFEL 2021.04.09