Exploration 20

Exploration 20 : 난 스케치를 할 테니 너는 채색을 하거라

1. 조건 없는 생성모델(Unconditional Generative Model), GAN - GAN을 이용하여 MNIST, CIFAR-10 등의 데이터셋을 학습하고 생성해 본 경험이 있는가? - 성공적으로 학습되었다면, 학습에 사용한 실제 손글씨 이미지와 매우 유사한 손글씨 이미지를 생성했을 것이다. - 그런데 한 가지 생각을 해보자. 1) 우리가 7이란 이미지를 만들고자 MNIST 데이터셋을 이용해 GAN을 열심히 학습을 시켰다. 2) 학습이 완료된 모델을 이용해 7 이라 쓰여있는 이미지를 얻기 위해 어떤 방법을 이용해야 할까? 3) 여기서 할 수 있는 방법은 다양한 노이즈를 입력으로 넣어보면서 7이 나올 때 까지 시도해보는 것이다. 4) 이렇듯 잘 학습된 GAN을 이용해 실제 이미지를 생성할 때 조..

공부/AIFFEL 2021.03.23

Exploration 19 : 인간보다 퀴즈를 잘 푸는 인공지능

1. 들어가며 - 2018년 10월 SQuAD(Stanford Question Answering Dataset) 리더보드에 Human performance를 능가하는 점수로 1위 자리를 갱신한 모델이 나타나서 엄청난 주목을 끌었다. - 이른바, 사람보다 퀴즈를 잘 푸는 인공지능이 나타났다는 소식은 딥러닝 자연어처리 분야에 충격적인 뉴스가 아닐 수 없었다. - 구글에서 발표한 논문에 소개된 이 모델의 이름은 BERT(Bidirectional Encoder Representations from Transformers)였다. - 이 모델은 340MB나 되는 엄청난 사이즈의 파라미터를 가진 모델을 수십 GB나 되는 코퍼스를 학습 시켜 만든 pretrained model이다. - 이 모델은 SQuAD뿐 아니라 당..

공부/AIFFEL 2021.03.18

Exploration 18 : 문자를 읽을 수 있는 딥러닝

1. 기계가 읽을 수 있나요? - 사람이 문자를 읽으려면 어떤 과정을 거칠까? 1) 문자가 있다는 것을 인식하고, 2) 해독하는 과정을 거치는 것이 일반적이다. - 기계가 문자를 읽는 과정도 다르지 않다. 1) Detection 하고, 2) 어떤 문자인지 판독하는 Recognition - 오늘 사용해볼 것 중 첫번째는 구글 OCR API이다. 이 API를 이용하여 어플리케이션을 만들 수 있다. 1) 구글의 파이썬 API 인터페이스 모듈을 설치한다. 2) Google Cloud Vision API 사용 (1) 서비스 계정 및 인증키를 생성한다. (자세한 내용은 구글링을 통해 쉽게 알 수 있다.) (2) 다운로드한 인증키는 원하는 경로에 my_google_api_key라고 파일명을 저장한다. (코드나 환경변..

공부/AIFFEL 2021.03.16

Exploration 17 : 다음에 볼 영화 예측하기

1. 들어가며 - Session-Based Recommendation 1) 오늘은 전자상거래 플랫폼에서 많이 사용하고 있는 Session-Based Recommendation에 대해 알아보겠다. 2) 고객에게 그 고객과 유사한 다른 고객이 좋아하는 상품을 추천해 주는 전략이 언제나 유효할까? 이런 추천 전략에의 기존 전제에는 한가지 맹점이 있다. 바로 고객의 선호가 고정된 것이라고 보는 것이다. 3) 하지만 알다시피 고객의 마음은 항상 변할 수 있다. 그래서 전자상거래 플랫폼에서는 "지금 고객이 좋아할 만한 상품"을 추천해 주는게 좋다. 그럼 어떻게 이런걸 할 수 있을까? 4) Session-Based Recommendation은 말 그대로 세션 데이터를 기반으로 유저가 다음에 클릭 또는 구매할 아이템을..

공부/AIFFEL 2021.03.15

Exploration 16 : 흐린 사진을 선명하게

1. Super Resolution 이란? - 픽셀이란 무엇인가 1) 디스플레이를 구성하고 있는 가장 작은 단위 - 빛의 3원색을 혼합하여 색을 나타내는 방식은 무엇인가 1) RGB - 픽셀과 해상도의 관계는 무엇인가 1) 해상도는 가로와 세로의 픽셀 수로 표기하며, 픽셀의 갯수가 많을수록 고해상도가 되어 선명해진다. - UHD, QHD, FHD, HD 순으로 해상도가 높다. - 사실 해상도에 대해 정확히 설명할 때는 픽셀 수 뿐만 아니라, 픽셀의 크기 등을 고려해야 하지만, 오늘 학습한 내용에서는 이 부분까지 다루지는 않았다. - Super Resolution이란 저해상도 영상을 고해상도 영상으로 변환하는 작업 또는 그러한 작업을 말한다. - Super Resolution은 수 많은 컴퓨터 비전 연구 ..

공부/AIFFEL 2021.03.09

Exploration 15 : 트랜스포머로 만드는 대화형 챗봇

1. 트랜스포머와 인코더 디코더 - 번역기를 만드는 데 사용한 대표적인 모델인 인코더와 디코더 구조를 되짚어 보겠다. - 번역기는 인코더와 디코더 두 가지 아키텍처로 구성되어 있다. 1) 인코더 : 입력문장이 들어가는 곳 2) 디코더 : 인코더에 들어간 문장에 상응하는 출력 문장을 생성하는 곳 - 번역기를 훈련한다는 것은 결국 입력 문장과 출력 문장 두 가지 병렬 구조로 구성된 데이터셋을 훈련한다는 의미이다. - 이런 병렬적으로 구성된 데이터셋을 인코더와 디코더로 학습하는 경우는 번역기에만 한정되어 있지 않다. 질문에 대한 대답을 하도록 구성된 데이터셋을 인코더와 디코더로 학습한다면, 챗봇을 만들 수 있을 것이다. - 트랜스포머의 인코더와 디코더 1) 트랜스포머라는 것도 변역기와 마찬가지로 인코더와 디코..

공부/AIFFEL 2021.03.05

Exploration 14 : 폐렴아 기다려라!

1. 의료영상에 대해 - 의료 영상 종류 1) X-RAY (1) X-RAY는 전자를 물체에 충돌시킬 때 발생하는 투과력이 강한 복사선(전자기파)을 말한다. (2) X-RAY는 방사선의 일종으로 지방, 근육 같이 밀도가 낮은 것은 통과하지만, 밀도가 높은 뼈, 금속 같은 물질은 잘 통과하지 못한다. 2) CT (1) CT는 Computed Tomography의 줄임말로, 환자를 중심으로 X-RAY를 빠르게 회전하여 3D 이미지를 만들어내는 영상이다. (2) 환자의 3차원 이미지를 형성하여 기본 구조뿐만 아니라 종양 또는 이상을 쉽게 식별하고 위치를 파악할 수 있다. (3) 신체의 단면 이미지를 "Slice"라고 한다. 이러한 Slice는 단층 촬영 이미지라고도 하며 기존의 X-RAY보다 더 자세한 정보를 ..

공부/AIFFEL 2021.03.02

Exploration 13 : 어제 오른 내 주식, 과연 내일은?

1. 미래를 예측한다는 것은 가능할까? - 생각해 볼 수 있는 미래 예측 시나리오 1) 지금까지의 주가변곡선을 바탕으로 다음 주가변동 예측 2) 특정 지역의 기후데이터를 바탕으로 내일의 온도변화 예측 3) 공장 센터데이터 변화이력을 토대로 이상 발생 예측 - 위 예시의 공통점은 예측의 근거가 되는 시계열(Time-Series) 데이터가 있다는 것이다. - 시계열이란 시간 순서대로 발생한 데이터의 수열이라는 뜻이다. - 일정 시간 간격으로 발생한 데이터일 때가 많지만 꼭 그래야만 하는 것은 아니다. 매일의 주식 거래 가격을 날짜-가격 형태로 날짜순으로 모아둔 데이터가 있다면 시계열 데이터가 될 것이다. 이 때 날짜가 인덱스(index) 역할을 하게 된다. - 그럼 저런 주식 데이터로 미래를 예측 할 수 있..

공부/AIFFEL 2021.03.01

Exploration 12 : 프로젝트 시각화(gif파일) - 번호는 과제파일의 번호와 일치함.

12번 과제 내용에 모델이 생성한 결과물을 gif로 만들어서 github에 올리는 것이 있는데 github에 gif 파일이 보이지 않아서 블로그에 올렸다. 8. 학습과정 시각화하기에 대한 시각화 사진 (모델은 기존모델이고 lr이 1e-4) 9_1. 새로운 모델 구조, lr = 1e-4에 대한 시각화 사진 9_2. 기존 모델 구조, lr = 1e-5에 대한 시각화 사진 9_3. 새로운 모델 구조, lr = 1e-5에 대한 시각화 사진

공부/AIFFEL 2021.02.25

Exploration 12 : 인공지능으로 세상에 없던 새로운 패션 만들기

1. 없던 데이터를 만들어낸다, 생성 모델링 - 지금까지 만들었던 모델은 판별 모델링(Discriminative Modeling)이라 부른다. - 오늘 배울 것은 생성 모델링인데, 이는 말 그대로 없던 데이터를 생성해내는 것이 목표이다. - 즉, 판별 모델과 생성 모델을 말하자면 아래와 같다. 1) 판별 모델 : 입력된 데이터셋을 특정 기준에 따라 분류하거나, 특정 값을 맞추는 모델 2) 생성 모델 : 학습한 데이터셋과 비슷하면서도 기존에는 없던 새로운 데이터셋을 생성하는 모델 2. Pix2Pix - Pix2Pix는 간단한 이미지를 입력할 경우 실제 사진처럼 보이도록 바꿔줄 때 많이 사용되는 모델이다. - 한 이미지를 다른 이미지로 픽셀 단위로 변환한다는 뜻의 Pixel to Pixel을 딴 Pix2Pi..

공부/AIFFEL 2021.02.23