rnn 3

FUNDAMENTAL 27. 딥러닝 레이어의 이해(2) Embedding, Recurrent

1. 분포가설과 분산표현 - 희소 표현(Sparse Representation) : 벡터의 특정 차원에 단어 혹은 의미를 직접 매핑하는 방식 - 분포 가설(distribution hypothesis) : 모든 단어를 고정차원의 벡터로 표현한다. 어떤 차원이 특정한 의미를 가진다고 가정하지 않는다. 단지 유사한 맥락에서 나타나는 단어는 그 의미도 비슷하다라는 가정을 한다. - 분산 표현(distributed Representation) : 유사한 맥락에 나타난 단어들끼리는 두 단어 벡터 사이의 거리를 가깝게 하고, 그렇지 않은 단어들끼리는 멀어지도록 조금씩 조정하여 얻어지는 단어 벡터 - 다음에 배울 Embedding 레이어는 단어의 분산 표현을 구현하기 위한 레이어이다. 간단하게 컴퓨터용 단어 사전인 것..

공부/AIFFEL 2021.03.08

Exploration 6 : 작사가 인공지능 만들기

1. 시퀀스? 스퀀스! - Sequence : 나열된 데이터, 각 요소들이 동일한 속성을 띌 필요는 없다. 어떤 기준에 따라 정렬되어 있지 않아도 된다. 2. I 다음 am을 쓰면 반 이상은 맞더라 - 인공지능이 글을 이해하는 방식은 수많은 글을 읽게 하는 것이다. 즉, 많은 데이터가 곧 좋은 결과를 만들어 낸다. - 이 방식을 가장 잘 처리하는 인공지능 중 하나로 순환신경망(RNN)이 있다. - 순환신경망 : 데이터를 입력 받은 신경망이 결과값을 다시 입력으로 사용하는 것. 3. 실습 (1) 데이터 다듬기 - 데이터에 필요없는 게 있는지? : 불필요한 특수기호, 공백 등을 가공하기 - 토큰화(Tokenize) - 소스 문장과 타켓 문장으로 분류하기 - 벡터화를 하여 텐서만들기 4. 실습 (2) 인공지능..

공부/AIFFEL 2021.01.26

FUNDAMENTAL 6. 딥러닝과 신경망의 본질

1. Deep Learning == Representation Learning? - 딥러닝과 머신러닝의 차이는 무엇인가? - 데이터의 '표현' 방법 : 분자, 이미지, 표, 카테고리 - 사람의 개입의 차이 정도 - 데이터의 내재된 표현과 좋은 표현을 추출한다는 의미는 무엇인가? 2. 딥러닝을 관통하는 철학 - 행동주의 : 자극 -> 행동 - 인지주의 : 자극 -> (정보처리) : 블랙박스 정보 처리 -> 행동 - 연결주의 : 지능체(백지) -> 다수의 사례를 통한 경험 -> 지능체(학습) 3. 신경망의 본질 - 블랙박스(숨겨진, 히든) 정보처리 과정 - 수학의 함수와 프로그래밍에서 말하는 함수는 본질적으로 다르지 않다. 4. 함수의 역할 - x와 y를 나타내 주는 도구 : y = 2x - x를 변환해주는..

공부/AIFFEL 2021.01.11