1. "빅"데이터 처리의 기본패턴 - 빅데이터를 처리한다. 말 그대로 데이터 용량이 크고 처리 시간도 많이 소요될 것이 머리속에 그려진다. - 그럼 좋은 성능의 컴퓨터를 써야하겠고, 혹은 여러 컴퓨터를 연결하여 작업을 분할해 볼 수 있다. - 이런 컴퓨터 자원을 엮어서 병렬 컴퓨터(Parallel Computing), 분산 컴퓨터(Distributed Computing)을 통해 단일 컴퓨터로는 처리하기 힘든, 혹은 아예 메모리에 담아둘 수조차 없을 많큼 큰 데이터를 다뤄볼 수 있다. - 비슷한 개념으로 클러스터 컴퓨팅(Cluster Computing)이라는 것도 있다. - 빅데이터를 다루는 솔루션이라는 하둡, 스파크 등의 생소한 이름의 빅데이터 처리 매커니즘이란 것이 있다. - 오늘 배울 개념은 맵리듀스..