Why MapReduce?

MapReduce는 데이터를 Hadoop 서버 전체에 걸쳐 분산 프로세싱하는 기술. 오늘 날엔 Spark에 밀려서 많이 사용되지 않는 것으로 보이지만, 그 컨셉과 패러다임은 여전히 활발히 사용되고 있다.

MapReduce의 역사

Map and Reduce

Map

Shuffle and Sort

Reduce