본문 바로가기
빅데이터 부트캠프/Hadoop

빅데이터 부트캠프 39일차 (Hadoop)

by Mecodata 2022. 8. 29.

MapReduce

- map = 소스를 쪼개어 key:value 맵을 여러갱 생성
- reduce = 여러 map 값들을 하나의 결과값으로 만듦

※ 컴파일의 편리성을 위해 maven 설치 (리눅스는 sudo install apt maven, Horton은 yam install maven)

 

Hadoop WordCount 예제

- 단어의 개수를 파악할 때 사용

 

Hadoop TopN 예제

- 해당 텍스트에서 빈도수가 높은 단어들의 목록을 파악할 때 사용

 

 

 

 

댓글