MapReduce
- map = 소스를 쪼개어 key:value 맵을 여러갱 생성
- reduce = 여러 map 값들을 하나의 결과값으로 만듦
※ 컴파일의 편리성을 위해 maven 설치 (리눅스는 sudo install apt maven, Horton은 yam install maven)
Hadoop WordCount 예제
- 단어의 개수를 파악할 때 사용
Hadoop TopN 예제
- 해당 텍스트에서 빈도수가 높은 단어들의 목록을 파악할 때 사용
'빅데이터 부트캠프 > Hadoop' 카테고리의 다른 글
빅데이터 부트캠프 43일차 (0) | 2022.09.02 |
---|---|
빅데이터 부트캠프 41일차 (0) | 2022.08.31 |
빅데이터 부트캠프 40일차 (0) | 2022.08.30 |
빅데이터 부트캠프 38일차 (Hadoop) (0) | 2022.08.26 |
빅데이터 부트캠프 33일차 (0) | 2022.08.19 |
댓글