빅데이터 부트캠프/Hadoop
빅데이터 부트캠프 39일차 (Hadoop)
Mecodata
2022. 8. 29. 09:13
MapReduce
- map = 소스를 쪼개어 key:value 맵을 여러갱 생성
- reduce = 여러 map 값들을 하나의 결과값으로 만듦
※ 컴파일의 편리성을 위해 maven 설치 (리눅스는 sudo install apt maven, Horton은 yam install maven)
Hadoop WordCount 예제
- 단어의 개수를 파악할 때 사용
Hadoop TopN 예제
- 해당 텍스트에서 빈도수가 높은 단어들의 목록을 파악할 때 사용