강의 대시보드 맵리듀스 기본 튜토리얼 (1) - Map/Reduce WordCount Application
맵리듀스 기본 튜토리얼 (1) - Map/Reduce WordCount Application
강의명 : Hadoop 3.2.1 and Big data
수강 기한 : 무제한
진도율 : 0강/50강 (0%) | 시간 : 0분/356분
나가기
미수강
이전수업
다음수업

WordCount MapReduce Application 

  1. 입력 데이터 (Input Data) 설정.
  2. 스플릿 단계(Splitting) - 입력 데이터를 블럭 단위로 분리.
  3. 맵 단계(Mapping) - 전체 블럭 데이터를 하나 하나 문자별로 스트리밍(key, value).
  4. 셔플 단계(Shuffing) - 한 건 한건 문자별 키(단어: key)와 벨류(value : 1)로 중복 허용.
  5. 리듀스 단계(Reducing) - 중복된 단어 키와 그 합계 벨류를 총 합계 나열.
  6. 출력 데이터(Output) -  중복 단어 키 한개와 그 합계인 벨류들을 순차별로 파일에 저장.

WordCount MapReduce Application

    목차 커뮤니티