갑자기 왜 hadoop-streaming.jar
198
작성한 질문수 105
답변 1
0
odark 님에게
다양한 질문 감사합니다.
스트리밍이란 것에 대한 이해부터 시작하죠. 흐름이라는 단어를 떠올릴 수 있으며 빅데이터는 배치 프로세스 혹은 배치 메커니즘이라는 말과 연관이 있습니다. 흐름을 말할 때는 일괄 처리 기술이 중요합니다.
다시 말씀드리면 과거에 대량의 데이터를 스트리밍하지 않았다는 것은 거짓말입니다. 대기업의 데이터는 10년 전이나 20년 전에도 빅데이터 그 자체였다는 말로 보아도 무방합니다. 구글, 야후, 페이스북 덕분에 용량이 페타바이트로 진화 혹은 진전했을 뿐입니다.
자바의 람다 형식처럼 데이터셋이 젯타 바이트(Zetta byte) 형식으로 처리하려면 스트리밍 기술로 처리 방식을 효과적으로 처리하게 됩니다. 그 사이 하둡은 다양한 고객들을 두루 받아들이고자 파이선, 루비, 셀스크립트 형식의 스크립트 언어를 구사하고 구현하여 동일한 결과값들 구현하는 목적이 있는 것이죠.
하둡 스트리밍이 바로 그런 역할을 합니다. 그래서 파이선 맵 구현과 리듀스 구현을 하기 위해 파이선 파일을 사용하여 하둡 스트리밍은 바로 맵리듀스 어플리케이션을 구현하여 맵리듀스를 성공적으로 이끌게 됩니다.
질문에 답이 되었는지요? 그렇다면 수강평 부탁드립니다.
토론토에서 빌리 올림
start-dfs.sh가 작동하지 않습니다.
0
460
1
우분투 버전 문의
0
364
1
Namenode 폴더 format 도중 발생한 오류입니다.
0
575
1
우분투 설치 도중 오류 문의드립니다.
1
984
1
put, copyFromLocal과 get, copyToLocal
0
403
1
특정 부분에서의 미동작
0
424
3
Ubuntu 환경에서 jdk 압축 해제시 오류 발생 관련하여 질문드립니다!
0
560
2
12강 _- 하둡 분산 파일 시스템에서 파이썬 맵퍼와 리듀서 소스 구현 실전편 ( Build Mappe..) ==> 4분37초 부분
0
245
1
하둡 설치 및 셋팅 중 에러.....
1
269
1
질문이 있습니다!!
0
473
4
hadoop 명령 put 실패
0
887
1
안 됩니다
0
510
3
포맷 오류
0
251
1
월별로 뽑고 싶다면?
1
216
1
Rack이 정확히 의미하는 것이 무엇인가요?
1
6140
1
배경음악이 너무 커요
0
312
2
포맷이 안됩니다.
0
238
1
강의에서 사용하신 하둡 설치 wget 주소에서 404 not found가 떠서
0
743
3
선생님 혹시 WSL2로도 학습이 가능할까요?
1
268
1
log4j...에러문제입니다 ! ㅠㅠ
2
292
2
기준설정
0
233
1
이클립스 에러
0
181
1
자바에서 밑부분이 안나와요!
1
249
1
명령어 질문
0
166
1





