v3.x버전부터는 replica개념이 없어진건가요?
218
작성한 질문수 105
라고 말씀하셨는데 대량데이타를 나눠서 여러블록에 저장하고 또 중복으로 copy해서 가지고 있는게 2.x이라면
답변 1
0
odark 님에게
이는 복제 관리 메커니즘이라고 말을 합니다. 하둡 아키텍쳐 핵심요소 두번째인 복 제 관리 메커니즘 Replication management과 Rack Awareness 강의에 자세히 나와 있습니다.
렉과 블럭 개념을 설명하면서 렉은 하둡 클러스트 내에 여러 스토리지로 나누어 있으며 이들은 네임노드들이나 데이터노드들이 될 수 있죠. 그렇기에 그 렉들은 하나 하나 노드들을 가지고 있죠. 데이터 노느들은 파일 블럭 내용과 레프리카(Replica)들을 저장하고 있습니다. Replica 개념이 없는 것이 아니죠. 아래 그림처럼요.
이해가 되셨으면 합니다. 여러 그리드 내에 블럭에 분산처리된다는 의미는 맞구요. 네임노드로부터 메타데이터를 읽고 나서야 비로서 데이터 노드로 찾아서 관련 데이터를 찾거나 읽게 됩니다. 데이터노드를 찾을 때는 당연히 IP주소를 찾아서 읽거나 쓰게 됩니다.
답변이 되었으면 합니다.
토론토에서 빌리 올림
start-dfs.sh가 작동하지 않습니다.
0
460
1
우분투 버전 문의
0
364
1
Namenode 폴더 format 도중 발생한 오류입니다.
0
575
1
우분투 설치 도중 오류 문의드립니다.
1
984
1
put, copyFromLocal과 get, copyToLocal
0
403
1
특정 부분에서의 미동작
0
424
3
Ubuntu 환경에서 jdk 압축 해제시 오류 발생 관련하여 질문드립니다!
0
560
2
12강 _- 하둡 분산 파일 시스템에서 파이썬 맵퍼와 리듀서 소스 구현 실전편 ( Build Mappe..) ==> 4분37초 부분
0
245
1
하둡 설치 및 셋팅 중 에러.....
1
269
1
질문이 있습니다!!
0
472
4
hadoop 명령 put 실패
0
886
1
안 됩니다
0
510
3
포맷 오류
0
251
1
월별로 뽑고 싶다면?
1
215
1
Rack이 정확히 의미하는 것이 무엇인가요?
1
6138
1
배경음악이 너무 커요
0
312
2
포맷이 안됩니다.
0
238
1
강의에서 사용하신 하둡 설치 wget 주소에서 404 not found가 떠서
0
743
3
선생님 혹시 WSL2로도 학습이 가능할까요?
1
268
1
log4j...에러문제입니다 ! ㅠㅠ
2
292
2
기준설정
0
233
1
이클립스 에러
0
181
1
자바에서 밑부분이 안나와요!
1
249
1
명령어 질문
0
166
1





