distcp명령어에 대해
420
작성한 질문수 105
hadoop distcp /user/etc/xml/distcptest/odark.xml /user/etc/xml/distcptest/target
추후에 클러스터내에 네임노드들간에 데이터 전송과 복제가 가능하며 이 distcp 명령어는
일반적인 파일 파일복제나 복사보다는 맵리듀스상에서 다량의 데이타 파일들을 더욱 빠르게 복제하는 효과라고 말씀하셨는데
영상에서는 파일시스템 즉 클러스터내의 데이타 노드에 있는 특정 파일을 다른 target디렉토리로 맵리듀스를 이용하여 copy하는경우만 보여주셨는데....
어떻게 네임노드들간에 복제에 이용하는거죠? hdfs-site.xml 에 설정된
namenode 디렉토리에 있는 데이타파일 복제를 얘기하시나요? 여기 namenode안에는 아무것도 없는데.....
그리고 네임노드들 간이라는게 active <-> standby 간에 얘기하시나요? 아니면 master <-> secondary 네임도드간을 얘기하는건가요? 어떤경우에 이런 distcp복제를 이용하나요?
답변 1
0
odark 님
안녕하세요. distcp 분산 복사 명령어(distributed copy command)로서 한 클러스트에서 다른 클러스트로 복제하는 명령어입니다. 분기별 혹은 주기별로 데이터를 백업하는 기능입니다. 다른 클러스트 사이로 데이터를 마이그레이션 할 때 쓰는 것이죠. 쉽게 말씀드리면 한 클러스트에서 다른 클러스트로 복사를 하는 작업입니다. 대기업에서는 꼭 필요한 마이그레이션 작업이죠.
명령어 예제) hadoop distcp 클러스트 서버 주소 1 클러스트 서버 주소 2
이렇게 사용하는 겁니다. 클러스트 1 과 클러스트 2 사이로 복사를 하게 되는 셈이죠. 파일이라고 한다면 데이터노드들을 복제하는 것입니다. 이해가 되었으면 합니다. 네임노드들이 클러스트 1과 2에 각각 하나 이상 씩 존재하고 있으니 당연히 네임노드들 간의 복제인 셈이죠. 네임노드가 데이터노드들의 정보를 가지고 있고, 이들이 복제되는 것이고요.. 질문에 답이 되었는지 모르겠네요.. 다른 질문으로 또 뵙죠...
토론토에서 빌리 올림.
start-dfs.sh가 작동하지 않습니다.
0
459
1
우분투 버전 문의
0
364
1
Namenode 폴더 format 도중 발생한 오류입니다.
0
575
1
우분투 설치 도중 오류 문의드립니다.
1
984
1
put, copyFromLocal과 get, copyToLocal
0
403
1
특정 부분에서의 미동작
0
424
3
Ubuntu 환경에서 jdk 압축 해제시 오류 발생 관련하여 질문드립니다!
0
560
2
12강 _- 하둡 분산 파일 시스템에서 파이썬 맵퍼와 리듀서 소스 구현 실전편 ( Build Mappe..) ==> 4분37초 부분
0
245
1
하둡 설치 및 셋팅 중 에러.....
1
269
1
질문이 있습니다!!
0
472
4
hadoop 명령 put 실패
0
886
1
안 됩니다
0
510
3
포맷 오류
0
251
1
월별로 뽑고 싶다면?
1
215
1
Rack이 정확히 의미하는 것이 무엇인가요?
1
6138
1
배경음악이 너무 커요
0
312
2
포맷이 안됩니다.
0
238
1
강의에서 사용하신 하둡 설치 wget 주소에서 404 not found가 떠서
0
743
3
선생님 혹시 WSL2로도 학습이 가능할까요?
1
268
1
log4j...에러문제입니다 ! ㅠㅠ
2
292
2
기준설정
0
233
1
이클립스 에러
0
181
1
자바에서 밑부분이 안나와요!
1
249
1
명령어 질문
0
166
1





