작성
·
179
1
답변 1
2
odark님에게
렉의 개념은 랙과 노드간의 개념에서 출발합니다. 랙은 하둡 클러스트 내에 존재합니다. 다시 말씀드리면 하둡 클러스트는 노드 곧 머신들의 수로 묶습니다. 그들을 바로 렉이라고 하죠.
그 렉은 파일 블럭들과 블럭들의 고유 레프리카들을 저장한 멀티 노드들을 가지고 있다고 한다면 이제 이해를 하실 겁니다.
클러스트가 한 대 있다고 가정한다면 팀원들이 클러스트 라고 말을 하면 이미 그 클러스트 내에는 렉 들이 여러 대가 있고, 각각의 렉들은 네임노드 한 대 이상의 수와 데이터 노드들의 여러 대가 묶여 있다고 보세요.
그래서 하둡의 클러스트는 하나 이상의 클러스트들로 구성되어 있다고 볼 수 있으며 그 클러스트 내에는 여러 개의 렉들로 담겨 있다고 보셔야 올바른 구성을 보시고 있는 것이죠. 이제 그 락들은 하나 이상의 네임 노드들로 구성되어 있으며 데이터 노드들도 함께 담겨 있습니다.
클러스트의 락들은 서로 네트워크 트레픽을 제거할 수 있는 읽기쓰기 정보를 수행하면서 내부 정보 지원을 돕습니다. 그 기능을 수행하고자 가까운 데이터 노드들을 찾습니다. 네임노드가 가지고 있는 정보를 통해 가장 가까운 데이터 노드들을 선택하도록 돕죠. 고유 아이디인 파일 블럭들과 레프리카들을 찾다보면 가장 가까운 렉들을 찾아가게될 것입니다. 수 백 아니 수 만대의 렉들을 찾아 해당 네임노드를 찾으려면 우선 네임노드를 뒤져서 필요한 데이터셋을 찾으려고 하겠죠?
질문에 답이 되셨으면 합니다.
토론토에서 빌리 올림