• 카테고리

    질문 & 답변
  • 세부 분야

    데브옵스 · 인프라

  • 해결 여부

    미해결

파티션 배치 그룹에 대한 질문

23.08.12 12:42 작성 조회수 246

0

강사님 안녕하세요.

1) 파티션 배치 그룹에서 파티션 끼리는 서로 다른 하드웨어를 사용한다는 말은

동일한 파티션 내의 여러 대의 인스턴스를 배치했을 경우에 이 인스턴스는 서로 다른 하드웨어를 사용한다는 말인지 궁금합니다.

2) 하나의 파티션 내에 EC2 인스턴스들이 각각 다른 서버랙에 위치한 EC 인스턴스들을 파티셔닝 하는 이유가 궁금합니다.

3) 빅데이터 분산 처리 시스템에서 파티션 배치 그룹을 사용한다라고 설명 돼 있는데. 어떤 느낌인지 조금 더 자세한 설명 부탁드립니다.

답변 1

답변을 작성해보세요.

0

안녕하세요.

각 번호에 대해 아래와 같이 답변 드립니다.

 

1) 하나의 파티션 내에서 서로 다른 하드웨어를 사용하는 것이 아닌 하나의 파티션에 있는 인스턴스 그룹과 다른 파티션에 있는 인스턴스 그룹이 하드웨어를 공유하지 않는 다는 의미 입니다. 다른 말로 서로 다른 파티션끼리는 동일한 서버랙을 공유하지 않으므로 EC2 인스턴스 생성 시 서로 다른 물리적 서버를 사용하게 됩니다.

 

2) 제가 3가지 배치그룹의 그림을 똑같이 그리다 보니 혼동을 드린 것 같습니다. 이 부분은 강의 수정을 하도록 하겠습니다.

아래와 같이 파티션 배치 그룹끼리는 서버랙을 공유하지 않으며 하나의 파티션 배치그룹 내의 인스턴스 그룹에서는 같은 하드웨어를 사용하거나 동일한 서버랙을 사용할 수 있습니다.

파티션 배치그룹을 사용하는 목적은 각 파티션 마다 서버,네트워크,전원으로 구성된 서로 다른 서버랙을 사용하게 됩니다. 이렇게 하면 서로다른 파티션 내에 있는 인스턴스는 하드웨어를 공유하지 않기에 하나의 하드웨어가 장애가 발생한다고 해도 다른 파티션에 있는 인스턴스에는 영향을 주지 않게 됩니다. 이렇게 파티션 간의 장애 영향을 분리하기 위해 파티션 배치그룹을 사용합니다.

image

image

3) 파티션 배치 그룹은 HDFS, HBase, Cassandra 같은 대규모 분산 및 복제 워크로드를 별개의 랙으로 분산해 배포하는 데 사용할 수 있습니다.

예를 들어 파티션 배치그룹을 5개를 만들고 인스턴스를 10개를 생성하면 EC2인스턴스가 균일하게 2개씩 5개의 파티션 배치그룹에 저장 됩니다.

예를 들어 빅데이터 분산처리 HDFS 클러스터를 5개의 파티션 그룹에 5대의 인스턴스로 생성을 했다고 가정하면 만일 특정 파티션에 장애가 발생해도 데이터가 다른 파티션에 분산이 되어 있기에 데이터가 손실이 되거나 애플리케이션이 중단될 확률이 낮아지게 됩니다. 이렇게 HDFS 애플리케이션 데이터의 가용성 및 내구성을 높일 수 있습니다.