inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

ElasticSearch Essential

여섯 번째 강의 - 색인 과정 이해하기

6강 10분 색인 과정에 대해 질문 있습니다.

해결된 질문

341

김민석

작성한 질문수 1

0

10분 00초에 2개의 가정->선택이 존재하는 것으로 파악했어요.

  1. 인덱스 별 (각)샤드의 최대 크기를 10GB로 설정 -> 인덱스 별 프라이머리 샤드의 개수는 10개(이 말이 결국 데이터 노드 개수 10개와 이어지겠죠)

  2. 데이터 노드 개수를 10개로 설정 -> 데이터 노드당 가져야할 디스크의 크기 600GB

여기서 2번은 명확히 이해가 됩니다. 필요한 저장 공간이 6,000GB이므로 이를 데이터 노드 개수(10)만큼 나눈 600GB가 데이터 노드 당 가져야할 디스크 크기겠죠.

다만 1번이 이해 안갑니다. 하나의 인덱스 내 개별 샤드의 최대 크기가 10GB로 설정하는 것과 인덱스 별 프라이머리 샤드의 개수가 10개인 것이 무슨 연관관계가 있는 것이죠?(논리 전개가 잘 이해가 안됩니당)

긴 질문 읽어주셔서 감사합니다.

elasticsearch

답변 2

2

김민석

이해했습니다 ㅎㅎ 인덱스를 하루 단위로 생성한다고 생각을 못했네요! 감사합니다!

0

강진우

하루에 100GB의 로그가 쌓이기 때문에 인덱스 별 샤드의 최대 크기를 10GB로 가정했을 때 10개의 프라이머리 샤드가 필요하게 됩니다. 10GB * 10개 = 100GB 이기 때문 입니다.

그리고 그 데이터를 30일간 저장하게 됩니다. 즉, 인덱스가 최대 30대까지 만들어 진다고 생각하시면 됩니다. 그래서 데일리로 쌓이는 로그를 노드 별로 나누는 관점과 30일간의 모든 인덱스가 노드 상에 저장되어야 하는 관점, 두 가지 관점으로 이해 하셔야 합니다.

인덱스 하나가 6,000GB가 아니라, 하루에 100GB 씩 로그가 쌓이는 인덱스가 30개가 생긴다고 이해하셔야 합니다. 만약 지금이 1월 30일이라고 한다면 nginx-access-log-2024.01.01 ~ nginx-access-log-2024.01.30 이렇게 30개의 인덱스가 저장된다고 이해 하시면 됩니다.

혹시 답변이 되었을까요? 추가 질문 있으시면 언제든 말씀하세요.

Red 인 상황에서 유실

0

60

2

하루 100GB 로그를 30기간 저장하는 클러스터 예시중 질문이 있습니다.

0

106

2

노드당 샤드수 제한 질문입니다.

0

82

2

노드에서의 가용영역 이슈

0

102

3

노드당 샤드 수 질문입니다.

0

147

3

색인과정 이해하기 중 질문입니다.

0

225

2

xlsx 파일 색인 중 CircuitBreakingException 발생

0

202

1

ES 트러블슈팅 사례분석 강의 내용중 궁금한 게 있습니다.

0

246

1

동잭매핑 매핑 시 색인 질문

0

198

1

Elastic Search 동작 이해하기 색인 설명 관련

0

413

2

Compressed OOP 조건에 따른 ES Heap Size 제약

0

703

1

4강 14분51초 질문 있습니다!

0

398

2

안녕하세요 elastic cloud를 사용하는데 cpu가 계속 칩니다 .

0

380

1

검색이 안되는 문제 문의

0

337

1

7번째 강의에서 Token과 Term은 다른 건가요??

0

464

1

서버 업데이트후 키바나 동작안함

1

333

1

인덱스 설계에서 type 문의드립니다.

0

356

1

/_cat/indices?v 로 인덱스 조회시 보이는 나머지 항목들

0

405

1

색인 분석이란?

0

252

1

동적 스키마가 NoSQL을 의미하나요???

0

521

1

노리분석기 노드 적용 질문

1

270

1

노드 heap size에 관해서

0

679

2

로드밸런스 endpoint

1

308

1

마스터 후보노드와 구동관리에 대해 문의드립니다.

0

336

1