강의

멘토링

로드맵

Inflearn brand logo image

인프런 커뮤니티 질문&답변

junha.park님의 프로필 이미지
junha.park

작성한 질문수

실리콘밸리 엔지니어와 함께하는 Elasticsearch

Analysis에 대해 알아보자

index join 에 대한 질문

해결된 질문

작성

·

84

0

안녕하세요. 지금 강의 초반을 듣고 있는데요.

질문 1. 회사에서 ELK stack 을 application log 모니터링 도구로 도입하려는 것이 아니라 사용자의 어떤 요구사항에 맞는 리포트로서 visualization 을 이용하려고 도입하려 합니다.

rough 하게 학습한 내용으로는 elasticSearch 에서는 index 간 join 해서 search 를 못하는 것으로 알고 있는데요.

kibana 를 이용하면 multi index 간의 join 이 가능할까요?

구체적인 요청사항을 예로 말씀드리면

가령 dogs 라는 index 가 있고, men 이라는 index 가 있다고 가정할 때, 어떤 개가 (dog) 어떤 사람 (man) 의 반려견인지, (서로 같은 key value 를 가지고 있다면) 주인이 있는 개 인지 아닌지.. 주인이 없는 개는 전체의 몇 %인지 등을 visualization 하고 싶습니다.

답변 2

0

미쿡엔지니어님의 프로필 이미지
미쿡엔지니어
지식공유자

안녕하세요 junha.park님,

Elasticsearch에서는 밑에 AI가 얘기한 것처럼 기본적으로 index 간 join을 지원하지 않습니다.

Elasticsearch는 RDB처럼 join을 할 수 없기 때문에 데이터 중복을 감수하고 index를 설계하는 것이 일반적입니다. 이를 Document Denormalization이라고 합니다.
따라서 dogsmen 데이터를 하나의 document로 저장하는 방법이 가장 효율적입니다.

{
  "dog_name": "Buddy",
  "owner_name": "John",
  "owner_id": 123
}

이렇게 하면 하나의 index에서 바로 검색이 가능하므로 주인이 있는 개 vs 없는 개 비율을 쉽게 분석할 수 있습니다.

또한 밑에 말한 것처럼 Kibana에서 Vega(데이터 시각화 DSL) 또는 Lens를 사용하여 두 개의 index를 조합해서 분석할 수 있다고 하는데 제가 안해봐서 뭐라 말씀을 못 드리겠네요.

https://www.elastic.co/guide/en/kibana/current/vega.html 한번 보시면 도움이 될 것 같네요.

 

junha.park님의 프로필 이미지
junha.park
질문자

답변 감사합니다. 좀 더 study 를 한 다음에 확인해 봐야 할 것 같네요.

0

안녕하세요, 인프런 AI 인턴입니다. junha.park님.

Elasticsearch에서는 일반적인 관계형 데이터베이스처럼 직접적으로 인덱스 간 조인을 수행하는 기능을 제공하지 않습니다. 따라서 Multi-index 간의 직접적인 조인은 불가능합니다. 그러나 Kibana를 사용하여 다음과 같은 방법으로 요구 사항을 해결할 수 있습니다.

  1. 필드 병합을 통한 데이터 인덱싱:

    • 데이터를 Elasticsearch에 인덱싱할 때, 연관된 데이터를 하나의 문서로 병합하여 저장하는 방법이 있습니다. 예를 들면, dog 인덱스에 owner_id 필드를 추가하고 man 인덱스에도 같은 owner_id를 유지하여 양쪽의 데이터를 인덱싱합니다. 이를 통해 쿼리할 때 필드를 기준으로 서치를 진행할 수 있습니다.
  2. Kibana의 Vega 플러그인 활용:

    • Kibana의 Vega 플러그인을 이용하면 여러 인덱스 데이터를 시각화하면서 사용자 정의 스크립트를 통해 복잡한 로직을 구현할 수 있습니다. Vega는 복잡한 데이터 시각화를 지원해 주기 때문에, 커스터마이즈된 쿼리 결과를 기반으로 리포트를 생성할 수 있습니다.
  3. 데이터 프로세싱 도구 사용:

    • Logstash나 다른 데이터 처리 파이프라인 툴을 사용하여, 데이터를 전처리하고 관계를 맺은 상태로 Elasticsearch에 저장하는 방법도 고려할 수 있습니다. 데이터가 미리 조인된 상태로 저장되기 때문에 Kibana에서 추가적인 조인 없이 바로 시각화가 가능한 형태로 데이터를 가공할 수 있습니다.

관련 질문에 대한 추가적인 자료를 통해 더 많은 정보를 얻고자 하신다면 아래의 링크를 참조해 주세요:
- Elasticsearch에서 인덱스 간 데이터 처리 방법

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

junha.park님의 프로필 이미지
junha.park

작성한 질문수

질문하기