강의

멘토링

로드맵

Inflearn brand logo image

인프런 커뮤니티 질문&답변

alstn9623님의 프로필 이미지
alstn9623

작성한 질문수

스프링부트로 직접 만들면서 배우는 대규모 시스템 설계 - 게시판

게시글 목록 최적화 전략 구현 - 서비스 & 컨트롤러

키워드 검색 페이징에 대한 Redis 캐시

해결된 질문

작성

·

75

0

  • 학습 관련 질문을 최대한 상세히 남겨주세요!

  • 고민 과정도 같이 나열해주셔도 좋습니다.

  • 먼저 유사한 질문이 있었는지 검색해보세요.

  • 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.

안녕하세요! 강의 잘 들었습니다!

 

궁금한 점이 있어서 문의 드립니다.

강의에서는 상위 1000건에 대해서 articleId를 기준으로 Redis 캐시를 해두었는데 혹시 키워드(제목, 작성자, 내용등)에 대한 검색 페이징 처리도 캐시가 가능한걸까요?

 

제가 생각했을 때는 아래와 같은 방법으로 처리가 가능할 것 같은데 보통 대용량 트래픽 환경에서 해당 케이스를 어떻게 처리하는지 궁금합니다!

  • 키워드 검색이 있을 경우 RDB에서 직접 조회

  • 키워드 검색 조건 별로 Redis 캐시

  • Elasticsearch 도입 후 동기화하여 키워드 검색시 Elasticsearch에서 조회

     

답변 2

0

쿠케님의 프로필 이미지
쿠케
지식공유자

alstn9623님, 안녕하세요!

 

검색의 경우 캐싱이나 대규모 트래픽 처리 전략이 조금 다를 수 있는데요,

여러가지 전략들을 혼합해서 적용할 수 있을 것 같습니다.

  • 자주 검색되는 키워드 캐싱

  • 정규화된 키워드로 캐싱(공백 제거 등)

  • 첫 페이지만 캐싱하거나 특정 고정된 파라미터로 캐싱

  • 질의 서버와 색인 서버 분리

     

그리고 검색을 위한 인덱싱은 일반적인 RDB 방식과 달리 Inverted Index라는 방식이기 때문에 elasticsearch와 같은 검색 엔진을 사용하는게 좋습니다!

alstn9623님의 프로필 이미지
alstn9623
질문자

답변 감사합니다!

말씀해주신 것 처럼 상황에 따라 적용할 수 있는 전략은 다양하겠지만

만약 엘라스틱서치를 도입한다면 게시글 데이터를 저장할때 DB와 Elasticsearch에 모두 저장해준 다음, 최신 게시글 목록을 조회할 경우 Redis에 캐싱된 데이터를 반환해주고 키워드 검색을 통한 조회시 Elasticsearch를 통해 조회하여 반환해주면 되는걸까요?

쿠케님의 프로필 이미지
쿠케
지식공유자

네, 맞습니다!

원본 데이터는 메인 DB(여기서는 rdb)에 저장하고,

Elasticsearch에 복제하는게 일반적입니다.

다만, 검색 문서 색인의 경우 원본 데이터를 그대로 복제할 필요는 없습니다.

결국 검색을 위한 것이므로 색인할 필드만 저장해도 충분합니다.

그러면 검색엔진 검색 결과와 식별자만 뽑아와서 메인 DB와 애플리케이션에서 조인할 수 있고, 색인의 경우 지연이 생길 수도 있기 때문에 실시간성을 같이 챙길 수도 있습니다!

Redis와 최신 게시글은 검색엔진과 별개의 문제인데, 같이 생각할 필요는 없을 것 같네요.

아무튼 말씀하신 전략도 가능합니다.

alstn9623님의 프로필 이미지
alstn9623
질문자

상세한 답변 감사합니다!

0

안녕하세요, 인프런 AI 인턴입니다. alstn9623님.

질문 주신 키워드 검색 페이징과 관련한 Redis 캐시 처리에 대해서 설명 드리겠습니다. 키워드 기반 검색은 복잡도가 높은 연산으로, 효율적인 데이터 저장 및 조회를 통해 성능을 최적화할 수 있습니다.

1. RDB에서 직접 조회

  • 키워드 검색을 직접 데이터베이스에서 조회하는 방법은 간단하지만, 대규모 트래픽 상황에서는 데이터베이스 성능에 큰 부담을 줄 수 있습니다. 특히, 여러 조건으로 검색을 수행할 때 이슈가 발생할 수 있습니다.

2. 키워드 조건별 Redis 캐싱

  • 캐시는 빠른 조회를 목적으로 활용되며, 일반적인 데이터 조회 이외에도 특정 키워드 검색에 대한 결과를 캐시하여 성능을 향상시킬 수 있습니다.
  • 단, 캐시 미스(cache miss) 발생 가능성을 줄이기 위해 자주 검색되는 패턴의 결과를 캐싱해야 합니다. 모든 키워드에 대해 캐싱을 무조건적으로 진행하면 오히려 캐시 히트률이 낮아질 수 있습니다.

3. Elasticsearch로 동기화

  • Elasticsearch는 분산 검색 엔진으로 대용량 데이터를 기반으로 빠르게 검색할 수 있도록 설계되었습니다.
  • 데이터베이스와의 실시간 동기화를 통해, 검색 시 데이터 최신성을 유지하면서도 매우 빠른 검색 결과를 제공합니다.
  • 특히 복잡한 텍스트 검색, 키워드 매칭, 및 필터링 등에서 우수한 성능을 발휘합니다.

일반적인 대용량 트래픽 환경에서 처리 방법

  • 조합 활용: 위의 방법들을 적절히 조합하여 사용하는 것이 좋습니다. 기본 검색 쿼리는 RDB, 빈번한 검색 패턴은 Redis, 복잡한 텍스트와 대용량 키워드 검색은 Elasticsearch 활용이 일반적입니다.
  • 캐시 전략: 자주 사용되는 패턴에 대해 캐싱 전략을 세우고, Redis를 통해 검색 결과를 캐시하여 반복 조회 시 성능을 높이는 방안을 고려합니다.
  • Elastic 사용: 복잡한 검색 및 대규모 검색 성능 최적화가 필요할 때 Elasticsearch 같은 전문 검색 엔진을 도입하여 검색의 질과 성능 모두를 보장할 수 있습니다.

이 내용이 도움이 되셨기를 바라며, 추가적으로 자세한 전략이나 구현에 대해 더 궁금한 점이 있으시면 언제든지 질문해 주세요. 관련된 유사한 질문으로는 “Elasticsearch와 Redis의 통합 활용에 대한 예시”도 참고하실 수 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

alstn9623님의 프로필 이미지
alstn9623

작성한 질문수

질문하기