inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

실무에 바로 적용하는 Spring AI: Spring 서비스에 챗봇·RAG·MCP 도입하기

[실습] RAG CLI 구현 및 실행 테스트

spring ai에서 RAG ETL 파이프라인 성능 최적화에 대해 질문이 있습니다!

5

jyee

작성한 질문수 3

0

안녕하세요!

문서 분할 후 ETL 작업 마무리까지 시간이 오래 걸리길래, 프로파일링 해보니 keywordMetadataEnricher 작업 부분에서 가장 많이 시간이 소요되더라구요.

청크 사이즈를 키워 청크 개수를 줄여서 다시 테스트해보니 소요 시간이 많이 줄어들었습니다!

물론 아무래도 cpu나 gpu자원이 좋을수록 더 최적화할 수 있는 것 같긴 한데요ㅠ.ㅠ

 

어쨌든 작업 중 궁금한 점이 좀 많이 생겨서 질문 드려봅니다!

  1. keywordMetadataEnricher 의 기능이 rag의 검색 성능 등 서비스 활용 시에 사용자가 체감할 수 있는 성능을 많이 좌우할까요?

     

  2. keywordMetadataEnricher 사용을 최적화 하는 방법이 궁금합니다..! 저는 청크 개수를 줄였지만 그만큼 트레이드오프도 존재할 거 같아서, 병렬 처리를 한다든가.. 또 다른 방식이 있을 거 같은데 궁금합니다! (이것도 임베딩 모델과 연관 있을까요?)

  3. 추가로, 청크 개수를 줄였을 때의 장단점과 실제 서비스나 실무에서 사용 시, 청크 개수와 오버랩 값을 어떻게 결정할 수 있을지 궁금합니다! 실제로 테스트해보면서+경험론적으로 내가 etl 작업하고자 하는 로우 데이터의 성향에 따라 적절한 값을 찾는 것 밖에 없을까요..?

  4. 그 외 강사님께서 생각하시는 spring api 사용 시 ETL 파이프라인의 성능(시간 성능과 검색 성능)을 향상시킬 수 있는 방법도 궁금합니다. 시간 성능의 경우, ETL이라는 것은 무조건 시간이 오래 걸릴 수밖에 없는 작업이라는 생각이 들지만요..!

     

     

검색하면 논문도 나올만큼 많은 곳에서 얻을 수 있는 지식이지만,,! 강사님의 노하우나 생각도 궁금해서 질문 남겨봅니당.

항상 감사드립니다 : )

spring-boot rag spring-ai

답변 0

소스 깃허브 주소

0

9

0

강사님 질문 있어요.

0

18

2

pyproject copy.toml 파일 문의

0

26

3

setter 사용하지 않기

0

36

1

안녕하세요 토비님 혹시 완성된 코드의 repository 주소는 없을까요?

0

41

2

자막 오타 제보

0

37

1

강의 8번 관련

0

26

1

rabbitmq에 configservice 연결에 대해 질문있습니다.

0

36

1

라이브 강의 녹화본은 어디에서 확인해 볼수 있을까요?

0

22

1

라이브 강의 녹화본은 어디에서 확인해 볼수 있을까요?

0

36

1

섹션8 강의자료가 안열려요

0

32

2

지식공유 (윈도우 설치) [실습] 외부 MCP Server와 연동한 실시간 날씨 조회 - MCP Client 개발

0

38

1

자료 다운로드가 안됩니다.

0

43

2

claude-squad 실행 시 로그인 및 권한 문제

0

39

2

벡터저장소 코드 실행시 경고메시지가 나타납니다.

0

28

1

예제를 좀 다양하게 해주세요. 너무 간단한 예제만 있어서 ... 좀 그렇습니다.

0

25

2

RateLimitError

0

33

2

안녕하세요 졸업프로젝트를 준비하는 학생입니다.!

0

57

1

안녕하세요 치킨 디도스 이벤트 보고 흉내내보려 들어왔습니다..

0

33

2

Google API에 Generative Language API 선택이 없습니다.

1

41

2

Serpapi 툴을 사용하려 하는데 검색이 안됩니다.

0

49

4

실무 내용 문의드려요

0

32

2

3강에서 api 키 연결시 에러가 납니다.

0

39

2

dotenv, langchain_community 로드가 되지 않습니다.

0

31

1