inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

RAG를 활용한 LLM Application 개발 (feat. LangChain)

3.2 LangChain과 Chroma를 활용한 RAG 구성

LLM 마다 QA 과정에서 큰 차이가 있을까요?

해결된 질문

504

재주닝

작성한 질문수 1

1

안녕하세요. 오늘 결제 후 열심히 듣고 있습니다! (소중한 강의 만들어주셔 정말정말 감사합니다.)

다름 아니라, openAI 크레딧 유효기간이 지나

gemini 로 강의 코드를 변경하며 진행하고 있는데요,

병진님과 동일한 과정으로 openai -> google genai(model 은 gemini-pro, 변경한 클래스: GoogleGenerativeAIEmbeddings, ChatGoogleGenerativeAI) 로 변경해 답변을 받아보았는데 답변이 썩.. 좋지가 않네요 ㅠㅠ

prompt 템플릿을 작성하고 나서 답변을 받아보면 다음과 같이 답을 합니다.

'제공된 문서에는 해당 질문에 대한 답변이 없습니다.'

(페르소나를 명시할 때 "컨텍스트에 없으면 당신이 알고 있는 정보로 대답해주세요" 를 추가했음에도 동일하게 대답하네요..)

궁금한 점은

감사합니다!

vector-database llm langchain rag openai-api

답변 2

1

제이쓴

안녕하세요!

음... '제공된 문서에는 해당 질문에 대한 답변이 없습니다.' 라는 메세지가 나온다면 2가지를 확인해봐야하는데요.

  1. 문서를 제대로 가져오지 못하는 것인지

  2. 문서를 제대로 가져오는데 답변을 잘 생성하지 못하는 것인지

두가지를 검증해봐야 합니다.

일단 1번의 경우에는 아래와 같은 방식으로 확인하실 수 있는데요,

retrieved_docs = database.similarity_search(query, k=3)
print(retrieved_docs)

사실 3.2강에서는 retrieval 효율이 좋지 않아서

  • 3.5강에서 retrieval 개선을 위한 데이터 전처리

  • 3.6강에서 retrieval 개선을 위한 keyword 사전 활용 방법을

안내드리고 있습니다. 그래서 3.2강에서는 우리가 원하는 문서를 제대로 가져오지 못했을 수도 있어요. 만약 강의에서 활용하는 질문을 그대로 활용하신다면 제55조 가 retrieval 결과에 포함되어야 합니다. 높은 확률로 아마 retrieval에 실패했을거에요. 지금 상황에서는 섹션3을 모두 들어보시고 검증해보시는 편이 좋을 것 같습니다.

 

질문에 계속 답변을 드리자면, 2번의 경우에는 말씀하신 LLM 성능때문일텐데요, 제 생각에는 Gemini나 GPT-4o가 저희가 체감할 만큼 어마어마한 성능 차이가 있을 것 같지는 않습니다. 말씀드린 것처럼 retrieval 에서 원하는 chunk를 가져오지 못했을 것 같아요. 만약 필요한 chunk를 제대로 가져오지 못했다면 '제공된 문서에는 해당 질문에 대한 답변이 없습니다.'라는 답변이 오히려 hallucination이 없는 정확한 답변일 수도 있겠다는 생각이 듭니다. 한번 확인해보시고 답변 달아주시면 follow-up 해보겠습니다!

0

재주닝

와 병진님 상세한 답변 감사합니다!

  • retrieved_docs 는 확인해보니 55조 항목이 포함되지 않았네요..🥲

  • 이후 수강에 retrieval 성능 개선 있는 걸 확인하지 못했습니다. 답변해주신 내용 충분히 이해하였고, 이후 질문이 있는 경우 해당 강의 질문게시판에 남겨둘게요!

  • hallucination이 없는 정확한 답변일 수도 있겠다는 생각이 듭니다. 를 생각해보지 못했어요. 필요한 chunk 를 적절히 가져오는 테크닉은 직접 어플리케이션을 개발 & 운영하면서 쌓이겠죠? ㅎㅎ

마냥 해봐야지 만 했던 주제의 강의를 내주셔 감사합니다. 열심히 듣고 열심히 질문하겠습니다!

1

제이쓴

네네! 그리고 필요한 chunk를 가져오는 방법이 문서 종류마다 다르고, 형식마다 달라서 이런저런 삽질(ㅠㅠ)들이 필요해요! 제가 강의에서 전달드리는 부분도 한가지 방법이고, 더 다양한 노력들이 필요합니다. 화이팅입니다!

소득세법 docx 파일 공유 요청건

0

65

1

EXAONE 모델 불러오기 안되는 문제

0

89

2

[5.1 강의] LLM Evaluator에 Upstage를 사용하는 방법 + 변경된 Langsmith Docs를 참고하여 구현하는 방법 공유

0

104

2

강의 9에 QA관련된 import가 되지 않네요

0

111

2

🚨 python3.14 를 쓰고 계시면 chroma 에서 ConfigError 가 발생합니다.

1

200

1

강의와 책 관련 질문

0

87

1

문서 전처리 고민

0

111

1

RAG 배포 질문드립니다

0

95

1

강의 내용과는 별개로 궁금한 점이 있습니다

0

89

2

폐쇄망 챗봇 모델

0

94

1

AI agent 쿠폰

0

95

2

저는 왜 그대로 했는데 답변이 틀리게 나오는지 모르겠네요

0

102

2

langchain howto/sequence는 지금 doc 공식 사이트 어디서 확인할 수 있나요?

1

95

1

new_question에 대한 답 출력

0

74

2

랭체인 라이브러리

0

148

2

[LangGraph를 활용한 AI Agent 개발] 쿠폰 유효기간

0

106

1

postgresql의 pgvector 벡터는 어떤가요?

0

345

2

doc관련

0

128

2

load_dotenv() 실행 False

0

96

1

RAG 답변 개선을 위한 정답지 활용 구조 검토 요청

0

119

2

3.2 from langchain.chains ~ 에서 모듈을 찾지 못할 때.

1

406

2

강의 완료 오류

0

89

1

hub.pull 이슈

0

131

2

[3.3 강의] Upstage를 사용한 RAG 구현 성공기 공유

1

150

1