LLM 마다 QA 과정에서 큰 차이가 있을까요?
안녕하세요. 오늘 결제 후 열심히 듣고 있습니다! (소중한 강의 만들어주셔 정말정말 감사합니다.)
다름 아니라, openAI 크레딧 유효기간이 지나
gemini 로 강의 코드를 변경하며 진행하고 있는데요,
병진님과 동일한 과정으로 openai -> google genai(model 은 gemini-pro, 변경한 클래스: GoogleGenerativeAIEmbeddings, ChatGoogleGenerativeAI) 로 변경해 답변을 받아보았는데 답변이 썩.. 좋지가 않네요 ㅠㅠ
prompt 템플릿을 작성하고 나서 답변을 받아보면 다음과 같이 답을 합니다.
'제공된 문서에는 해당 질문에 대한 답변이 없습니다.'
(페르소나를 명시할 때 "컨텍스트에 없으면 당신이 알고 있는 정보로 대답해주세요" 를 추가했음에도 동일하게 대답하네요..)
궁금한 점은
LLM 마다 답변 성능이 많이 차이가 날까요?
openAI 가 정답일까요..?ㅠ (참고로 저희 조직에서는 GCP 기반이다보니 제미나이를 좀 써보고 싶어서요..)
감사합니다!
답변 2
1
안녕하세요!
음... '제공된 문서에는 해당 질문에 대한 답변이 없습니다.' 라는 메세지가 나온다면 2가지를 확인해봐야하는데요.
문서를 제대로 가져오지 못하는 것인지
문서를 제대로 가져오는데 답변을 잘 생성하지 못하는 것인지
두가지를 검증해봐야 합니다.
일단 1번의 경우에는 아래와 같은 방식으로 확인하실 수 있는데요,
retrieved_docs = database.similarity_search(query, k=3)
print(retrieved_docs)사실 3.2강에서는 retrieval 효율이 좋지 않아서
3.5강에서 retrieval 개선을 위한 데이터 전처리
3.6강에서 retrieval 개선을 위한 keyword 사전 활용 방법을
안내드리고 있습니다. 그래서 3.2강에서는 우리가 원하는 문서를 제대로 가져오지 못했을 수도 있어요. 만약 강의에서 활용하는 질문을 그대로 활용하신다면 제55조 가 retrieval 결과에 포함되어야 합니다. 높은 확률로 아마 retrieval에 실패했을거에요. 지금 상황에서는 섹션3을 모두 들어보시고 검증해보시는 편이 좋을 것 같습니다.
질문에 계속 답변을 드리자면, 2번의 경우에는 말씀하신 LLM 성능때문일텐데요, 제 생각에는 Gemini나 GPT-4o가 저희가 체감할 만큼 어마어마한 성능 차이가 있을 것 같지는 않습니다. 말씀드린 것처럼 retrieval 에서 원하는 chunk를 가져오지 못했을 것 같아요. 만약 필요한 chunk를 제대로 가져오지 못했다면 '제공된 문서에는 해당 질문에 대한 답변이 없습니다.'라는 답변이 오히려 hallucination이 없는 정확한 답변일 수도 있겠다는 생각이 듭니다. 한번 확인해보시고 답변 달아주시면 follow-up 해보겠습니다!
0
와 병진님 상세한 답변 감사합니다!
retrieved_docs 는 확인해보니 55조 항목이 포함되지 않았네요..🥲
이후 수강에 retrieval 성능 개선 있는 걸 확인하지 못했습니다. 답변해주신 내용 충분히 이해하였고, 이후 질문이 있는 경우 해당 강의 질문게시판에 남겨둘게요!
hallucination이 없는 정확한 답변일 수도 있겠다는 생각이 듭니다. 를 생각해보지 못했어요. 필요한 chunk 를 적절히 가져오는 테크닉은 직접 어플리케이션을 개발 & 운영하면서 쌓이겠죠? ㅎㅎ
마냥 해봐야지 만 했던 주제의 강의를 내주셔 감사합니다. 열심히 듣고 열심히 질문하겠습니다!
1
네네! 그리고 필요한 chunk를 가져오는 방법이 문서 종류마다 다르고, 형식마다 달라서 이런저런 삽질(ㅠㅠ)들이 필요해요! 제가 강의에서 전달드리는 부분도 한가지 방법이고, 더 다양한 노력들이 필요합니다. 화이팅입니다!
소득세법 docx 파일 공유 요청건
0
65
1
EXAONE 모델 불러오기 안되는 문제
0
89
2
[5.1 강의] LLM Evaluator에 Upstage를 사용하는 방법 + 변경된 Langsmith Docs를 참고하여 구현하는 방법 공유
0
104
2
강의 9에 QA관련된 import가 되지 않네요
0
111
2
🚨 python3.14 를 쓰고 계시면 chroma 에서 ConfigError 가 발생합니다.
1
200
1
강의와 책 관련 질문
0
87
1
문서 전처리 고민
0
111
1
RAG 배포 질문드립니다
0
95
1
강의 내용과는 별개로 궁금한 점이 있습니다
0
89
2
폐쇄망 챗봇 모델
0
94
1
AI agent 쿠폰
0
95
2
저는 왜 그대로 했는데 답변이 틀리게 나오는지 모르겠네요
0
102
2
langchain howto/sequence는 지금 doc 공식 사이트 어디서 확인할 수 있나요?
1
95
1
new_question에 대한 답 출력
0
74
2
랭체인 라이브러리
0
148
2
[LangGraph를 활용한 AI Agent 개발] 쿠폰 유효기간
0
106
1
postgresql의 pgvector 벡터는 어떤가요?
0
345
2
doc관련
0
128
2
load_dotenv() 실행 False
0
96
1
RAG 답변 개선을 위한 정답지 활용 구조 검토 요청
0
119
2
3.2 from langchain.chains ~ 에서 모듈을 찾지 못할 때.
1
406
2
강의 완료 오류
0
89
1
hub.pull 이슈
0
131
2
[3.3 강의] Upstage를 사용한 RAG 구현 성공기 공유
1
150
1





