2.4 Self-RAG 결과가 달라요!

해당 강의 8:10처럼 동일하게 돌렸을 때 다음과 같이 출력이 찍힙니다. 624만원에 관한 정보는 나오지 않습니다. ㅠㅠ 여러번 돌려도 계속 그렇게 나오네요 .. 어떤 문제일까요?, 혹시나 DB에 문서를 적재하는 과정중에서 55조의 테이블이 씹힌건가? 해서 document_list 찍었을땐 (적재 전 txt 파일을 로딩하는과정에서) 또 624만원에 관련된 내용이 있습니다... 출력내용이 길어 10000자가 넘어 마지막 answer만 올려드립니다.
document answer == {'answer': AIMessage(content='연봉 5천만 원인 거주자의 소득세는 근로소득공제를 적용하여 계산됩니다. 총급여액 5천만 원의 경우, 근로소득공제는 1천200만 원+(4천500만 원을 초과하는 금액의 100분의 5)입니다. 따라서, 소득세는 해당 공제를 적용한 과세표준에 세율을 적용하여 계산하게 됩니다. 하지만 세율 정보가 없으므로 정확한 소득세 금액을 계산할 수 없습니다.
++ 다른 테이블은 context로 찍히는데 55조 624만원 관련 테이블만 안찍힙니다..
Answer 2
0
print(document.page_content) 에 어떤 결과가 나오나요? 참고해야하는 문서가 제대로 들어가지 않는 것 같습니다.
1
해결 완료했습니다! 크로마에 적재할 때 청킹이 제대로 안됐던 것 같습니다! 다시 청킹 이후 임베딩 및 DB 적재 작업하고 다시 돌리니 제대로 Retriving됩니다!
0
안녕하세요, 인프런 AI 인턴입니다. 박수용님.
질문해 주신 내용을 살펴보았을 때, 연봉 5천만원인 거주자의 소득세에 대한 정보를 정확히 출력하지 못하는 것 같네요. 아래에서는 이에 대한 몇 가지 원인과 해결책을 제안드리겠습니다.
문제점 분석 및 해결책
벡터 스토어의 저장 문제:
- DB에 데이터를 적재할 때, 특정 문서(예: 55조)가 제대로 저장되지 않거나 인덱싱 과정에서 누락될 수 있습니다. 특히, 문서의 특정 부분이 누락되었을 수 있으므로, 데이터를 재확인하고, 특히 55조의 내용을 검색하는 기능을 강화해 보세요.
- DB에 데이터를 적재할 때, 특정 문서(예: 55조)가 제대로 저장되지 않거나 인덱싱 과정에서 누락될 수 있습니다. 특히, 문서의 특정 부분이 누락되었을 수 있으므로, 데이터를 재확인하고, 특히 55조의 내용을 검색하는 기능을 강화해 보세요.
문서 검색 및 인출 문제:
- 문서를 검색하는 과정에서 관련 데이터가 적절히 검색되지 않을 수 있습니다. 검색 쿼리가 55조를 포함하도록 세부적으로 설정되어 있는지 확인하세요.
retriever.invoke(query)관련한 설정을 점검하고, 추가적으로 검색 키워드나 메타데이터를 명시하여 시스템이 보다 적합한 문서를 선택하도록 유도해 보세요.
- 문서를 검색하는 과정에서 관련 데이터가 적절히 검색되지 않을 수 있습니다. 검색 쿼리가 55조를 포함하도록 세부적으로 설정되어 있는지 확인하세요.
데이터 전처리 문제:
- 데이터 전처리 과정에서 55조와 관련된 데이터가 올바르게 로드되고 분할되어 있는지 확인이 필요합니다. 분할 로직이나 전처리 조건을 다시 확인해 보세요.
- 전처리 대상 문서가 제대로 분할되었는지를 확인하기 위해 문서를 출력하여 해당 부분이 잘려 나가지는 않았는지 검토해 보시기 바랍니다.
- 데이터 전처리 과정에서 55조와 관련된 데이터가 올바르게 로드되고 분할되어 있는지 확인이 필요합니다. 분할 로직이나 전처리 조건을 다시 확인해 보세요.
추천 자료 및 비슷한 질문 링크
- 연봉 5천만원 직장인의 세금이 624만원이 나오는게 맞나요?: 소득세 계산의 정확성과 관련된 질문으로 특정 문서 검색에 대한 방법이 논의되었습니다.
- query 결과 값이 일치하지 않습니다.: 문서의 검색 및 인덱싱 문제, 문서 데이터 적재 오류에 대한 추가 정보를 제공하는 유사 사례입니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 추가 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
마크다운을 텍스트 파일로 변환하기
0
10
1
max token을 제한하는게 왜 성능을 개선하게 되는걸까요?
0
41
2
pyzerox 유니코드 에러
0
75
2
영상 메타데이터 생성 관련 LLM 활용 질문
0
72
1
종합부동산세 부분 tool 사용 질문 드립니다.
0
74
2
uv sync 파이썬 버전문제 onnxruntime
-1
106
2
MCP를 활용해서 간단한 에이전트를 만들어보세요
0
97
1
PDF 형식
0
66
1
5.3 langchain-mcp-adpater를 활용한 MCP 도구 사용 tool_list 지연 사유
0
91
2
3.6 human_in_the_loop 3rd case
0
81
1
summary 를. 시스템메세지에 추가하는 부분에 관하여
0
70
3
병렬 처리 중 retrieve 관련 궁금한 사항
0
76
1
query 에 대한 answer 결과값이 나오지 않습니다.
0
95
2
사람과 관련된 표현이 없는데 rewrite 로 이동하지 않는경우
0
77
1
retriever 관련 질문
0
65
1
인터룹 관련 질문
0
49
2
md vs txt 차이..
0
140
2
OpenAI API 호출 때문에 발생하는 Error code: 429 문제
0
115
2
단순 도구 사용과 도구를 가진 에이전트를 사용하는 것의 차이가 궁금합니다.
0
88
1
LangChain과 LangGraph v1
0
137
1
2.4 강의 관련 질문(답변을 검증하는 self rag)
0
75
2
후속강의 문의
0
74
2
3.6 강의 관련 질문(interrupt 관련)
0
51
1
그래프 구현 조언 부탁드립니다!
0
77
2

