Inflearn Community Q&A
2.2 PDF 전처리 강의에서 문의가 있습니다.
Written on
·
67
0
강의에서 구성한 그래프를 보면 retriever로 조회한 document들을 그대로 context로 넣는것으로 보이는데요.
여기에서 document의 page_content만 추출하는 과정은 필요 없나요?
lang smith를 보면 아래와 같이 프롬프트가 구성되어있는데 page_content만 넣도록 해야하는것이 아닌가 의문이 들었습니다.

프롬프트엔지니어링llmai-agentlanggraphmcp
Answer 1
0
jasonkang
Instructor
안녕하세요! 좋은 질문 감사합니다,
말씀하신 부분은 의사결정의 영역인 것 같아요. page_content만 활용한다면 사용되는 토큰수를 확실히 줄일 수 있다는 장점이 있습니다.
강의에서는 문서 1개만 활용하기 때문에 page_content만 넣어도 충분히 문서의 출처를 알 수 있지만, 만약 수백개 수천개의 문서를 사용해서 개발하는 서비스의 경우에는 metadata의 source에 들어있는 정보가 답변의 출처로 활용될 수도 있기 때문입니다.





page_content만 넣었을때와 전체 document object를 넣었을때 llm이 생성하는 답변의 퀄리티는 크게 차이가 없다고 보면 될까요?