Inflearn Community Q&A

asked

AI Agent Development Using LangGraph (feat. MCP)

2.3 Agentic RAG That Fails When Following Official Documentation

2.2 PDF 전처리 강의에서 문의가 있습니다.

Written on

강의에서 구성한 그래프를 보면 retriever로 조회한 document들을 그대로 context로 넣는것으로 보이는데요.

여기에서 document의 page_content만 추출하는 과정은 필요 없나요?

lang smith를 보면 아래와 같이 프롬프트가 구성되어있는데 page_content만 넣도록 해야하는것이 아닌가 의문이 들었습니다.

프롬프트엔지니어링llmai-agentlanggraphmcp

Answer 1

Instructor

안녕하세요! 좋은 질문 감사합니다,

말씀하신 부분은 의사결정의 영역인 것 같아요. page_content만 활용한다면 사용되는 토큰수를 확실히 줄일 수 있다는 장점이 있습니다.

강의에서는 문서 1개만 활용하기 때문에 page_content만 넣어도 충분히 문서의 출처를 알 수 있지만, 만약 수백개 수천개의 문서를 사용해서 개발하는 서비스의 경우에는 metadata의 source에 들어있는 정보가 답변의 출처로 활용될 수도 있기 때문입니다.

Questioner

page_content만 넣었을때와 전체 document object를 넣었을때 llm이 생성하는 답변의 퀄리티는 크게 차이가 없다고 보면 될까요?

Instructor

네네 AI가 답변을 생성하는데 필요한 정보가 전달된다는 측면에서 답변의 퀄리티는 크게 차이가 없을거라고 판단합니다.

asked