강의

멘토링

로드맵

Inflearn brand logo image

인프런 커뮤니티 질문&답변

taesu님의 프로필 이미지
taesu

작성한 질문수

LangGraph를 활용한 AI Agent 개발 (feat. MCP)

2.3 공식문서 따라하면 실패하는 Agentic RAG

2.2 PDF 전처리 강의에서 문의가 있습니다.

작성

·

55

0

강의에서 구성한 그래프를 보면 retriever로 조회한 document들을 그대로 context로 넣는것으로 보이는데요.

여기에서 document의 page_content만 추출하는 과정은 필요 없나요?

lang smith를 보면 아래와 같이 프롬프트가 구성되어있는데 page_content만 넣도록 해야하는것이 아닌가 의문이 들었습니다.

image.png

 

답변 1

0

강병진님의 프로필 이미지
강병진
지식공유자

안녕하세요! 좋은 질문 감사합니다,

말씀하신 부분은 의사결정의 영역인 것 같아요. page_content만 활용한다면 사용되는 토큰수를 확실히 줄일 수 있다는 장점이 있습니다.

강의에서는 문서 1개만 활용하기 때문에 page_content만 넣어도 충분히 문서의 출처를 알 수 있지만, 만약 수백개 수천개의 문서를 사용해서 개발하는 서비스의 경우에는 metadata의 source에 들어있는 정보가 답변의 출처로 활용될 수도 있기 때문입니다.

 

taesu님의 프로필 이미지
taesu
질문자

page_content만 넣었을때와 전체 document object를 넣었을때 llm이 생성하는 답변의 퀄리티는 크게 차이가 없다고 보면 될까요?

강병진님의 프로필 이미지
강병진
지식공유자

네네 AI가 답변을 생성하는데 필요한 정보가 전달된다는 측면에서 답변의 퀄리티는 크게 차이가 없을거라고 판단합니다.

taesu님의 프로필 이미지
taesu

작성한 질문수

질문하기