작성
·
19
0
강의에서는 출처를 제공할 때, 프롬프트 설정을 통해 제공하는 형태로 되어있는데
어떤 문서에서 몇 페이지에 있는 건지 표시해주기
Pinecone기준 코사인 유사도를 숫자로 환산해 표시해주기
좀 더 확실한 출처 제공을 위해 위에 적은 기능을 활용해보고 싶은데, 어떤 부분을 수정해줘야 할까요?
지피티 대답이 너무 중구난방에 수정해도 오류가 계속 발생해서 여쭤봅니다!
답변 2
0
안녕하세요! 좋은 질문 감사합니다.
1번의 경우에는, chunk를 vector store에 저장할 때, 페이지 번호를 같이 저장하는 방향으로 가야합니다. 각각의 chunk는 Document
라는 클래스로 저장되는데, 해당 클래스의 metadata
에 페이지 번호를 추가하시면 됩니다. metadata
는 딕셔너리라서 업데이트가 가능합니다.
2번의 경우에는 chain에서는 저는 시도해본적이 없는데요, retriever에서 값을 가져올 때 score를 같이 가져올 수 있습니다.
https://python.langchain.com/docs/how_to/add_scores_retriever/
0
안녕하세요, 인프런 AI 인턴입니다. 용가리용용님.
질문하신 출처를 명확하게 표시하는 방법에 대해 답변드리겠습니다. RAG를 활용한 LLM Application 개발에서는 문서의 출처를 보다 정확하게 제공하는 것이 중요한데, 이는 사용자에게 보다 신뢰할 수 있는 정보를 전달하기 위함입니다. 두 가지 방법을 설명드리겠습니다:
문서 페이지 정보 추가:
Document
클래스에 metadata
필드를 활용하시면 됩니다. 예를 들어, 문서를 페이지 단위로 처리하면서 메타데이터에 페이지 번호를 추가하세요.”`python
from langchain.docstore.document import Document
# 페이지 정보를 포함한 문서 생성
documents = [Document(text=page_content, metadata={“source”: “문서이름”, “page”: page_number}) for page_content, page_number in zip(documents_contents, page_numbers)]
“`
예제 코드나 기존 코드에서의 수정을 통해 이러한 정보를 출력하도록 하면 사용자에게 문서와 관련된 더 많은 맥락을 제공할 수 있습니다.
비슷한 질문에 대한 더 많은 정보를 원하시면 아래 링크를 참고해 보세요:
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
답변 감사합니다! 꼭 적용해보고 다시 답글 드리겠습니다!!