inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

RAG를 활용한 LLM Application 개발 (feat. LangChain)

출처를 좀 더 명확하게 표시해주고 싶습니다!

69

용가리용용

작성한 질문수 2

0

강의에서는 출처를 제공할 때, 프롬프트 설정을 통해 제공하는 형태로 되어있는데

  1. 어떤 문서에서 몇 페이지에 있는 건지 표시해주기

  1. Pinecone기준 코사인 유사도를 숫자로 환산해 표시해주기

좀 더 확실한 출처 제공을 위해 위에 적은 기능을 활용해보고 싶은데, 어떤 부분을 수정해줘야 할까요?

지피티 대답이 너무 중구난방에 수정해도 오류가 계속 발생해서 여쭤봅니다!

vector-database llm langchain rag openai-api 카카오공채-개발

답변 2

0

제이쓴

안녕하세요! 좋은 질문 감사합니다.

1번의 경우에는, chunk를 vector store에 저장할 때, 페이지 번호를 같이 저장하는 방향으로 가야합니다. 각각의 chunk는 Document 라는 클래스로 저장되는데, 해당 클래스의 metadata에 페이지 번호를 추가하시면 됩니다. metadata는 딕셔너리라서 업데이트가 가능합니다.

2번의 경우에는 chain에서는 저는 시도해본적이 없는데요, retriever에서 값을 가져올 때 score를 같이 가져올 수 있습니다.

https://python.langchain.com/docs/how_to/add_scores_retriever/

 

1

용가리용용

답변 감사합니다! 꼭 적용해보고 다시 답글 드리겠습니다!!

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다. 용가리용용님.

질문하신 출처를 명확하게 표시하는 방법에 대해 답변드리겠습니다. RAG를 활용한 LLM Application 개발에서는 문서의 출처를 보다 정확하게 제공하는 것이 중요한데, 이는 사용자에게 보다 신뢰할 수 있는 정보를 전달하기 위함입니다. 두 가지 방법을 설명드리겠습니다:

  1. 문서 페이지 정보 추가:

    • 문서의 메타데이터를 활용하여 페이지 정보를 추가할 수 있습니다. 문서에서 페이지 번호를 포함시키려면, 문서를 분할할 때 문서 객체에 페이지 정보를 포함하여 저장해야 합니다.
    • LangChain 등에서 문서를 처리할 때, Document 클래스에 metadata 필드를 활용하시면 됩니다. 예를 들어, 문서를 페이지 단위로 처리하면서 메타데이터에 페이지 번호를 추가하세요.

    ”`python

    샘플 코드

    from langchain.docstore.document import Document

# 페이지 정보를 포함한 문서 생성
documents = [Document(text=page_content, metadata={“source”: “문서이름”, “page”: page_number}) for page_content, page_number in zip(documents_contents, page_numbers)]
“`

  1. 코사인 유사도 점수 표시:
    • Pinecone에서 문서를 검색할 때 반환되는 유사도 점수를 활용하여 이를 결과에 포함시킬 수 있습니다.
    • Pinecone의 검색 결과는 일반적으로 유사도 점수와 함께 반환됩니다. 이를 통해 검색된 각 문서에 대한 유사도 점수를 사용자에게 보여줄 수 있습니다.
    • 검색 결과를 가져올 때, 유사도 점수를 추출하여 최종 출력을 구성하면 됩니다.

예제 코드나 기존 코드에서의 수정을 통해 이러한 정보를 출력하도록 하면 사용자에게 문서와 관련된 더 많은 맥락을 제공할 수 있습니다.

비슷한 질문에 대한 더 많은 정보를 원하시면 아래 링크를 참고해 보세요:

  • Pinecone 관련 질문입니다.: Pinecone 설정 및 사용 방법에 대한 질문을 다루고 있어 관련 내용이 상세히 설명되어 있을 수 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

Langchain 공식문서 학습 질문

0

57

2

온톨로지 활용

0

67

2

ollama설치해서 llama로 돌려도 되나요?

0

71

2

소득세법 docx 파일 공유 요청건

0

115

1

EXAONE 모델 불러오기 안되는 문제

0

108

2

[5.1 강의] LLM Evaluator에 Upstage를 사용하는 방법 + 변경된 Langsmith Docs를 참고하여 구현하는 방법 공유

0

139

2

강의 9에 QA관련된 import가 되지 않네요

0

132

2

🚨 python3.14 를 쓰고 계시면 chroma 에서 ConfigError 가 발생합니다.

1

251

1

강의와 책 관련 질문

0

104

1

문서 전처리 고민

0

129

1

RAG 배포 질문드립니다

0

111

1

강의 내용과는 별개로 궁금한 점이 있습니다

0

106

2

폐쇄망 챗봇 모델

0

106

1

AI agent 쿠폰

0

103

2

저는 왜 그대로 했는데 답변이 틀리게 나오는지 모르겠네요

0

112

2

langchain howto/sequence는 지금 doc 공식 사이트 어디서 확인할 수 있나요?

1

107

1

new_question에 대한 답 출력

0

80

2

랭체인 라이브러리

0

172

2

[LangGraph를 활용한 AI Agent 개발] 쿠폰 유효기간

0

119

1

postgresql의 pgvector 벡터는 어떤가요?

0

409

2

doc관련

0

150

2

load_dotenv() 실행 False

0

104

1

RAG 답변 개선을 위한 정답지 활용 구조 검토 요청

0

128

2

3.2 from langchain.chains ~ 에서 모듈을 찾지 못할 때.

2

440

2