inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

LangGraph를 활용한 AI Agent 개발 (feat. MCP)

2.5 웹 검색을 지원하는 Corrective RAG

PDF 청킹 문의

96

vlvsu77

작성한 질문수 1

0

안녕하세요. 강의 잘 수강하고 있습니다.

자체적으로 텍스트, 표, 시계열꺽은선그래프로 주로 구성된 pdf를 임베딩해서 RAG 기반의 LLM 서비스를 만들어 보고 싶은데요

표의 경우는 md 파일을 txt로 변환해서 저장하는 방법을 잘 알려주셨습니다만, 혹시 꺾은선그래프를 이미지처럼 저장해서 서비스에 활용할 수 있는 방법이 있을까요? 참고할만한 기술이나 좋은 아이디어 있으면 공유 혹은 조언해주시면 감사하겠습니다.

프롬프트엔지니어링 llm ai-agent langgraph mcp

답변 2

0

제이쓴

안녕하세요, 좋은 질문 감사합니다.

멀티모달 임베딩을 시도할 수 있는데, 제가 테스트했던 결과는 별로였습니다. 그래도 작년에 해본거라 지금은 더 좋아졌을 수도 있어요.

시도해봤던 방법들 중에 가장 괜찮았던건 사실 인프런 AI 인턴의 답변처럼 이미지나 그래프의 설명을 임베딩해서 저장하는 것이었습니다. 멀티모달 모델을 돌려서 이미지나 그래프에 주석을 생성해서, 해당 주석을 임베딩하고, 답변을 생성할 때는 주석을 통해서 답변을 생성하지만 사용자에게는 해당 이미지나 그래프를 보여주는 식으로 진행했었습니다

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다. vlvsu77님.

PDF 파일 내 이미지나 시계열 그래프와 같은 요소들은 자연어로 표현하기 어려운 정보를 담고 있기 때문에, LLM을 활용하여 직접적으로 활용하려면 몇 가지 추가적인 처리가 필요합니다. 다음 방법들을 고려할 수 있습니다:

1. 이미지 처리 및 활용

  • 이미지 변환 및 설명 첨가: 이미지의 내용을 설명하는 텍스트를 추가하여 LLM이 이해할 수 있도록 만듭니다. 예를 들어, OpenAI의 Vision API 같은 도구를 사용하여 이미지를 설명하는 텍스트를 얻을 수 있습니다. 이 텍스트를 PDF의 나머지 텍스트와 함께 임베딩하여 검색 가능하도록 하면 좋습니다.
  • 이미지 저장 및 링크 제공: 이미지를 별도의 저장소(예: AWS S3) 등에 저장하고, 링크를 생성하여 응답 시 제공할 수 있습니다. 이를 통해 사용자가 이미지에 직접 접근하도록 할 수 있습니다.

2. 시계열 그래프 처리

  • 텍스트 설명으로 변환: 그래프의 주요 데이터를 텍스트로 변환하여 시각적 정보를 텍스트로 표현합니다. 예를 들어, “그래프는 x월 y일에 최고값을 기록하며, 평균 값은 z입니다.“와 같이 서술할 수 있습니다.
  • 서버에서 동적 생성 및 제공: 필요한 경우, 클라이언트 측에서 그래프를 생성할 수 있도록 데이터를 제공하거나, 서버에서 그래프 이미지를 생성하여 반환하는 방법도 고려할 수 있습니다.

각각의 방법은 데이터를 사용자에게 어떻게 제공할지, 그리고 각 데이터를 통해 어떤 인사이트를 의도하는지에 따라 선택될 수 있습니다. 장기적으로는 PDF의 시각적 요소를 텍스트와 함께 잘 조합하여 전달할 수 있는 방법을 찾는 것이 중요합니다.

유사한 질문과 답변에 대해서는 아래 URL을 참고해 주시기 바랍니다:
- 이미지 데이터 학습 및 응답

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

깃허브 레포지토리 확인 요청

0

35

2

제공해주신 레포가 Windows 환경에 너무 비친화적입니다.

0

64

2

마크다운을 텍스트 파일로 변환하기

0

62

1

max token을 제한하는게 왜 성능을 개선하게 되는걸까요?

0

70

2

pyzerox 유니코드 에러

0

94

2

영상 메타데이터 생성 관련 LLM 활용 질문

0

89

1

종합부동산세 부분 tool 사용 질문 드립니다.

0

90

2

uv sync 파이썬 버전문제 onnxruntime

-1

135

2

MCP를 활용해서 간단한 에이전트를 만들어보세요

0

114

1

PDF 형식

0

79

1

5.3 langchain-mcp-adpater를 활용한 MCP 도구 사용 tool_list 지연 사유

0

104

2

3.6 human_in_the_loop 3rd case

0

92

1

summary 를. 시스템메세지에 추가하는 부분에 관하여

0

93

3

병렬 처리 중 retrieve 관련 궁금한 사항

0

85

1

query 에 대한 answer 결과값이 나오지 않습니다.

0

108

2

사람과 관련된 표현이 없는데 rewrite 로 이동하지 않는경우

0

84

1

retriever 관련 질문

0

68

1

인터룹 관련 질문

0

52

2

2.4 Self-RAG 결과가 달라요!

0

86

2

md vs txt 차이..

0

170

2

OpenAI API 호출 때문에 발생하는 Error code: 429 문제

0

130

2

단순 도구 사용과 도구를 가진 에이전트를 사용하는 것의 차이가 궁금합니다.

0

91

1

LangChain과 LangGraph v1

0

143

1

2.4 강의 관련 질문(답변을 검증하는 self rag)

0

80

2