강의

멘토링

커뮤니티

Cộng đồng Hỏi & Đáp của Inflearn

Hình ảnh hồ sơ của fwm82389
fwm82389

câu hỏi đã được viết

Phát triển AI Agent sử dụng LangGraph (feat. MCP)

2.7 Cải thiện hiệu quả thông qua xử lý song song (feat. Prompt Engineering)

PDF 형식

Viết

·

39

0

안녕하세요 본 강의를 통해 다른 PDF로도 해보고 있는데 혹시 이미지 형식으로 되어있는 PDF의 경우 이상하게 파일을 읽는 거 같은데 이런 경우 어떤 방법으로 파일을 읽는 것이 좋을까요?

프롬프트엔지니어링llmai-agentlanggraphmcp지금-베스트

Câu trả lời 1

0

jasonkang님의 프로필 이미지
jasonkang
Người chia sẻ kiến thức

안녕하세요! 좋은 질문 감사합니다.

파일 안에 사진이 있는 경우에는, 경험상 비용이 발생하긴 하지만 Upstage의 Document API를 활용하는게 가장 좋은 선택입니다. 다른 대안이 있을 수도 있는데 저는 다른 방법은 시도해보지 않았습니다.

다만 Upstage의 Document API도 사진을 분석해주지는 않고, 아래 방식으로 진행하셔야 합니다.

  1. pdf 파일을 분석해서 사진의 위치를 알려주는데요(좌표 포함),

  2. 해당 영역을 코드로 잘라서 별도로 사진 파일로 저장한 다음에

  3. 사진 인식이 가능한 AI를 활용해서 사진의 설명을 생성하고

  4. 사진의 설명을 임베딩하는 방식입니다

제가 시도해봤던 방법들 중에서는 가장 효과가 좋았습니다.

Hình ảnh hồ sơ của fwm82389
fwm82389

câu hỏi đã được viết

Đặt câu hỏi