PDF 형식
66
4 asked
안녕하세요 본 강의를 통해 다른 PDF로도 해보고 있는데 혹시 이미지 형식으로 되어있는 PDF의 경우 이상하게 파일을 읽는 거 같은데 이런 경우 어떤 방법으로 파일을 읽는 것이 좋을까요?
Answer 1
0
안녕하세요! 좋은 질문 감사합니다.
파일 안에 사진이 있는 경우에는, 경험상 비용이 발생하긴 하지만 Upstage의 Document API를 활용하는게 가장 좋은 선택입니다. 다른 대안이 있을 수도 있는데 저는 다른 방법은 시도해보지 않았습니다.
다만 Upstage의 Document API도 사진을 분석해주지는 않고, 아래 방식으로 진행하셔야 합니다.
pdf 파일을 분석해서 사진의 위치를 알려주는데요(좌표 포함),
해당 영역을 코드로 잘라서 별도로 사진 파일로 저장한 다음에
사진 인식이 가능한 AI를 활용해서 사진의 설명을 생성하고
사진의 설명을 임베딩하는 방식입니다
제가 시도해봤던 방법들 중에서는 가장 효과가 좋았습니다.
마크다운을 텍스트 파일로 변환하기
0
10
1
max token을 제한하는게 왜 성능을 개선하게 되는걸까요?
0
41
2
pyzerox 유니코드 에러
0
75
2
영상 메타데이터 생성 관련 LLM 활용 질문
0
72
1
종합부동산세 부분 tool 사용 질문 드립니다.
0
74
2
uv sync 파이썬 버전문제 onnxruntime
-1
106
2
MCP를 활용해서 간단한 에이전트를 만들어보세요
0
97
1
5.3 langchain-mcp-adpater를 활용한 MCP 도구 사용 tool_list 지연 사유
0
91
2
3.6 human_in_the_loop 3rd case
0
81
1
summary 를. 시스템메세지에 추가하는 부분에 관하여
0
70
3
병렬 처리 중 retrieve 관련 궁금한 사항
0
76
1
query 에 대한 answer 결과값이 나오지 않습니다.
0
95
2
사람과 관련된 표현이 없는데 rewrite 로 이동하지 않는경우
0
77
1
retriever 관련 질문
0
65
1
인터룹 관련 질문
0
49
2
2.4 Self-RAG 결과가 달라요!
0
78
2
md vs txt 차이..
0
140
2
OpenAI API 호출 때문에 발생하는 Error code: 429 문제
0
115
2
단순 도구 사용과 도구를 가진 에이전트를 사용하는 것의 차이가 궁금합니다.
0
88
1
LangChain과 LangGraph v1
0
137
1
2.4 강의 관련 질문(답변을 검증하는 self rag)
0
75
2
후속강의 문의
0
74
2
3.6 강의 관련 질문(interrupt 관련)
0
51
1
그래프 구현 조언 부탁드립니다!
0
77
2

