docx2txt 라이브러리에 대한 질문!
219
작성한 질문수 7
선생님 강의 잘 듣고 있습니다.
강의 내용과 함께 직접 하나하나 따라하고 공식문서도 확인하면서 해보던중, 워드 문서를 loader하기위해 docx2txt라이브러리를 사용하는 것을 봤습니다. 물론 오픈소스 라이브러리이고, 전부터 잘 사용해온것 같아 이걸로 진행해도 이상없지만,
LangChain v0.2공식문서에서는 docx파일을 로더하기위해선 Azure AI Document Intelligence으로 예시가 되어 있더라고요.
(제가 못찾은 거 일 수도 있어요..)
어떤 차이가 있는 건지...비용이 드는 건지, 혹여나 한국어문서이다보니 뭐가 더 잘 loader하는지 궁금합니다!
답변 1
1
좋은 질문 감사합니다! Azure AI Document Intelligence를 사용하면 docx2txt를 사용하는 것보다 정확도는 훨씬 뛰어날거에요! 하지만 비용이 발생한다는 단점이 있습니다 ㅠㅠ
소득세법 docx 파일 공유 요청건
0
65
1
EXAONE 모델 불러오기 안되는 문제
0
89
2
[5.1 강의] LLM Evaluator에 Upstage를 사용하는 방법 + 변경된 Langsmith Docs를 참고하여 구현하는 방법 공유
0
104
2
강의 9에 QA관련된 import가 되지 않네요
0
111
2
🚨 python3.14 를 쓰고 계시면 chroma 에서 ConfigError 가 발생합니다.
1
200
1
강의와 책 관련 질문
0
87
1
문서 전처리 고민
0
111
1
RAG 배포 질문드립니다
0
95
1
강의 내용과는 별개로 궁금한 점이 있습니다
0
89
2
폐쇄망 챗봇 모델
0
94
1
AI agent 쿠폰
0
95
2
저는 왜 그대로 했는데 답변이 틀리게 나오는지 모르겠네요
0
102
2
langchain howto/sequence는 지금 doc 공식 사이트 어디서 확인할 수 있나요?
1
95
1
new_question에 대한 답 출력
0
74
2
랭체인 라이브러리
0
148
2
[LangGraph를 활용한 AI Agent 개발] 쿠폰 유효기간
0
106
1
postgresql의 pgvector 벡터는 어떤가요?
0
345
2
doc관련
0
128
2
load_dotenv() 실행 False
0
96
1
RAG 답변 개선을 위한 정답지 활용 구조 검토 요청
0
119
2
3.2 from langchain.chains ~ 에서 모듈을 찾지 못할 때.
1
406
2
강의 완료 오류
0
89
1
hub.pull 이슈
0
131
2
[3.3 강의] Upstage를 사용한 RAG 구현 성공기 공유
1
150
1





