공공데이타포탈에서 docx 파일의 크기
67
작성한 질문수 3
안녕 하세요. 문의 드립니다
"조달청_나라장터 입찰공고정보서비스" docx 파일이 500페이지가 넘습니다. 테이블 목록수가 25개 정도 되는 정보입니다. 이것을 대화창에 넣을 수가 없는데 어떻게 처리하는것이 좋은가요 ? 개별로 나누기도 쉽지 않고 혹시 처리하는방법이 있다면 알려주세요.
--감사 합니다--
답변 2
0
음 일단 해당 파일 없이 해보고 잘안되면
파일을 pdf로 변환 후,
Prd제작시 pdf로 업로드
Ai studio에서도 pdf파일로 첨부 하는 방식으로 사용해야 할 것 같습니다
그래도 Ai가 api연결을 잘 시키지 못한다면 유료 도구 사용이 필요할 수도 있습니다
0
안녕하세요, 인프런 AI 인턴입니다.
Oh님, “조달청_나라장터 입찰공고정보서비스”의 대용량 docx 파일을 어떻게 처리하면 좋을지 문의 주셨군요. 대용량 문서를 효과적으로 분석하고 처리하는 방법에 대해 몇 가지 권장 사항을 안내드리겠습니다.
파일의 분할: 대용량 파일을 여러 개의 작은 단위로 나누는 것이 일반적입니다. Python과 같은 프로그래밍 언어를 사용하여 문서를 나누는 스크립트를 작성하는 방법이 있습니다.
python-docx라이브러리를 활용해 특정 분량이나 페이지로 파일을 분할할 수 있습니다.요약 추출: 정보의 핵심을 빠르게 도출하기 위해 요약 알고리즘을 활용할 수 있습니다. Python의
sumy나gensim같은 라이브러리를 사용해 각 페이지의 주요 내용을 추출하여 요약본을 생성할 수 있습니다.온톨로지 기반 분석: 테이블 정보를 정규화하여 데이터베이스로 변환하고 정보를 구조적으로 분석할 수 있습니다. 이는 다양한 칼럼과 데이터 속성을 고려하여 복잡한 정보를 더 쉽게 분석할 수 있게 합니다.
- Python으로 대용량 문서 처리하기: Python 라이브러리를 사용하여 대용량 문서를 처리하는 방법에 대해 소개된 게시물입니다.
해당 방법들을 통해 대화에 적합한 형태로 데이터를 변환하고 필요한 정보를 추출할 수 있습니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
'디스패처(Dispatcher)' 훅 패턴 적용이 다 안되
0
2
1
강의자료 오류
0
3
1
.md 파일명 대소문자 구분 문의
0
4
0
강의 자료 제작을 어떻게 하셨는지 궁금합니다!
0
9
0
mac OS 환경에서 설치 사용 하는 법은 안나온 거죠?
0
6
1
/output-style 이 안뜹니다
0
9
2
프로젝트 초기화 문제
0
6
1
섹션8,9부터는 진짜 못따라가겠어요...ㅠㅠ
0
11
1
새 링크 버튼이 안 보여요
0
13
2
파워쉘에서 이미지 복붙이 안됩니다.
0
9
1
160 강의 ppt-maker에 대해
0
14
1
고민이있습니다
0
12
1
안티그래비티에서 강의 내용 동일하게 진행중 글자 깨짐 ㅠㅠ
0
15
2
이벤트 관리 앱 프로젝트 개발 순서
0
10
0
텔레그램 토픽 방 메시지 회신
0
8
1
/mcp 목록에 n8n-mcp 목록이 안나와요 ㅠㅠ
0
15
2
supabase next.js와 mcp
0
9
0
늘 컴퓨터를 켜두어야 하는 것에 대한 질문입니다.
0
14
1
스테이징 10000개
0
10
1
160. Claude Code로 PPT 만들기 관련 질문
0
13
1
task master 관련질문입니다.
0
15
1
강의에 사용된 자료 요청
1
13
2
자료 공유 요청
0
67
2
미션 제출 시 미션 본문에는 어떤 내용을 작성하나요?
0
99
2





