공공데이타포탈에서 docx 파일의 크기
76
3 câu hỏi đã được viết
안녕 하세요. 문의 드립니다
"조달청_나라장터 입찰공고정보서비스" docx 파일이 500페이지가 넘습니다. 테이블 목록수가 25개 정도 되는 정보입니다. 이것을 대화창에 넣을 수가 없는데 어떻게 처리하는것이 좋은가요 ? 개별로 나누기도 쉽지 않고 혹시 처리하는방법이 있다면 알려주세요.
--감사 합니다--
Câu trả lời 2
0
음 일단 해당 파일 없이 해보고 잘안되면
파일을 pdf로 변환 후,
Prd제작시 pdf로 업로드
Ai studio에서도 pdf파일로 첨부 하는 방식으로 사용해야 할 것 같습니다
그래도 Ai가 api연결을 잘 시키지 못한다면 유료 도구 사용이 필요할 수도 있습니다
0
안녕하세요, 인프런 AI 인턴입니다.
Oh님, “조달청_나라장터 입찰공고정보서비스”의 대용량 docx 파일을 어떻게 처리하면 좋을지 문의 주셨군요. 대용량 문서를 효과적으로 분석하고 처리하는 방법에 대해 몇 가지 권장 사항을 안내드리겠습니다.
파일의 분할: 대용량 파일을 여러 개의 작은 단위로 나누는 것이 일반적입니다. Python과 같은 프로그래밍 언어를 사용하여 문서를 나누는 스크립트를 작성하는 방법이 있습니다.
python-docx라이브러리를 활용해 특정 분량이나 페이지로 파일을 분할할 수 있습니다.요약 추출: 정보의 핵심을 빠르게 도출하기 위해 요약 알고리즘을 활용할 수 있습니다. Python의
sumy나gensim같은 라이브러리를 사용해 각 페이지의 주요 내용을 추출하여 요약본을 생성할 수 있습니다.온톨로지 기반 분석: 테이블 정보를 정규화하여 데이터베이스로 변환하고 정보를 구조적으로 분석할 수 있습니다. 이는 다양한 칼럼과 데이터 속성을 고려하여 복잡한 정보를 더 쉽게 분석할 수 있게 합니다.
- Python으로 대용량 문서 처리하기: Python 라이브러리를 사용하여 대용량 문서를 처리하는 방법에 대해 소개된 게시물입니다.
해당 방법들을 통해 대화에 적합한 형태로 데이터를 변환하고 필요한 정보를 추출할 수 있습니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
올리버 에게 채용을 맡기다..에서 문의
0
3
0
파일 디렉토리 구조가 다르네요
0
5
1
클로드 초기설정
0
8
1
14강의 예시 데이터를 통한 답을 구하는 과정에서의 문의
0
6
1
git 커밋 관련 문의
0
14
1
강의가 재생되지 않습니다.
0
8
0
슬랙 스레드 대답
0
12
3
데이터베이스 만들기에서
0
9
0
github 세팅 자체를 github desktop을 사용해도 되나요?
0
12
1
8강 디버깅 하네스는 verification 하네스와 비슷하게 느껴지는데 결정적인 차이가있을까요?
0
8
0
3강 context harness에서 제시하주신 개념들에 대해 소개된 공식문서나 자료가 있을까요?
0
11
0
슬슬 따라하기가 힘들어진다.
0
35
2
섹션5 강의자료 다운로드
0
20
2
헤르메스와 코덱스 연결 관련
0
17
1
퀴즈가 cowork와 맞지 않아요.
0
11
0
[문의] 섹션 7 미션 진행 중...
0
22
2
수강기간즘연장해주세요
0
14
1
Git, claude 설치
0
20
1
기본 브랜치의 이름이 master에요.
0
27
2
plans 생성이 안됩니다.
0
26
3
mia /goal 실습시.. 아웃풋 폴더
0
17
1
mia /goal 실습시 키체인 오류(맥미니)
0
20
2
자료 공유 요청
0
75
2
미션 제출 시 미션 본문에는 어떤 내용을 작성하나요?
0
110
2

