강의

멘토링

로드맵

Inflearn brand logo image

인프런 커뮤니티 질문&답변

Oh님의 프로필 이미지
Oh

작성한 질문수

정부 AI 정책 시대! 바이브코딩으로 만드는 공공데이터 AI 서비스 (Google AI Studio)

공공데이타포탈에서 docx 파일의 크기

작성

·

16

0

안녕 하세요. 문의 드립니다

 

"조달청_나라장터 입찰공고정보서비스" docx 파일이 500페이지가 넘습니다. 테이블 목록수가 25개 정도 되는 정보입니다. 이것을 대화창에 넣을 수가 없는데 어떻게 처리하는것이 좋은가요 ? 개별로 나누기도 쉽지 않고 혹시 처리하는방법이 있다면 알려주세요.

 

--감사 합니다--

 

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

음 일단 해당 파일 없이 해보고 잘안되면

 

파일을 pdf로 변환 후,

  1. Prd제작시 pdf로 업로드

  2. Ai studio에서도 pdf파일로 첨부 하는 방식으로 사용해야 할 것 같습니다

그래도 Ai가 api연결을 잘 시키지 못한다면 유료 도구 사용이 필요할 수도 있습니다

0

안녕하세요, 인프런 AI 인턴입니다.

Oh님, “조달청_나라장터 입찰공고정보서비스”의 대용량 docx 파일을 어떻게 처리하면 좋을지 문의 주셨군요. 대용량 문서를 효과적으로 분석하고 처리하는 방법에 대해 몇 가지 권장 사항을 안내드리겠습니다.

  1. 파일의 분할: 대용량 파일을 여러 개의 작은 단위로 나누는 것이 일반적입니다. Python과 같은 프로그래밍 언어를 사용하여 문서를 나누는 스크립트를 작성하는 방법이 있습니다. python-docx 라이브러리를 활용해 특정 분량이나 페이지로 파일을 분할할 수 있습니다.

  2. 요약 추출: 정보의 핵심을 빠르게 도출하기 위해 요약 알고리즘을 활용할 수 있습니다. Python의 sumygensim 같은 라이브러리를 사용해 각 페이지의 주요 내용을 추출하여 요약본을 생성할 수 있습니다.

  3. 온톨로지 기반 분석: 테이블 정보를 정규화하여 데이터베이스로 변환하고 정보를 구조적으로 분석할 수 있습니다. 이는 다양한 칼럼과 데이터 속성을 고려하여 복잡한 정보를 더 쉽게 분석할 수 있게 합니다.

해당 방법들을 통해 대화에 적합한 형태로 데이터를 변환하고 필요한 정보를 추출할 수 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

Oh님의 프로필 이미지
Oh

작성한 질문수

질문하기