강의

멘토링

커뮤니티

Cộng đồng Hỏi & Đáp của Inflearn

Hình ảnh hồ sơ của skidrow4
skidrow4

câu hỏi đã được viết

Thời đại chính sách AI của Chính phủ! Tạo dịch vụ AI dữ liệu công cộng bằng Vibe Coding (Google AI Studio)

공공데이타포탈에서 docx 파일의 크기

Viết

·

59

0

안녕 하세요. 문의 드립니다

 

"조달청_나라장터 입찰공고정보서비스" docx 파일이 500페이지가 넘습니다. 테이블 목록수가 25개 정도 되는 정보입니다. 이것을 대화창에 넣을 수가 없는데 어떻게 처리하는것이 좋은가요 ? 개별로 나누기도 쉽지 않고 혹시 처리하는방법이 있다면 알려주세요.

 

--감사 합니다--

 

업무-생산성인공지능(ai)ai-활용-(ax)ai-agent바이브코딩

Câu trả lời 2

0

roadmap님의 프로필 이미지
roadmap
Người chia sẻ kiến thức

음 일단 해당 파일 없이 해보고 잘안되면

 

파일을 pdf로 변환 후,

  1. Prd제작시 pdf로 업로드

  2. Ai studio에서도 pdf파일로 첨부 하는 방식으로 사용해야 할 것 같습니다

그래도 Ai가 api연결을 잘 시키지 못한다면 유료 도구 사용이 필요할 수도 있습니다

0

안녕하세요, 인프런 AI 인턴입니다.

Oh님, “조달청_나라장터 입찰공고정보서비스”의 대용량 docx 파일을 어떻게 처리하면 좋을지 문의 주셨군요. 대용량 문서를 효과적으로 분석하고 처리하는 방법에 대해 몇 가지 권장 사항을 안내드리겠습니다.

  1. 파일의 분할: 대용량 파일을 여러 개의 작은 단위로 나누는 것이 일반적입니다. Python과 같은 프로그래밍 언어를 사용하여 문서를 나누는 스크립트를 작성하는 방법이 있습니다. python-docx 라이브러리를 활용해 특정 분량이나 페이지로 파일을 분할할 수 있습니다.

  2. 요약 추출: 정보의 핵심을 빠르게 도출하기 위해 요약 알고리즘을 활용할 수 있습니다. Python의 sumygensim 같은 라이브러리를 사용해 각 페이지의 주요 내용을 추출하여 요약본을 생성할 수 있습니다.

  3. 온톨로지 기반 분석: 테이블 정보를 정규화하여 데이터베이스로 변환하고 정보를 구조적으로 분석할 수 있습니다. 이는 다양한 칼럼과 데이터 속성을 고려하여 복잡한 정보를 더 쉽게 분석할 수 있게 합니다.

해당 방법들을 통해 대화에 적합한 형태로 데이터를 변환하고 필요한 정보를 추출할 수 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

Hình ảnh hồ sơ của skidrow4
skidrow4

câu hỏi đã được viết

Đặt câu hỏi