Inflearn brand logo image

인프런 커뮤니티 질문&답변

망고맛있어님의 프로필 이미지
망고맛있어

작성한 질문수

[2024년 개정]이것이 진짜 한글자동화다[기본편]

표 내부 셀 추출

작성

·

137

1

내부 표를 인식하여 이미지 파일로 추출하고 자 하는데, 궁금한 부분이 있어 글 남깁니다.

 

  1. 표 내부 셀에 그림이 있는 경우, 표를 추출할 때, 내부의 그림과 글까지 하나의 표로 추출하는 방법이 있을까요?

  2. 표 내부의 통합된 셀도 표 추출 시, 함께 추출할 수 있는 방법이 있을까요?

 

답변 2

1

한파엑셀님의 프로필 이미지
한파엑셀
지식공유자

표이미지2.png표이미지2.png

표 전체를 그림파일로 만들어봤는데, 그림이 표 내부에 들어있으면 이런식으로 그림이 2번 나오는 버그가 있습니다.(버젼에 따라 다를수도 있습니다)

  1. 기본적으로 한글에서 글과 그림을 따로 관리하기 때문에 따로따로 추출하는 방법은 있어도, 함께 추출하는 방법은 없습니다.

  2. 내부 통합된 셀은 추출할 순 있지만, 데이터 오류가 생기니 셀 병합을 다 풀고 추출하시는게 좋습니다.

이해가 되었습니다. 친절하게 답변해주셔서 감사합니다!

0

안녕하세요, 인프런 AI 인턴입니다. 망고맛있어님 😊

한글 문서 내의 표를 자동화하여 이미지 파일로 추출하는 것은 꽤나 복잡한 작업일 수 있습니다. 각 부분을 자동화하기 위해 몇 가지 고려해야 할 점들을 정리해 보았습니다.

  1. 표 내부 셀에 그림과 텍스트 함께 추출하기:

    • 일반적으로 표를 이미지로 추출할 경우, 표의 형태와 레이아웃만을 캡처할 수 있습니다. 표 내부의 그림과 텍스트 역시 캡처 대상이 되지만, 고해상도의 이미지를 얻으려면 표 자체를 캡처하는 것이 아니라, 각각의 그림과 텍스트 요소를 별도로 인식하고 추출하는 스크립트를 작성해야 할 수 있습니다. 이를 위해 일관된 레이아웃 구조를 사용하는 것이 중요합니다.
  2. 통합된 셀 추출:

    • 통합된 셀의 경우, 표를 추출할 때 셀 병합 상태를 유지하도록 하는 것이 중요합니다. 이를 위해 셀의 병합 상태를 인식하고, 병합 상태를 유지한 채로 이미지로 생성하는 기능이 필요합니다. 보통 이러한 기능은 한글 문서 API를 활용하여 구현할 수 있습니다.

이 두 가지는 모두 기본적인 표 추출 기능을 넘어서, 문서 내부의 다양한 요소까지 포함해야 하므로, 특정 라이브러리나 한글 API를 활용할 수 있는지 검토해보는 것을 추천합니다. 현재의 한글 API와 파이썬을 통해 기본적인 추출은 가능하지만, 복잡한 레이아웃의 경우 별도의 추가 코딩이 필요할 수 있습니다.

관련 질문 안내: 아래의 질문들을 참고하시면, 좀 더 구체적인 해결책을 찾는데 도움이 될 수 있습니다.

현재 구체적인 방법이나 코드를 제공드리기는 어렵지만, 한글 API를 사용하여 더 깊이 있는 접근을 시도해 보실 수 있습니다. 한글 자동화 관련 강의를 통해 제공된 예제들을 기반으로, 필요한 기능을 확장해 보시는 것도 좋은 방법이 될 것입니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

망고맛있어님의 프로필 이미지
망고맛있어

작성한 질문수

질문하기