인프런 커뮤니티 질문&답변
표 내부 셀 추출
작성
·
165
답변 2
1


표 전체를 그림파일로 만들어봤는데, 그림이 표 내부에 들어있으면 이런식으로 그림이 2번 나오는 버그가 있습니다.(버젼에 따라 다를수도 있습니다)
기본적으로 한글에서 글과 그림을 따로 관리하기 때문에 따로따로 추출하는 방법은 있어도, 함께 추출하는 방법은 없습니다.
내부 통합된 셀은 추출할 순 있지만, 데이터 오류가 생기니 셀 병합을 다 풀고 추출하시는게 좋습니다.
0
안녕하세요, 인프런 AI 인턴입니다. 망고맛있어님 😊
한글 문서 내의 표를 자동화하여 이미지 파일로 추출하는 것은 꽤나 복잡한 작업일 수 있습니다. 각 부분을 자동화하기 위해 몇 가지 고려해야 할 점들을 정리해 보았습니다.
표 내부 셀에 그림과 텍스트 함께 추출하기:
- 일반적으로 표를 이미지로 추출할 경우, 표의 형태와 레이아웃만을 캡처할 수 있습니다. 표 내부의 그림과 텍스트 역시 캡처 대상이 되지만, 고해상도의 이미지를 얻으려면 표 자체를 캡처하는 것이 아니라, 각각의 그림과 텍스트 요소를 별도로 인식하고 추출하는 스크립트를 작성해야 할 수 있습니다. 이를 위해 일관된 레이아웃 구조를 사용하는 것이 중요합니다.
- 일반적으로 표를 이미지로 추출할 경우, 표의 형태와 레이아웃만을 캡처할 수 있습니다. 표 내부의 그림과 텍스트 역시 캡처 대상이 되지만, 고해상도의 이미지를 얻으려면 표 자체를 캡처하는 것이 아니라, 각각의 그림과 텍스트 요소를 별도로 인식하고 추출하는 스크립트를 작성해야 할 수 있습니다. 이를 위해 일관된 레이아웃 구조를 사용하는 것이 중요합니다.
통합된 셀 추출:
- 통합된 셀의 경우, 표를 추출할 때 셀 병합 상태를 유지하도록 하는 것이 중요합니다. 이를 위해 셀의 병합 상태를 인식하고, 병합 상태를 유지한 채로 이미지로 생성하는 기능이 필요합니다. 보통 이러한 기능은 한글 문서 API를 활용하여 구현할 수 있습니다.
- 통합된 셀의 경우, 표를 추출할 때 셀 병합 상태를 유지하도록 하는 것이 중요합니다. 이를 위해 셀의 병합 상태를 인식하고, 병합 상태를 유지한 채로 이미지로 생성하는 기능이 필요합니다. 보통 이러한 기능은 한글 문서 API를 활용하여 구현할 수 있습니다.
이 두 가지는 모두 기본적인 표 추출 기능을 넘어서, 문서 내부의 다양한 요소까지 포함해야 하므로, 특정 라이브러리나 한글 API를 활용할 수 있는지 검토해보는 것을 추천합니다. 현재의 한글 API와 파이썬을 통해 기본적인 추출은 가능하지만, 복잡한 레이아웃의 경우 별도의 추가 코딩이 필요할 수 있습니다.
관련 질문 안내: 아래의 질문들을 참고하시면, 좀 더 구체적인 해결책을 찾는데 도움이 될 수 있습니다.
현재 구체적인 방법이나 코드를 제공드리기는 어렵지만, 한글 API를 사용하여 더 깊이 있는 접근을 시도해 보실 수 있습니다. 한글 자동화 관련 강의를 통해 제공된 예제들을 기반으로, 필요한 기능을 확장해 보시는 것도 좋은 방법이 될 것입니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.






이해가 되었습니다. 친절하게 답변해주셔서 감사합니다!