혹시 현재 제어중인 hwpx파일의 xml을 불러올 수 있을까요?
★새로 연 빈 문서의 xml을 불러오는 방법만 알고싶습니다.★
기존문서는 zip -> sele..?0.xml을 열면 되서 상관없는데,
저장되지않은 새 문서는 어떻게 하는지 궁금하네요 ㅎㅎ
-> 이걸로 해결했습니다.
hwp.GetTextFile(Format="HWPML2X", option="")
# 이외 추가질문입니다.
이번주 목요일 5기 강사로 가시는데, 아쉽게도 신청을 못했네요 ㅠㅠ
역시 다음 기회를 봐야겠죠?
답변 2
1
레몬민트님 안녕하세요?^^
맞아요!! 저도 그 방법을 알려드리려고 했는데..
엄청 스피드하시네요ㅎ
참고로 특정 영역의 XML만 파이썬으로 불러오시려면
option에 "saveblock" 파라미터를 넣으시면 돼요.
표 같은 거 파싱할 때 저도 자주 쓰는 메서드예요.
(하지만 이것도 이미 알고 계실 듯요^^;)
행복한 하루 되세요!
1
저는 BeautifulSoup(xml, 'xml')로 파싱해서 사용하고 있어요!
표 데이터프레임으로 만드는 메서드 잘 봤습니다 ^^
테스트해보니까 셀병합일땐 df가 제대로 안나와서 이거 주의해야겠네요 🙂
즐거운 하루 되세요!
1
안녕하세요, 인프런 AI 인턴입니다. LemonMint - Pengui 님.
새롭게 연 빈 문서의 XML을 불러오는 방법에 대해 질문 주셨네요. 현재 제어 중인 HWPX 파일의 XML을 불러오는 방법에 대해 아래와 같이 참고해 보세요.
Step 1: 새로운 한컴오피스 문서를 연 후 XML 구조 접근
import os
import zipfile
from pyhwpx import Hwp
# 한컴오피스 객체 생성 및 새 문서 열기
hwp = Hwp()
hwp.NewDocument()
# 새 문서 파일을 임시 저장
temp_file = "temp_hwpx_file.hwpx"
hwp.SaveAs(temp_file)
# ZIP 형식으로 파일 열기
with zipfile.ZipFile(temp_file, 'r') as zip_ref:
# XML 파일 추출 (content.hpf 또는 세부 XML 파일)
xml_content = zip_ref.read('Contents/content.xml')
# 추출한 XML 내용을 출력하거나 파싱
print(xml_content.decode('utf-8'))
# 임시 파일 삭제
os.remove(temp_file)
위 코드는 새로 생성된 한컴오피스 문서를 temp_hwpx_file.hwpx라는 임시 파일로 저장한 후, ZIP 형식으로 열어 XML 파일을 추출하는 방식입니다. 이 방법으로 원하시는 내용을 얻을 수 있을 것입니다.
기존 게시판에 유사한 질문이 올라온 적이 있습니다. 아래 링크를 참고해 주시기 바랍니다:
- 질문: “선택된 특정 탭 편집”
- 질문: “hwp.Open() 파일을 찾을 수 없습니다.”
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
섹션7과 같은 수학 수식을 백지에서 시작할 때 어떻게 만들 수 있을까요?
0
76
1
hwp 병렬 작업시 클립보드 충돌문제
0
58
1
본문을 각주로 내리는 법
1
93
1
한글 자동화 삽도 삽입!!
1
384
2
한글 표 내부 위치 찾는 코드좀 알려주세요 ㅠㅠ
1
233
2
빈 문서를 새로 열때는 팝업이 안나오는데 기존 문서를 열면 팝업이 나옵니다
1
118
2
사무실 컴퓨터ㅠ
0
96
2
글자입력 여러번 실행기
0
67
1
현재 커서 문단에 아무런 내용이 없는지 확인하기
1
102
1
특정 스타일을 찾아 이동하는 방법
1
162
2
한/글 파일 open 시 '상위 버전에서...' 메세지 안 뜨게 하는 방법?
1
1108
1
win32com 으로 hwp 문자열 검색하기 문의
1
222
2
[응용] 엑셀문서 값을 필드에 입력하기 질
1
123
1
표 병합하기 관련
0
140
0
메타태그 삽입 자동화
0
191
1
스크립트 매크로 초기화 하고 싶습니다.
1
270
2
한글 창이 여러 개 존재할 때 pyhwpx 모듈로 접근하는 방법을 알고 싶습니다.
1
271
1
표안의 특정 필드에 있는 이미지를 복사하여 한글 외부에 저장하기
1
273
2
스타일 싹 다 지우고 바탕글로 통일하는 방법 문의드립니다.
1
283
0
하위의 여러 폴더 중 특정폴더의 사진만 추출하기
1
345
2
한글 수식을 자동으로 넣는 코드를 만들었는데, 수식 사이의 간격이 계속 벌어집니다.
1
658
1
보유 특허 검색 페이지에서 검색이 되지 않습니다.
1
138
1
hwp 페이지별 분할 저장하는 코드 관련 문의
0
447
0
한글 문서에 사용된 폰트명 추출
1
646
1





