inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

직장인에게 꼭 필요한 파이썬-아래아한글 자동화 레시피

LaTeX 문자열을 MathML로 변환하여 한/글에 삽입하기

혹시 현재 제어중인 hwpx파일의 xml을 불러올 수 있을까요?

해결된 질문

582

한글치트키

작성한 질문수 5

1

★새로 연 빈 문서의 xml을 불러오는 방법만 알고싶습니다.★

 

기존문서는 zip -> sele..?0.xml을 열면 되서 상관없는데,

저장되지않은 새 문서는 어떻게 하는지 궁금하네요 ㅎㅎ

 -> 이걸로 해결했습니다.

hwp.GetTextFile(Format="HWPML2X", option="")

# 이외 추가질문입니다.

이번주 목요일 5기 강사로 가시는데, 아쉽게도 신청을 못했네요 ㅠㅠ
역시 다음 기회를 봐야겠죠?

python 한컴오피스

답변 2

1

일코

레몬민트님 안녕하세요?^^

 

맞아요!! 저도 그 방법을 알려드리려고 했는데..

엄청 스피드하시네요ㅎ

참고로 특정 영역의 XML만 파이썬으로 불러오시려면

option에 "saveblock" 파라미터를 넣으시면 돼요.

표 같은 거 파싱할 때 저도 자주 쓰는 메서드예요.

 

(하지만 이것도 이미 알고 계실 듯요^^;)

 

행복한 하루 되세요!

1

한글치트키

저는 BeautifulSoup(xml, 'xml')로 파싱해서 사용하고 있어요!

표 데이터프레임으로 만드는 메서드 잘 봤습니다 ^^

 

테스트해보니까 셀병합일땐 df가 제대로 안나와서 이거 주의해야겠네요 🙂

 

즐거운 하루 되세요!

1

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다. LemonMint - Pengui 님.

새롭게 연 빈 문서의 XML을 불러오는 방법에 대해 질문 주셨네요. 현재 제어 중인 HWPX 파일의 XML을 불러오는 방법에 대해 아래와 같이 참고해 보세요.

Step 1: 새로운 한컴오피스 문서를 연 후 XML 구조 접근

import os
import zipfile
from pyhwpx import Hwp

# 한컴오피스 객체 생성 및 새 문서 열기
hwp = Hwp()
hwp.NewDocument()

# 새 문서 파일을 임시 저장
temp_file = "temp_hwpx_file.hwpx"
hwp.SaveAs(temp_file)

# ZIP 형식으로 파일 열기
with zipfile.ZipFile(temp_file, 'r') as zip_ref:
    # XML 파일 추출 (content.hpf 또는 세부 XML 파일)
    xml_content = zip_ref.read('Contents/content.xml')

# 추출한 XML 내용을 출력하거나 파싱
print(xml_content.decode('utf-8'))

# 임시 파일 삭제
os.remove(temp_file)

위 코드는 새로 생성된 한컴오피스 문서를 temp_hwpx_file.hwpx라는 임시 파일로 저장한 후, ZIP 형식으로 열어 XML 파일을 추출하는 방식입니다. 이 방법으로 원하시는 내용을 얻을 수 있을 것입니다.

기존 게시판에 유사한 질문이 올라온 적이 있습니다. 아래 링크를 참고해 주시기 바랍니다:
- 질문: “선택된 특정 탭 편집”
- 질문: “hwp.Open() 파일을 찾을 수 없습니다.”

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

섹션7과 같은 수학 수식을 백지에서 시작할 때 어떻게 만들 수 있을까요?

0

76

1

hwp 병렬 작업시 클립보드 충돌문제

0

58

1

본문을 각주로 내리는 법

1

93

1

한글 자동화 삽도 삽입!!

1

384

2

한글 표 내부 위치 찾는 코드좀 알려주세요 ㅠㅠ

1

233

2

빈 문서를 새로 열때는 팝업이 안나오는데 기존 문서를 열면 팝업이 나옵니다

1

118

2

사무실 컴퓨터ㅠ

0

96

2

글자입력 여러번 실행기

0

67

1

현재 커서 문단에 아무런 내용이 없는지 확인하기

1

102

1

특정 스타일을 찾아 이동하는 방법

1

162

2

한/글 파일 open 시 '상위 버전에서...' 메세지 안 뜨게 하는 방법?

1

1108

1

win32com 으로 hwp 문자열 검색하기 문의

1

222

2

[응용] 엑셀문서 값을 필드에 입력하기 질

1

123

1

표 병합하기 관련

0

140

0

메타태그 삽입 자동화

0

191

1

스크립트 매크로 초기화 하고 싶습니다.

1

270

2

한글 창이 여러 개 존재할 때 pyhwpx 모듈로 접근하는 방법을 알고 싶습니다.

1

271

1

표안의 특정 필드에 있는 이미지를 복사하여 한글 외부에 저장하기

1

273

2

스타일 싹 다 지우고 바탕글로 통일하는 방법 문의드립니다.

1

283

0

하위의 여러 폴더 중 특정폴더의 사진만 추출하기

1

345

2

한글 수식을 자동으로 넣는 코드를 만들었는데, 수식 사이의 간격이 계속 벌어집니다.

1

658

1

보유 특허 검색 페이지에서 검색이 되지 않습니다.

1

138

1

hwp 페이지별 분할 저장하는 코드 관련 문의

0

447

0

한글 문서에 사용된 폰트명 추출

1

646

1