한PDF에서 PDF파일을 한글 파일로 변환시키는 부분을 파이썬 코드를 통해 자동화시킬 수 있을까요?
안녕하세요 일코님
좋은 강의를 해주셔서 감사합니다.
제가 지금 하고 있는 작업은 한글파일이 pdf파일로 변환된 파일을 다시 한글파일로 변환하는 것입니다.
이때, 한PDF를 사용하면 한글파일로 아주 나이스하게 변환되는 것을 보고
이걸 파이썬으로 자동화할 수 없을까 고민하고 있습니다.
pdf를 일반 파이썬 라이브러리로 읽어와서 text로 변환하는 코드말고
한pdf의 기능을 이용하여 pdf를 한글파일로 바로 변경할 수 있는 라이브러리나 코드가 있을까요?
늘 감사드립니다
답변 2
1
윤정님, 안녕하세요?
아쉽게도 한PDF는 별도의 win32 API를 사용하는 방법을 모르겠습니다..
다만, 아래아한글에서 PDF를 열면, (추측컨대 한PDF와 유사한 변환과정을 통해서)
hwp 포맷으로 읽어올 수는 있습니다.

도움이 되었으면 좋겠습니다.
행복한 하루 되세요^^
1
안녕하세요, 인프런 AI 인턴입니다.
박윤정님의 질문에 대해 직접적으로 대답할 수 있는 정보가 있습니다. “PDF 문서를 HWP 문서로 변환하는 방법”에 대해 문의하신 것으로 보입니다. 이와 유사한 내용에 대한 답변이 “PDF 문서를 HWP 문서로 변환하는 방법이 있나요?” 토픽에서 이미 제공되었습니다. 이 게시물에서는 파이썬을 사용하여 PDF 파일을 한글 파일로 자동 변환하는 두 가지 방법에 대해 설명되어 있습니다.
pyhwpx 모듈 이용: 이 방법은
pyhwpx라는 모듈을 이용하여 PDF 파일을 한글 문서(HWP)로 변환하는 방법입니다.pyhwpx를 설치한 후, 아래와 같은 코드를 이용하여 PDF 파일을 열 수 있습니다.# pyhwpx 모듈을 이용하는 방법 # pip install pyhwpx from pyhwpx import Hwp hwp = Hwp() hwp.open_pdf("./sample.pdf")pywin32 페키지 이용: 이 방법은 Windows COM Automation을 지원하는
pywin32패키지를 사용합니다. 이를 통해 한/글의 OLE 자동화 기능을 사용하여 PDF 파일을 변환합니다.# pywin32 페키지를 이용하는 방법 # pip install pywin32 import win32com.client as win32 hwp = win32.gencache.EnsureDispatch("hwpframe.hwpobject") hwp.XHwpWindows.Item(0).Visible = True pset = hwp.HParameterSet.HFileOpenSave hwp.HAction.Run("CallPDFConverter") hwp.HAction.GetDefault("FileOpenPDF", pset.HSet) pset.Attributes = 0 pset.filename = "c:\\users\\user\\desktop\\sample.pdf" pset.OpenFlag = 0 hwp.HAction.Execute("FileOpenPDF", pset.HSet)
자세한 내용은 게시글에서 확인하실 수 있으며, 실행 환경에 따라 코드에 소소한 수정이 필요할 수 있습니다.
이 방법들을 이용해 PDF 파일을 한글 파일(HWP)로 변환하는 자동화 작업을 수행할 수 있습니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
섹션7과 같은 수학 수식을 백지에서 시작할 때 어떻게 만들 수 있을까요?
0
76
1
hwp 병렬 작업시 클립보드 충돌문제
0
59
1
본문을 각주로 내리는 법
1
93
1
한글 자동화 삽도 삽입!!
1
384
2
한글 표 내부 위치 찾는 코드좀 알려주세요 ㅠㅠ
1
233
2
빈 문서를 새로 열때는 팝업이 안나오는데 기존 문서를 열면 팝업이 나옵니다
1
118
2
사무실 컴퓨터ㅠ
0
96
2
글자입력 여러번 실행기
0
67
1
현재 커서 문단에 아무런 내용이 없는지 확인하기
1
102
1
특정 스타일을 찾아 이동하는 방법
1
164
2
한/글 파일 open 시 '상위 버전에서...' 메세지 안 뜨게 하는 방법?
1
1112
1
win32com 으로 hwp 문자열 검색하기 문의
1
222
2
[응용] 엑셀문서 값을 필드에 입력하기 질
1
123
1
표 병합하기 관련
0
140
0
메타태그 삽입 자동화
0
191
1
스크립트 매크로 초기화 하고 싶습니다.
1
270
2
한글 창이 여러 개 존재할 때 pyhwpx 모듈로 접근하는 방법을 알고 싶습니다.
1
271
1
표안의 특정 필드에 있는 이미지를 복사하여 한글 외부에 저장하기
1
274
2
스타일 싹 다 지우고 바탕글로 통일하는 방법 문의드립니다.
1
283
0
하위의 여러 폴더 중 특정폴더의 사진만 추출하기
1
346
2
한글 수식을 자동으로 넣는 코드를 만들었는데, 수식 사이의 간격이 계속 벌어집니다.
1
660
1
보유 특허 검색 페이지에서 검색이 되지 않습니다.
1
139
1
hwp 페이지별 분할 저장하는 코드 관련 문의
0
448
0
한글 문서에 사용된 폰트명 추출
1
647
1





