inflearn logo
강의

Course

Instructor

Python Excel Programming - with xlsxwriter

Handling Hangul Files

split

Resolved

340

specialzoker1534

4 asked

0

splitdata = data.split('><')

이렇게 쓰면 >< 가 나오는 부분에 대해 나누게 되는데 

'<' 따로, '> '따로 나누는 방법은 없나요??

python XlsxWriter

Answer 7

0

Hojun Lee

영상에 나와있는 것처럼 하시면 data가 s입니다.

코드는 마지막 부분을('splitData = data.split('><')'을 지워주시고) 아래와 같이 수정해주시면 됩니다.

splitData = [i.strip().replace('<''').replace('>'''for i in data.replace('\n''').replace('\r''').split('><')]
print(splitData)

0

Hojun Lee

앗! 죄송합니다.

아래처럼 사용하시면 data에 깔끔하게 나와요.

더욱 정교하게 하시려면 정규표현식을 사용하셔야 할 것 같습니다.

s = '''         \r<강 사 관 리 카 드>\r
< 1. 강사 인적 사항>\r
<소  속><직 위><성 명><주민등록번호>\r
'''
data = [i.strip().replace('<''').replace('>'''for i in s.replace('\n''').replace('\r''').split('><')]
print(data)

0

specialzoker1534

제가 전체 문서에서 주민번호가 있어서 요것만 보여드렸는데 s 데다가 인풋한 전체 한글문서를 넣으려면 어떻게 해야하나요???

아 이거 때매 진도를 못나가네요

0

specialzoker1534

에러납니다 ㄷㄷㄷ

0

specialzoker1534

AttributeError                            Traceback (most recent call last)
<ipython-input-81-bee58776a64c> in <module>
      3 with ole.open('./data/입사지원서.hwp') as f:
      4     print(f.get_stream('PrvText').read().decode('utf-16le'))
----> 5 splitdata = [i.strip() for i in data.split('><').split('<').split('>')]
      6 #splitdata = data.split('><')
      7 

AttributeError: 'list' object has no attribute 'split'

0

Hojun Lee

splitdata = [i.strip() for i in data.split('><').split('<').split('>')]

위와 같이 작성하시면 모든 공백이 사라집니다.

\n과 \r은 이스케이프 문자로 strip 내장 매서드로 공백과 함께 지울 수 있어요.

0

specialzoker1534

split을 하지 않았을때 

<강 사 관 리 카 드>
< 1. 강사 인적 사항>
<소  속><직 위><성 명><주민등록번호>

'><' 로 split을 했을때

'      \r\n<강 사 관 리 카 드>\r\n< 1. 강사 인적 사항>\r\n<소  속',
 '직 위',
 '성 명',
 '주민등록번호>\r\n<

요렇게 나옵니다
중간에 >\r\n< 를 없애고 싶어서요 ㄷㄷㄷ

0

Hojun Lee

splitdata = data.split('<').split('>')

이렇게 하시면 <와 >를 구분하여 split합니다.

그런데 원하시는 해답이 이게 아니실 것 같기도 합니다.

1. 입력값

2. 출력값

위 2개에 예시에 대한 구체적인 질문을 해주시면 좋을 것 같아요.

감사합니다.

메일보내기 할 때 에러..

0

40

0

강의자료 어디서 확인하나요

0

50

1

강의 자료 위치

0

272

1

invalid index to scalar variable 오류 발생 해결법 알려주세요

0

3227

1

파이썬으로 엑셀 암호걸기

0

683

0

한글 파일이 길면 불러왔을때 내용이 잘립니다.

0

392

0

add_format

0

217

0

왜 에러가 나는지 모르겠어요

0

1692

4

주피터 노트북 화면이 안나와요

0

2669

2

jupyter notebook

0

279

1

저장할 폴더 지정방법

0

360

1

ole-py 설치가 안됩니다.

0

289

1

질문드립니다.

0

244

1

저장이 특정 폴더가 아니라 여기만 존쟈하는 드라이브로 들어갑니다

0

171

1

대시보드에 글자가 안뜹니다

0

242

1

powershell창 열기가 안뜹니다

0

585

1

크롤링 URL이 강의 하실 때와 달리 그래프가 추가되어 질문드립니다.

0

175

1

완성된 코드는 어디서 다운로드 받을 수 있나요? 작성하다가 어디서 잘못됐는지 모르겠어서 원본코드랑 비교해보려고합니다.

0

211

0

리눅스 명령이 먹히질 않아요.

0

267

1

쥬피터 실행이 안돼요

0

298

1

선택지1에 해당하는 엑셀 문서 만드는 소스

0

258

0

touch , ls 명령어 오류.. ?

0

687

1

구름ide 실행.. ?

0

661

3

주피터 노트북 파일 공유 어떻게 볼수 있을까요?

1

749

1