inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

파이썬 증권 데이터 수집과 분석으로 신호와 소음 찾기

[2/2] 강의 관련 질문 드립니다. (csv 파일 실행시 글자깨짐)

1019

뀨구기

작성한 질문수 25

1

안녕하세요 선생님

'[2/2] 이거 하나면 코드 한줄로 krx 전체 종목 수집 가능?!' 강의 수강 후 csv 파일을 실행해보니

글자가 모두 깨져나오는 현상이 확인되는데 to_csv 할때 별도의 조치를 해주어야 하는걸까요?

쥬피터 노트북에서 pd.read_csv() 할때는 정상적으로 조회되고 있습니다.

df_krx.to_csv() python pandas 웹-크롤링 numpy matplotlib plotly 웹 스크래핑 seaborn

답변 1

0

박조은

안녕하세요.

pandas의 to_csv 는 인코딩 기본값이 utf-8로 되어 있어요.

그래서 엑셀에서 열려면 인코딩을 utf-8로 다시 지정해서 열어야 하는데 pandas 에서 저장할때 엑셀에서 바로 열리도록 인코딩을 설정할 수도 있습니다.

df.to_csv("파일명", encoding="cp949") 로 저장해 보세요.

엑셀에서 한글인코딩이 깨지지 않고 바로 보일거에요.

그 대신 해당 파일을  pandas 에서 읽어올 때도 read_csv 에  encoding="cp949" 옵션을 추가해서 불러와야 합니다.

pd.read_csv("파일명",  encoding="cp949")

0

뀨구기

답변해주셔서 감사합니다.

추가로 아직 뒷부분 내용을 모르지만,

저는 일할때 보통 엑셀 export 후 데이터 작업하는게 익숙해서 그러는데

일반적으로 cp949 를 활용하는 경우가 많을까요

아니면 파이썬 내에서 데이터를 처리하니까 활용되지 않는 경우가 많을까요...?

아 그리고 df_krx.to_csv("krx.csv", index=False, encoding="cp949")

이렇게는 안되는거 같은데 파일명 뒤에 옵션은 하나만 오는게 맞을까요?

0

박조은

안녕하세요. 인코딩은 어떤게 많다기 보다는 적합한걸 찾으시는 걸 추천해요.

엑셀을 사용할 일이 많다면 cp949로 저장할 때 저장하시고 불러올때도 cp949를 사용하신다면 크게 불편함은 없을거에요.

utf-8인코딩은 엑셀에서 읽어오려면 별도의 설정이 필요하기 때문에 편의에 따라 인코딩 사용을 추천해요!

0

뀨구기

df.to_csv("filename.csv", index=False, encoding="utf-8-sig")

이렇게 하면 정상적으로 저장되고 cp949 는 에러 발생하는데 무슨차이인지 헷갈리네요 ㅠㅜ

0

박조은

안녕하세요.

인코딩 방식의 차이인데요. cp949로 인코딩을 지정했는데 오류가 난다면 인코딩 할 수 없는 문자가 섞여있기 때문이에요. 그래서 utf-8-sig 로 저장하면 인코딩이 오류 없이 저장이 되기도 합니다.

cp949로 인코딩 할 수 없는 문자란 눈에 보이지 않는 BOM문자를 의미하는데요.

아래 문서를 참고해 보세요.

[바이트 순서 표식 - 위키백과, 우리 모두의 백과사전](https://ko.wikipedia.org/wiki/%EB%B0%94%EC%9D%B4%ED%8A%B8_%EC%88%9C%EC%84%9C_%ED%91%9C%EC%8B%9D)

또 인코딩에 대한 내용은 아래 링크의 영상을 보시는 걸 추천해요.

[(풀버젼) Ep(39) 알아둬도 쓸데없는 인코딩의 역사 - YouTube](https://www.youtube.com/watch?v=DLdYa_w_7zs)

cufflinks 버전문제로 iplot() 미실행

0

57

2

[수정요청]직접 수집한 주가 데이터로 시각화해보기

0

70

2

pd.read_html(url, encoding='cp949') 에러

0

95

2

fdr.StockListing('KRX') 문제 발생

0

179

2

주식 자동매매 프로그램 제작 관련 조언 부탁드립니다

0

454

1

concat 을 통한 데이터 프레임 합치기 에러 문의

0

117

2

한글폰트 관련해서 문의드립니다.

0

244

2

데이터프레임 칼럼명 문의 드립니다.

0

249

3

금융데이터 수집의 모든것

0

153

2

녹화시점과 현재시점 컬럼명이 변경이 많이 되었을까요?

0

199

2

파이썬 증권 데이터 수집과 분석으로 신호와 소음 찾기 - 섹션1 [2/2]

0

182

1

Mac 환경에서 nbextensions 활성화 하는 방법

0

605

2

pd.concat(result.tolist()) 오류 문의

0

253

1

5.1 제약 데이터 수집 오류 해결

0

242

1

Table of contents 문의드립니다

0

222

2

concat을 통한 데이터프레임 합치기

0

560

2

Reindexing only valid with uniquely valued Index objects 오류 질문입니다.

0

499

1

데이터 비교시 데이터 불일치

0

420

1

dtype={"itemcode": np.object}) 을 dtype={"itemcode": object}) 으로 변경해야 하나요?

0

605

1

질문 : for문 풀어쓰기

0

501

1

파이참에서 Plotly 그래프 실행방법

0

1321

1

5.1 데이터프레임 병합(merge)

0

753

2

쥬피터노트북에서 실행파일 만들기

0

1459

1

주피터노트북 확장팩 설치가 안됩니다.

0

572

2