강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

윤태현님의 프로필 이미지
윤태현

작성한 질문수

단 두 장의 문서로 데이터 분석과 시각화 뽀개기

1강2강에 있는 csv파일을 다운받으면 한글이 깨져서 나와요

작성

·

235

1

1. 제목 그대로 입니다. csv파일 한글이 엑셀에서 깨져서 보여요.
 
2. code에서 utf8로 했을때 에러가 나는데 cp949로 하면 에러가 안 나기도 하고요.
차이좀 알수 있을까요?

답변 1

0

박조은님의 프로필 이미지
박조은
지식공유자

안녕하세요.

우리가 사용하는 파일에는 인코딩을 지정하게 되는데요.

한글 윈도우의 인코딩은 cp949 입니다.

하지만 pandas 로 cp949 의 한글 인코딩을 pd.read_csv 의 기본 값으로 읽어오면 인코딩 오류가 발생합니다.

pandas의 기본 인코딩은 utf-8 로 되어 있습니다.

인코딩에 대한 좀 더 자세한 설명은 다음 링크를 참고해 보세요!

[문자 인코딩 - 위키백과, 우리 모두의 백과사전](https://ko.wikipedia.org/wiki/%EB%AC%B8%EC%9E%90_%EC%9D%B8%EC%BD%94%EB%94%A9)

[UTF-8 - 위키백과, 우리 모두의 백과사전](https://ko.wikipedia.org/wiki/UTF-8)

윤태현님의 프로필 이미지
윤태현

작성한 질문수

질문하기