• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

1강2강에 있는 csv파일을 다운받으면 한글이 깨져서 나와요

22.02.22 18:59 작성 조회수 120

1

1. 제목 그대로 입니다. csv파일 한글이 엑셀에서 깨져서 보여요.
 
2. code에서 utf8로 했을때 에러가 나는데 cp949로 하면 에러가 안 나기도 하고요.
차이좀 알수 있을까요?

답변 1

답변을 작성해보세요.

0

안녕하세요.

우리가 사용하는 파일에는 인코딩을 지정하게 되는데요.

한글 윈도우의 인코딩은 cp949 입니다.

하지만 pandas 로 cp949 의 한글 인코딩을 pd.read_csv 의 기본 값으로 읽어오면 인코딩 오류가 발생합니다.

pandas의 기본 인코딩은 utf-8 로 되어 있습니다.

인코딩에 대한 좀 더 자세한 설명은 다음 링크를 참고해 보세요!

[문자 인코딩 - 위키백과, 우리 모두의 백과사전](https://ko.wikipedia.org/wiki/%EB%AC%B8%EC%9E%90_%EC%9D%B8%EC%BD%94%EB%94%A9)

[UTF-8 - 위키백과, 우리 모두의 백과사전](https://ko.wikipedia.org/wiki/UTF-8)