inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

공공데이터로 파이썬 데이터 분석 시작하기

[1/20] 공공데이터 포털의 신규민간아파트 분양가 데이터셋 소개와 다운로드

선생님....

386

daram

작성한 질문수 16

1

저는 데이터파일을 불러오는게 너무 힘들어서 ㅜㅜ

제가 가진다른 데이터를불러오기 연습했는데 자꾸 에러만나요ㅜ

유니코드 에러라서 유니코드도 쓰고ㅜㅜ

engine="python"도 해봤을때 똑같았어요ㅜㅜ

무엇이 문제인가요ㅜㅜ

pandas numpy python

답변 6

1

daram

앗! 저 파일이 제가 다른데서 쓰다가 잘못된건가봐요! 다른 파일로 엑셀잘 불러졌습니다! 수업시간에 데이터 불러오는데 너무 그때 바로 안되고 혼동이와서 1강에 대한 수업 다 듣구 제가 가진 파일을 불러와본거에요! 강의에서 배운걸 나중에 써먹을수 있어야 유용하니까요 ㅜ

1

daram

보시면 cp494를 인코딩해도 오류가 나요ㅜㅜ 무엇이 문제인가요 ㅜㅜ

0

박조은

네 잘 해결되었다니 다행이네요.

다른 파일로 실습해 보시는 것도 좋습니다.

계속 화이팅 입니다 :)

0

박조은

데이터 파일을 불러오는게 힘들어서 다른 파일을 불러오셨다고 하셨는데

수업에서 사용한 파일을 먼저 로드해 보시고 안 되면 도움을 드릴 수 있을거 같아요.

0

박조은

안녕하세요.

해당 파일을 다운로드 받은 곳에 가면 파일의 인코딩 정보가 나와있을거에요.

해당 파일의 인코딩은 오류메시지만을 보고 알수 없습니다.

올려주신 오류 메시지로 제가 알 수 있는것은 utf-8과 cp949 인코딩이 아니라는 점이에요.

해당 파일의 출처에서 인코딩 정보를 찾아보세요.

0

박조은

안녕하세요.

데이터마다 인코딩이 다르게 저장이 되기 때문에 해당 인코딩으로 불러와야 하는데요.

기본적으로 판다스는 인코딩을 지정하지 않으면 utf-8 이라는 인코딩으로 불러오게 됩니다.

하지만 보통 엑셀 등에서 한글이 들어간 파일을 저장하게 되면 cp949 로 저장이 되는 편입니다.

옵션에 encoding="cp949" 를 사용했는데도 같은 오류가 난다면 아마도 다른 인코딩일 확률이 높습니다.

우선 encoding="cp949" 를 지정해 보시는걸 권장드려요.

패키지 설치 에러 ydata-profiling

0

119

2

자세한 설명 부탁드려요 ㅜ

0

176

2

seaborn 라이브러리 호출하였으나 그래프가 안 그려져요

0

285

2

value_counts와 count 차이

0

340

2

안녕하세요 데이터 최신과 관련해서 문의드립니다.

0

204

3

scatterplot질문

0

122

1

강의 화면이 안나옵니다

0

164

2

4분12초 2013년부터 데이터가 없으면 어떻게하나요?..

0

187

2

에러 메시지

1

303

2

그래프 색이 동일하게 나옵니다.

0

308

2

시각화 라이브러리 비교

0

382

2

주피터 노트북 설치

0

390

1

2. 상가 기술통계 아웃풋 자료에서 오류가 납니다

0

226

1

14. distplot g = sns.FacetGrid(df_last, row="지역명", height=1.7, aspect=4) g.map(sns.distplot, "평당분양가격", hist=False, rug=True); 오류

0

178

1

group by agg function failed 에러

0

686

2

빈도수가 1000개 이상인 데이터를 따로 담을 때 코드 질문 있습니다.

0

288

2

주피터 노트북 실행 했는데 앞에 *가 생기고 결과가 나오지 않아요

0

363

3

get_string함수에서 문자 'nan'

0

200

1

seaborn X축 시작 지점 조정 질의의 건

0

212

1

14강 distplot 질의

0

289

1

nbextension 설치 및 셋팅 후 적용이 안되는 이슈

0

475

1

corr = df.corr() 입력시 오류

1

371

1

keyword grid_b is not recognized

0

333

1

%ls data 매직커맨드 사용시 한글 깨짐

0

290

1