inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

단 두 장의 문서로 데이터 분석과 시각화 뽀개기

서울 코로나19 발생동향 분석하기 오류발생

해결된 질문

321

김홍래

작성한 질문수 1

1

안녕하세요.

강의 잘 듣고 서울 코로나19 발생동향 분석하기 들어가서

[1/25] 판다스 단 한 줄로 서울시 코로나19 발생동향 크롤링하기 부터 막혔습니다.

만드신 시점과 현재 시점간 차이로 인해 서울시 웹페이지가 바뀐 것 같은데

필요한 정보 부분에서 읽어오지를 못하네요.

table[3].T

Out[3]: 

Empty DataFrame

Columns: []

Index: [연번, 환자, 확진일, 거주지, 여행력, 접촉력, 퇴원현황]

보시는 것처럼 DataFrame은 비어있고 Index만 읽어왔습니다.

그리고 csv 파일은 다운로드 받았더니 character set이 안맞았는지 글자가 다 깨져 있습니다.

제가 뭘 알아서 해보기에는 할 수 있는게 없어서 글 올립니다.

python pandas

답변 4

1

박조은

도움이 되었으면 좋겠어요! 감사합니다 :)

1

김홍래

헉!!!  찾아가는 서비스! 말로만 듣던 찾아가는 서비스라니...

친절하게 질문에 답변을 주신 것만으로도 감사했는데... 

후속 서비스까지 너무 너무 감동입니다. 감사합니다.

0

박조은

안녕하세요.

변경된 내용을 가져오는 부록강좌를 추가했습니다.

부록강좌를 통해 변경된 내용을 수집해 보실 수 있습니다.

0

박조은

안녕하세요!

사이트가 바뀌어서 당황하셨겠어요.

데이터를 수집하다보면 이번처럼 사이트가 변경되는일이 잦은 편이에요.

최근에는 코로나 확진자 수가 증가함에 따라 사이트의 속도 개선 문제로 변경이 된것 같아요.

csv파일을 다운로드 받았을 때 엑셀로 열어보셨다면 아마 깨져보일거에요.

그 이유는 인코딩이 utf-8로 되어 있는데 엑셀의 인코딩은 cp949이기 때문에요.

이건 저장할 때 옵션을 사용하면 엑셀에서 한글이 깨지지 않도록 할 수 있어요.

제가 올려드린 csv 파일이 아래 파일인데요. 

아래 url에 파일이 업로드 되어 있어서 아래 코드로 해당 파일을 불러와서 실습을 하실 수 있어요.

2번 eda파일로 실습을 진행해 주시면 됩니다. input 파일에도 적어두었지만 아래 코드로 데이터를 읽어올 수가 있어요.

기본적으로 pd.read_csv 로 데이터를 읽어오면 utf-8 이라는 인코딩으로 불러오게 됩니다.

df =  pd.read_csv("https://raw.githubusercontent.com/corazzon/cracking-the-pandas-cheat-sheet/master/seoul-covid19_6_30_.csv") 

또, 11월 11일 일자 기준으로 수집해 놓은 파일이 있어서 최근 내용으로 실습을 하고자 하시면 아래 경로에 있는 파일로 실습을 해주세요.

https://raw.githubusercontent.com/corazzon/cracking-the-pandas-cheat-sheet/master/seoul-covid19-11_11_.csv

수업[3/25] 부터 진행해 주세요.

변경된 사이트 내용은 판다스로 읽어올 수 있는 방법이 아니라 11월 중으로 해당 내용을 업데이트 할 계획입니다.

날짜변환 에러

0

259

0

업로드자료 오류

1

373

1

20강 관련 문의드립니다.

1

299

1

17강 도입부 실습사이트 문의

2

298

1

4강 코드 오류메세지 관련 질의

1

374

2

merge와 그룹바이 관련 질문이 있습니다.

1

494

3

쉬운 도서 추천 좀 부탁드립니다.

2

393

2

1강2강에 있는 csv파일을 다운받으면 한글이 깨져서 나와요

1

251

1

주피터노트북 목록(contents) 만들기

1

632

1

df.loc[df["거주지"].isin(gu), "지역"] = df["거주지"] 질문있습니다

1

207

1

월 주 함꼐 value_counts()

1

223

1

day_count.iloc[i]와 day_count[i]의 차이 질문

1

350

1

df 인덱싱 질문입니다

1

184

1

그래프에 한글제목을 나타내고 싶습니다.

1

535

1

배운 것 기반으로 만들어보고 있는데 질문이 있습니다.

1

404

5

질문이요

1

300

1

set_index()

1

287

1

timeit 관련 질문

1

363

1

그래프 밑에 제목을 넣으려면 어떡해야하나요???

1

421

2

한글폰트 설치 후 나오지 않는 현상 문의

1

1171

3

CSV 파일 불러오기

1

571

1

크롤링으로 csv파일 가져오기

2

317

1

영상에서 소개해주시는 웹사이트

2

258

1

질문

1

228

2