inflearn logo
강의

Khóa học

Chia sẻ kiến thức

Chinh phục phân tích và trực quan hóa dữ liệu chỉ với hai trang tài liệu

서울 코로나19 발생동향 분석하기 오류발생

Đã giải quyết

321

hrkim712466

1 câu hỏi đã được viết

1

안녕하세요.

강의 잘 듣고 서울 코로나19 발생동향 분석하기 들어가서

[1/25] 판다스 단 한 줄로 서울시 코로나19 발생동향 크롤링하기 부터 막혔습니다.

만드신 시점과 현재 시점간 차이로 인해 서울시 웹페이지가 바뀐 것 같은데

필요한 정보 부분에서 읽어오지를 못하네요.

table[3].T

Out[3]: 

Empty DataFrame

Columns: []

Index: [연번, 환자, 확진일, 거주지, 여행력, 접촉력, 퇴원현황]

보시는 것처럼 DataFrame은 비어있고 Index만 읽어왔습니다.

그리고 csv 파일은 다운로드 받았더니 character set이 안맞았는지 글자가 다 깨져 있습니다.

제가 뭘 알아서 해보기에는 할 수 있는게 없어서 글 올립니다.

python pandas

Câu trả lời 4

1

todaycode

도움이 되었으면 좋겠어요! 감사합니다 :)

1

hrkim712466

헉!!!  찾아가는 서비스! 말로만 듣던 찾아가는 서비스라니...

친절하게 질문에 답변을 주신 것만으로도 감사했는데... 

후속 서비스까지 너무 너무 감동입니다. 감사합니다.

0

todaycode

안녕하세요.

변경된 내용을 가져오는 부록강좌를 추가했습니다.

부록강좌를 통해 변경된 내용을 수집해 보실 수 있습니다.

0

todaycode

안녕하세요!

사이트가 바뀌어서 당황하셨겠어요.

데이터를 수집하다보면 이번처럼 사이트가 변경되는일이 잦은 편이에요.

최근에는 코로나 확진자 수가 증가함에 따라 사이트의 속도 개선 문제로 변경이 된것 같아요.

csv파일을 다운로드 받았을 때 엑셀로 열어보셨다면 아마 깨져보일거에요.

그 이유는 인코딩이 utf-8로 되어 있는데 엑셀의 인코딩은 cp949이기 때문에요.

이건 저장할 때 옵션을 사용하면 엑셀에서 한글이 깨지지 않도록 할 수 있어요.

제가 올려드린 csv 파일이 아래 파일인데요. 

아래 url에 파일이 업로드 되어 있어서 아래 코드로 해당 파일을 불러와서 실습을 하실 수 있어요.

2번 eda파일로 실습을 진행해 주시면 됩니다. input 파일에도 적어두었지만 아래 코드로 데이터를 읽어올 수가 있어요.

기본적으로 pd.read_csv 로 데이터를 읽어오면 utf-8 이라는 인코딩으로 불러오게 됩니다.

df =  pd.read_csv("https://raw.githubusercontent.com/corazzon/cracking-the-pandas-cheat-sheet/master/seoul-covid19_6_30_.csv") 

또, 11월 11일 일자 기준으로 수집해 놓은 파일이 있어서 최근 내용으로 실습을 하고자 하시면 아래 경로에 있는 파일로 실습을 해주세요.

https://raw.githubusercontent.com/corazzon/cracking-the-pandas-cheat-sheet/master/seoul-covid19-11_11_.csv

수업[3/25] 부터 진행해 주세요.

변경된 사이트 내용은 판다스로 읽어올 수 있는 방법이 아니라 11월 중으로 해당 내용을 업데이트 할 계획입니다.

날짜변환 에러

0

259

0

업로드자료 오류

1

373

1

20강 관련 문의드립니다.

1

299

1

17강 도입부 실습사이트 문의

2

298

1

4강 코드 오류메세지 관련 질의

1

374

2

merge와 그룹바이 관련 질문이 있습니다.

1

494

3

쉬운 도서 추천 좀 부탁드립니다.

2

393

2

1강2강에 있는 csv파일을 다운받으면 한글이 깨져서 나와요

1

252

1

주피터노트북 목록(contents) 만들기

1

633

1

df.loc[df["거주지"].isin(gu), "지역"] = df["거주지"] 질문있습니다

1

207

1

월 주 함꼐 value_counts()

1

226

1

day_count.iloc[i]와 day_count[i]의 차이 질문

1

351

1

df 인덱싱 질문입니다

1

184

1

그래프에 한글제목을 나타내고 싶습니다.

1

535

1

배운 것 기반으로 만들어보고 있는데 질문이 있습니다.

1

404

5

질문이요

1

301

1

set_index()

1

287

1

timeit 관련 질문

1

363

1

그래프 밑에 제목을 넣으려면 어떡해야하나요???

1

421

2

한글폰트 설치 후 나오지 않는 현상 문의

1

1173

3

CSV 파일 불러오기

1

573

1

크롤링으로 csv파일 가져오기

2

320

1

영상에서 소개해주시는 웹사이트

2

260

1

질문

1

229

2