inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[리뉴얼] 처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화 전과정 익히기) [데이터분석/과학 Part1]

최종 전처리 데이터로 그래프 만들기1 (업데이트)

최종 전치리 데이터로 그래프 만들기1 - 3분 20초 쯤 질문입니다.

231

katherine

작성한 질문수 5

0

이  country_info = pd.read_csv("COVID-19-master/csse_covid_19_data/UID_ISO_FIPS_LookUp_Table.csv", encoding='utf-8-sig', keep_default_na=False, na_values='')

country_info.head() 작업 전에,

country_info[country_info['Country_Region'] == 'Namibia']로 확인을 해보았습니다.

아무 것도 하지 않은 상태에서 확인 했을 때도, Namibia의 ios2는 NA 인데요. 다른 ios3 등 다른 모든 열의 정보가 

그렇기 때문에,

country_info = pd.read_csv("COVID-19-master/csse_covid_19_data/UID_ISO_FIPS_LookUp_Table.csv", encoding='utf-8-sig', keep_default_na=False, na_values='') 으로 인해 무엇이 변경 되었는지 이해가 되지 않고 와닿지가 않습니다.

또한, na_values=' ' 로 설정했다면 Namibia 의 ios2의 값은 공란이어야 하는 것 아닌가요? 영상 설명이 조금 짧은 듯 하여, 부가 설명을 부탁 드리고자 합니다!

항상 감사합니다:)

pandas python

답변 1

0

잔재미코딩 DaveLee

안녕하세요.

이 부분은 영상에서 설명을 드린 부분인데요. 아마 정보가 많고, 익숙하지 않으셔서 전체 영상의 정보가 아직은 한번에 와닿지 않으셔서 그런 것 같습니다. 그럴 때에는 다시 반복해보시면, 조금씩 익숙해지면서, 이전에는 캐취가 안됬던 정보가 이해가 되실꺼예요. 이 경우, 영상은 비쥬얼과 음성 둘다로 설명하기 때문에, 글로 쓰는 부분보다 훨씬 이해도가 높고, 이를 글로 써서는 오히려 더 이해가 가지 않게 됩니다. 그래서 다시 반복해보시는 것이 가장 좋습니다. 

글로 다시 작성한다면, 영상에서 설명드린 것처럼,

keep_default_na=False 이면, 결측값을 포함한 행들은 삭제를 하도록 하였는데요.

그런데, 이 결측치라는 것이 '' 없는 값도 있고, NA 라고 쓰기도 하고, NaN 이라고도 쓰기도 합니다. 그런데, 본 데이터 중 NA 라는 값이 들어있는 Nambia 행에서 NA 는 결측치를 뜻하는 것이 아니라, 실제 국가명이죠. 그래서 해당 데이터를 삭제하지 않도록 결측치는 '' 없는 값이 있는 필드만을 의미한다, (NA 라고 쓴 부분은 결측치가 아니다) 라는 의미로, na_values='' 라고 명시해준 것입니다.

감사합니다.

Python 3 표시 없습니다.

0

51

1

강의실습 말고 강의에 대한 자료(pdf)가 없을까요?

0

64

1

구글 코랩과 아나콘다

0

78

1

강의와 다르게 오류가 뜨는 이유가 뭘까요?

0

94

1

COVID-19-master 관련 등 자료 누락

0

81

1

수업자료에 python_core_summary.ipynb 파일이 포함되어 있지 않습니다!

1

94

1

json.dumps관련된 질문

0

70

1

빅분기대비

0

110

1

파이썬으로 Plain Text 포멧 파일 다루기 연습문제 질문

0

92

1

강의자료 어디서 다운로드받나요?

0

137

1

pandas 라이브러리의 quotechar 인자에 대해 질문드립니다

0

96

1

iplot 에러 문제

1

199

1

플래그

0

74

1

플래그 라이브러리

0

81

1

CSV 파일 쓰기 다른 기법(사전 타입으로 쓰기) 관련

0

177

1

CSV 파일 읽을 때 오류

0

189

1

read() 함수 사용할 때 3번째 줄에 data로 출력 또는 print(data)로 출력 차이

0

135

1

강의 교재 및 실습 파일 제공되나요?

0

177

1

deep_data_and_visual 파일에서 에러가 납니다.

0

180

1

apply()함수

0

199

1

pandas groupby sum 질문

1

269

1

pandas_eda 자료 맨아래 heatmap 숫자가 안나옵니다

0

348

2

pandas_eda 힛맵에서 숫자가 안떠요

0

252

1

수업 자료에 pandas_basic 파일이 없습니다..!

0

274

1