강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

jingnyo님의 프로필 이미지
jingnyo

작성한 질문수

[리뉴얼] 처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화 전과정 익히기) [데이터분석/과학 Part1]

pandas 라이브러리로 실제 데이터 전처리하기1 (업데이트)

09:05 ~ 09:20

작성

·

175

0

09:05
doc에는 2020년 1월 22일 데이터의 나라이름, 확진자수만 가져온 것이고,
country_info는 그 나머지 column들을 프레임으로 만든 것인가요 ??
 
09:20 에서
country_info 변수에는 UID_ISO_FIPS_:ookUp_Table.csv 이 부분을 가르치시면서 이 테이블 정보가 들어가 있겠죠 하시는게 정확히 무슨 파일과 정보가 들어가 있는건지 이해를 못하겠습니다.
 
데일리 리포트 파일인 1월 22일 파일과 UID_ISO_FIPS_:ookUp_Table.csv 파일이 무슨 관계인건가요 ??
UID_ISO_FIPS_:ookUp_Table.csv 이 파일은 국가 이미지를 가져오기 위한 국가기호가 정리된 파일이라고 보면 되려나요...?

답변 1

0

안녕하세요.

 

1. 말씀하신대로, doc 에는 각 날짜에 해당하는 나라이름과 확진자 수만 가져온 것이고,

country_info 에는 별도 테이블을 통해, iso2 와 같은 나라정보를 가지고 옵니다.

해당 테이블의 상세 정보는 9:05 ~ 9:20 정도까지에서 화면으로도 보실 수 있으실꺼예요.

 

2. 다운로드받으신 UID_ISO... 이 파일 자체를 오픈해보셔도 좋으실 것 같아요.

아니면, 위 정보로 보셔도 좋은데요. 결국 해당 파일은 각 나라 이름과 이를 3글자 기호로 표기한 iso2 와 같은 정보를 가지고 있습니다. 그래서 말씀하신대로, doc 는 나라이름:확진자수, country_info 는 나라이름:iso2 정보를 가지고 있어서, 최종적으로 나라이름:확진자수:iso2 와 같은 형태의 데이터를 만들려고 하는 것이예요.

나라이름이 동일한 나라이름을 여러이름으로 쓰는 경우가 있어서, 한 나라에 대한 확진자수가 다른 나라로 계산되는 것을 막기 위함입니다.

 

감사합니다.

jingnyo님의 프로필 이미지
jingnyo

작성한 질문수

질문하기