inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[리뉴얼] 처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화 전과정 익히기) [데이터분석/과학 Part1]

pandas 라이브러리로 실제 데이터 전처리하기1 (업데이트)

두 데이터 프레임 합치 관련한 질문

203

jinkim1011

작성한 질문수 5

0

안녕하세요.

비디오 강의에서 9분 50초 정도에서 두개의 데이터 프레임을 left join을 통해서 합치는 과정이 있습니다.

doc 총 행은  -  37 entries

country_info 행은  - 3560 entries  정도입니다.

doc를 중심으로 left join을 할경우 최대 37개가 나오는게 맞을텐데요. 동영상 강좌 9분 57초에 보면 총 3333 entries 가 있습니다.

합친 행이 총 37개가 나와야 할텐데 이렇게 많은 행들이 나오는 것이 맞나요? 맞다면 왜 이런 방법으로 합치는지 궁금합니다.

pandas python

답변 1

0

잔재미코딩 DaveLee

안녕하세요.

 

doc 에는 각 날짜에 해당하는 나라이름과 확진자 수만 가져온 것이고, country_info 에는 별도 테이블을 통해, iso2 와 같은 나라정보를 가지고 옵니다. 나라이름이 다양해서, 동일한 나라인데도 다른 나라이름으로 카운팅이 되는 부분을 막기 위해, iso2 라는 나라기호를 가지고, 동일한 나라의 경우에는 나라이름이 달라도, 하나로 합치려고 doc 와 country_info 를 합쳤어요.

그런데, doc 에 Country_Region 의 값과 동일한 country_info 값이 많다보니까, 각 doc 의 Country_Region 값에 매칭되는 country_info 의 Country_Region 값을 일일이 다 개별 행으로 만들다보니, doc 는 37개 행인데, 3000개 이상의 행이 나온 것이긴 합니다. 어차피 목표는 다른 나라이름을 쓰더라도, iso2 값으로 합치기 위한 중간 과정이라서, 크게 left 로 하든, 또다른 방법으로 하든, 중간 과정에서는 매핑만을 신경쓴 것이긴 해서요. 다른 방법으로도 매핑만 된다면 괜찮을 것 같긴 합니다. 다만, left 를 쓴 의미는 꼭 left 에 있는 데이터는 있어야 하기 때문에 이렇게 작성하였습니다.

감사합니다.

Python 3 표시 없습니다.

0

72

1

강의실습 말고 강의에 대한 자료(pdf)가 없을까요?

0

87

1

구글 코랩과 아나콘다

0

105

1

강의와 다르게 오류가 뜨는 이유가 뭘까요?

0

115

1

COVID-19-master 관련 등 자료 누락

0

101

1

수업자료에 python_core_summary.ipynb 파일이 포함되어 있지 않습니다!

1

109

1

json.dumps관련된 질문

0

83

1

빅분기대비

0

118

1

파이썬으로 Plain Text 포멧 파일 다루기 연습문제 질문

0

100

1

강의자료 어디서 다운로드받나요?

0

150

1

pandas 라이브러리의 quotechar 인자에 대해 질문드립니다

0

107

1

iplot 에러 문제

1

209

1

플래그

0

79

1

플래그 라이브러리

0

91

1

CSV 파일 쓰기 다른 기법(사전 타입으로 쓰기) 관련

0

189

1

CSV 파일 읽을 때 오류

0

206

1

read() 함수 사용할 때 3번째 줄에 data로 출력 또는 print(data)로 출력 차이

0

140

1

강의 교재 및 실습 파일 제공되나요?

0

189

1

deep_data_and_visual 파일에서 에러가 납니다.

0

189

1

apply()함수

0

210

1

pandas groupby sum 질문

1

278

1

pandas_eda 자료 맨아래 heatmap 숫자가 안나옵니다

0

363

2

pandas_eda 힛맵에서 숫자가 안떠요

0

261

1

수업 자료에 pandas_basic 파일이 없습니다..!

0

284

1