inflearn logo
강의

Course

Instructor

[Renewal] Python Data Analysis for Beginners (Easy! Master the entire process of preprocessing, pandas, and visualization) [Data Analysis/Science Part 1]

Preprocessing Real-World Data with the pandas Library 1 (Updated)

country_info 질문!

257

Jin

13 asked

0

해당 강의에서 country_info 테이블과 01월22일 코로나 현황 테이블을 left merge 했는데 그렇다면 좌측에 둔 01월 22일 코로나 현황의 컬럼들과 겹치는 컬럼들만 나와야 하는거 같은데 결과값에서  country_info 컬럼 전부가 나오는 이유가 궁금합니다!

python pandas

Answer 2

0

Jin

이렇게 해당 dataframe은 doc 이라는 변수에 할당했습니다 

그리고 이렇게 country_info 도 가져왔습니다 

위 dataframe 두개를 left merge 한 자료입니다. 강사님 강의 자료에서 그대로 캡처해왔습니다! 

test_df = pd.merge(doc, country_info, how='left', on='Country_Region')

이렇게 되면 왼쪽 테이블과 오른쪽 테이블 모두의 컬럼을 가져오는 것은 이해했습니다.

이렇게 left merge 식을 쓰면 왼쪽  테이블에 있는 정보는 모두 다 가져오고 오른쪽 테이블에서는 기준이 되는 컬럼 즉, 여기서는 Country_Region 의 컬럼값이 왼쪽과 같은 행만 가져오는것으로 알고 있습니다 

그렇게 되면 doc을 출력해보면 총 37행이고 country_info를 출력해보면 3000행을 넘어가던데 두 merge 값인 test_df 가 어떻게 3332행이 나올 수 있는 건가요? 왼쪽에 맞춰야하면 기본적으로 왼쪽 테이블의 모든 값을 다 가져오고 이에 겹치는 오른쪽 행들이 있다해도 37줄이 나와야 하는게 아닌가요?

0

funcoding

안녕하세요. 우선 어느 강의에서 몇분몇초에 나온 부분을 말씀하시는 것인지를 꼭 말씀부탁드립니다. 

말씀하신 질문을 제가 잘 이해한 것인지는 모르겠지만, merge 에 대해 설명드린 강의에서 보시면, 특정 컬럼명으로 left merge 를 했을 때, 왼쪽 특정 컬럼값을 기준으로, 해당 컬럼값이 동일한 행들만 가져오게 되고, 각 행에 있는 컬럼들은 모두 가져오게 되어 있습니다. 관련 강의를 다시 한번 보시면 이해가 되실 것 같습니다. 

감사합니다.

Python 3 표시 없습니다.

0

54

1

강의실습 말고 강의에 대한 자료(pdf)가 없을까요?

0

66

1

구글 코랩과 아나콘다

0

80

1

강의와 다르게 오류가 뜨는 이유가 뭘까요?

0

97

1

COVID-19-master 관련 등 자료 누락

0

82

1

수업자료에 python_core_summary.ipynb 파일이 포함되어 있지 않습니다!

1

95

1

json.dumps관련된 질문

0

71

1

빅분기대비

0

112

1

파이썬으로 Plain Text 포멧 파일 다루기 연습문제 질문

0

93

1

강의자료 어디서 다운로드받나요?

0

138

1

pandas 라이브러리의 quotechar 인자에 대해 질문드립니다

0

98

1

iplot 에러 문제

1

200

1

플래그

0

75

1

플래그 라이브러리

0

83

1

CSV 파일 쓰기 다른 기법(사전 타입으로 쓰기) 관련

0

179

1

CSV 파일 읽을 때 오류

0

192

1

read() 함수 사용할 때 3번째 줄에 data로 출력 또는 print(data)로 출력 차이

0

136

1

강의 교재 및 실습 파일 제공되나요?

0

180

1

deep_data_and_visual 파일에서 에러가 납니다.

0

181

1

apply()함수

0

201

1

pandas groupby sum 질문

1

271

1

pandas_eda 자료 맨아래 heatmap 숫자가 안나옵니다

0

350

2

pandas_eda 힛맵에서 숫자가 안떠요

0

254

1

수업 자료에 pandas_basic 파일이 없습니다..!

0

276

1