강의 0:24초 질문
284
작성한 질문수 3
안녕하세요.
강의 정말 잘 듣고 있습니다.
다름이 아니라, 영상의 24초 쯤에 나오는 merged_order을 만들기 위해서, orders 와 payments의 info()를 확인하여 보면,

다음과 같습니다. 저희가 merged 함수를 배울때에는 기본 default가 inner join 이라고 배웠었는데, orders의 데이터 갯수는 99441 개 이고,
payment의 데이터 갯수는 103886 개 입니다. 이때, inner join이므로, 데이터의 갯수는 99441 개를 넘을 수 없습니다.
그러나, 두개의 데이터를 merge 한 merged_order의 데이터 갯수는 100739 개 입니다. 제가 놓친 부분이 있으면 알려주시면 감사드리겠습니다.
추가적으로, null 데이터의 갯수를 세어보았더니, 0개로 반환되어집니다.

감사합니다.
답변 1
0
안녕하세요.
그것은 제가 해당 예를 붙잡고 깊게 해당 데이터까지 분석하며 보여드리지는 못하지만, order_id 를 기준으로 병합할 때, orders 에서 특정 order_id 에 해당하는 payments 행이 여러개가 있을 경우, 각 order_id 마다 병합이 되어, 기존 orders 행 숫자보다 많아질 수 있을 것 같습니다.
이와 유사한 현상에 대해 pandas 라이브러리로 실제 데이터 전처리하기3 의 질문/답변란에 하나의 예를 분석해서 최대한 상세히 설명을 드렸는데요. 이 부분도 한 번 확인해보시면 어떨까요?
감사합니다.
Python 3 표시 없습니다.
0
51
1
강의실습 말고 강의에 대한 자료(pdf)가 없을까요?
0
64
1
구글 코랩과 아나콘다
0
78
1
강의와 다르게 오류가 뜨는 이유가 뭘까요?
0
94
1
COVID-19-master 관련 등 자료 누락
0
81
1
수업자료에 python_core_summary.ipynb 파일이 포함되어 있지 않습니다!
1
94
1
json.dumps관련된 질문
0
70
1
빅분기대비
0
110
1
파이썬으로 Plain Text 포멧 파일 다루기 연습문제 질문
0
92
1
강의자료 어디서 다운로드받나요?
0
137
1
pandas 라이브러리의 quotechar 인자에 대해 질문드립니다
0
96
1
iplot 에러 문제
1
199
1
플래그
0
74
1
플래그 라이브러리
0
81
1
CSV 파일 쓰기 다른 기법(사전 타입으로 쓰기) 관련
0
177
1
CSV 파일 읽을 때 오류
0
189
1
read() 함수 사용할 때 3번째 줄에 data로 출력 또는 print(data)로 출력 차이
0
135
1
강의 교재 및 실습 파일 제공되나요?
0
177
1
deep_data_and_visual 파일에서 에러가 납니다.
0
180
1
apply()함수
0
199
1
pandas groupby sum 질문
1
269
1
pandas_eda 자료 맨아래 heatmap 숫자가 안나옵니다
0
348
2
pandas_eda 힛맵에서 숫자가 안떠요
0
252
1
수업 자료에 pandas_basic 파일이 없습니다..!
0
274
1





