inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[리뉴얼] 처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화 전과정 익히기) [데이터분석/과학 Part1]

EDA/pandas/시각화로 이커머스 고객 상세 분석하기 (업데이트)

EDA/pandas/시각화로 이커머스 고객 상세 분석하기 강의 질문

358

jdo5640

작성한 질문수 10

0

실제 이 강의의 초반3분 안에 customers['customer_unique_id'].value_counts().max() 을 실행하면 17이라는 값이 나왔고 customers['customer_id'].value_counts().max()를 실행하면 1이라는 값이 나와 customer_id에는 중복이 없고 customer_unique_id에는 중복이 있음을 확인했었습니다.

그런데 본 강의의 3분정도에서 customers['customer_id'].nunique() 을 출력하면 99441이 나오고 customers['customer_unique_id'].nunique()을 출력하면 96096이 나오는데

customer_unique_id에서 중복된 것들을 다 제외시키면 customer_id의 값이 나와야 되는것 아닌지가 궁금합니다. 어떻게 이 customers['customer_unique_id'].nunique() 구문의 값이 99441이 아닌 96096이 나오게 되는지 궁금합니다. 이러면 customer_id에도 중복이 있다는 소리 아닌가요?

 

강사님께서 강의중에 96096이라는 숫자를 가르키시며 잘못작성하셨다고 했는데 제가 실행해도 96096이라는 숫자가 나와서요,,,ㅠ

python pandas

답변 1

0

잔재미코딩 DaveLee

안녕하세요. 답변 도우미입니다.

테스트가 조금 복잡하긴 해서, 전에 분석을 해서, 설명을 드린 것이 기억이 조금 흐릿하긴 한데요.

데이터 분석 결과로만 봤을 때 customer_id 는 중복은 안되고, 99441개의 데이터가 있는 것으로 이해가 되고요. customer_unique_id 는 중복이 일부 있고, 유니크한 ID 는 96096 개가 있다고 확인이 됩니다. 둘다 전체 카운트는 다음과 같이 동일하고요. 이 중에 customer_unique_id 는 중복이 있다보니, 유니크한 ID 는 96096 개밖에 안된다고 확인이 됩니다. 감사합니다.

print (customers['customer_id'].count())

print (customers['customer_unique_id'].count())

99441

99441

Python 3 표시 없습니다.

0

58

1

강의실습 말고 강의에 대한 자료(pdf)가 없을까요?

0

70

1

구글 코랩과 아나콘다

0

84

1

강의와 다르게 오류가 뜨는 이유가 뭘까요?

0

102

1

COVID-19-master 관련 등 자료 누락

0

87

1

수업자료에 python_core_summary.ipynb 파일이 포함되어 있지 않습니다!

1

98

1

json.dumps관련된 질문

0

72

1

빅분기대비

0

112

1

파이썬으로 Plain Text 포멧 파일 다루기 연습문제 질문

0

94

1

강의자료 어디서 다운로드받나요?

0

139

1

pandas 라이브러리의 quotechar 인자에 대해 질문드립니다

0

102

1

iplot 에러 문제

1

200

1

플래그

0

76

1

플래그 라이브러리

0

85

1

CSV 파일 쓰기 다른 기법(사전 타입으로 쓰기) 관련

0

180

1

CSV 파일 읽을 때 오류

0

193

1

read() 함수 사용할 때 3번째 줄에 data로 출력 또는 print(data)로 출력 차이

0

136

1

강의 교재 및 실습 파일 제공되나요?

0

181

1

deep_data_and_visual 파일에서 에러가 납니다.

0

182

1

apply()함수

0

201

1

pandas groupby sum 질문

1

272

1

pandas_eda 자료 맨아래 heatmap 숫자가 안나옵니다

0

353

2

pandas_eda 힛맵에서 숫자가 안떠요

0

255

1

수업 자료에 pandas_basic 파일이 없습니다..!

0

277

1