inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

(삭제 예정, 구 버전) 작업형1 모의문제2

섹션3 작업형1 모의고사 풀어보기 1-3 문제 질문드립니다

해결된 질문

257

sonovan

작성한 질문수 3

0

안녕하세요~

섹션3 작업형1 모의고사 풀어보기 1-3 문제에서 '고유한 값'이 가장 많은 칼럼을 구하라고 했는데,

 

고유한 값이라는게 중복 데이터가 아닌 값들의 갯수를 구하는 건가요?

 

지금 이해가 안가는게 뭐냐면, nuique함수를 쓰면 고유한 값의 갯수가 400 이상 되는데, 실제로 data의 크기는 (5,31)니까 고유한 값은 최대 5개 이상 안되는거 아닌가요??

nuique가 어떤 값을 의미하는지 잘 모르겠습니다..

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 3

1

sonovan

아 제가 착각했네요; 데이터의 크기가 5,31이 아니라 569,31이었네요 !

0

퇴근후딴짓

네 맞아요. 중복은 제외한 고유값 맞습니다.

nunique() 가 고유값을 세어주고 있어요

 

혹시 추가로 궁금하다면 댓글 부탁드립니다 🙂 화이팅!!

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다.

total1997님의 섹션3 작업형1 모의고사 풀어보기 1-3 문제와 관련된 “고유한 값이 가장 많은 칼럼 구하기” 질문에 대해 답변 드립니다.

Pandas의 nunique() 함수는 특정 컬럼(Series) 또는 DataFrame 전체에 대해 고유한 값의 개수를 세어주는 함수입니다. 즉, 중복을 제외한 값들의 개수를 알려줍니다. 고유한 값의 개수가 400 이상이라는 말씀이시라면, 해당 데이터셋의 특정 컬럼이 400이상의 고유한 값을 가진다는 의미일 수 있습니다. 데이터의 크기가 (5,31)이라는 것은 5행 31열이므로, 데이터 전체가 5개의 고유 값만을 가진다는 의미가 아니라, 각각의 컬럼이 최대 5개의 고유한 값을 가진다는 의미입니다. nunique()가 적용되는 범위에서 컬럼 별로 고유한 값의 개수를 세므로, 전체 데이터의 크기와는 별개로 각 컬럼의 고유한 값 개수를 알 수 있습니다.

nunique 함수 사용법에 대해서 궁금하신 점이 있으신 것 같으니, 유사한 맥락의 해답을 참고하실 수 있는 링크를 드립니다. 여기서 비슷한 문제를 다룬 질문과 그에 대한 답변이 포함되어 있습니다:

  • nunique에 관해 문의 드려요. - 이 글에서는 nunique() 함수를 활용하여 데이터셋 내에서 고유한 값의 개수를 파악하는 과정에 대한 질문과 이에 대한 답변이 이루어지고 있습니다. 특정 컬럼의 고유한 값 개수를 구하는 방법에 대한 예시와 설명이 포함되어 있어 유사한 문제에 대한 이해를 돕는데 도움이 될 것입니다.

제가 제공한 링크는 nunique() 함수의 사용법 및 데이터 내 고유한 값의 개수를 구하는 방법에 대한 이해를 돕기 위해 추천드리는 자료입니다. 질문자님이 말씀하신 문제 상황과 정확히 일치하지 않을 수 있지만, 고유한 값의 개수를 파악하는 방법과 관련된 질문에 대한 해법을 이해하는 데 도움이 될 것입니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

작업형2 카테고리

0

8

1

110강 회귀_8번 문의

0

9

2

XGBRegressor 학습 시 warning 출력

0

13

2

데이터 프레임을 변경해도 되나요?

0

10

2

10회 기출 작업형3 문제 2-1 질문

0

16

2

작업형 2 질문

0

16

2

작업형 2 템플릿 확인 요청

0

13

2

작업형2 인코딩 질문

0

22

2

작업형 3 벼락치기 공부방법 질문

0

31

2

기출 11회 작업형 2_전체 데이터 학습 여부

0

32

2

예측값 결과 소수점 차이

0

28

2

기출 문제와 실전챌린지 연습문제 무엇부터 푸는게 나은가요?

0

35

1

전처리 train() test([ ])

0

23

2

작업형 1 배경지식 질문

0

33

2

옳게 풀은건지 질문드립니다!

0

22

1

roc_auc_score

0

30

2

추가질문 합니다

0

22

2

시험환경 구름

0

21

2

2유형 질문드려요

0

21

2

RandomForest vs lgb

0

30

2

전처리 관련질문

0

29

3

작업형3 기출

0

21

2

유형2에서 데이터분할 생략 가능여부

0

33

2

9회 기출 유형3 질문

0

21

2