결측값 채우지관련해서
안녕하십니까?
결측값 채우기 중 최빈값 관련해서,,
m = X_train['workclass'].mode()[0]
여기서 mode()과 mode()[0]의 차이는 무엇인지요?
즉 [0]의 쓰임이 무엇인지? 다른 중앙값, 평균 등은 이런게
없는데 왜 최빈값만 이런게 뒤에 붙는지요?
답변 2
0
sum()과 mean(): 값을 반환해요
mode()는 시리즈 형태로 반환해요
이유는 사과가 5개, 배가 5개, 딸기가 2개가 있을 때
최빈값은 사과와 배 2개로 나와요, 값만 반환한다면 모두 표현할 수가 없습니다.
여러 개를 반환할 수 있게 하기 위해서 시리즈 형태로 반환하고
만약 한 개라면 인덱스[0]을 붙여서 첫번째 값만 반환 받는 것이에요~
화이팅 입니다 :)
0
안녕하세요, 인프런 AI 인턴입니다.
kccjjang 님의 질문에 대해 답변드리겠습니다. mode() 함수와 mode()[0]의 사용법에 대한 궁금증을 해결하는데 도움이 될 만한 내용을 찾았습니다.
Pandas의 mode() 함수는 데이터에서 가장 빈번하게 나타나는 값을 찾는데 사용됩니다. 이 함수는 최빈값이 하나 이상일 가능성이 있어, 결과로 시리즈(Series)를 반환할 수 있습니다. 만약 여러 개의 최빈값이 있다면, 그 중 첫 번째 값을 선택하기 위해 [0] 인덱스를 사용합니다. 평균값(mean())이나 중앙값(median())과는 달리, 이들은 항상 하나의 숫자만 반환하기 때문에 추가적인 인덱스가 필요하지 않습니다.
kccjjang 님의 경우에 해당되는 유사한 질문으로, 강의 수강생이 mode() 함수 뒤에 [0]을 사용하는 이유에 대해 문의한 내용이 있었습니다. 해당 수강생에게 제공된 답변을 참조하면, 이해에 도움이 될 것입니다:
- 최빈값 채우기 관련 질문 - 여기서 강사님은
mode()함수가 반환할 수 있는 여러 결과 중 첫 번째 값을 선택하기 위해[0]을 사용한다고 설명하고 있습니다.
이 설명이 kccjjang 님의 질문에 대한 답변이 되었으면 합니다. 저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
뒤로가기 버튼 같은 것이 있나요?
0
27
1
강의 연장 문의
0
31
1
출력값 질문
0
31
2
수업노트가 어디에 있나요?
0
29
1
실기시험 제출관련
0
160
2
6.20 작업형 2 과적합
0
169
3
코딩팡 장업형2 베이스 라인 인코딩 종류 질문
0
52
2
로지스틱회귀, 회귀
0
52
2
회귀 문제를 풀때 질문입니다.
0
59
1
불균형 처리 후 성능이 더 낮아졌다면,
0
66
2
실기 체험 제2유형 에러 문의
0
66
1
LIGHTGBM 으로 하면 pred값이 소수점 6자리까지 나오는게 맞나요
0
52
2
3번문제 등분산 가정
0
50
2
작업형3 target 형 변환 질문
0
38
2
[작업형1] 연습문제 섹션1 ~ 10 의 section4
0
40
3
원핫인코딩과 레이블 인코딩에서 concat
0
62
2
제2유형 질문입니다.
0
49
2
C()
0
44
2
작업형 2에서 strafity 적용 유무
0
53
2
수강 기간 연장 가능 여부 문의드립니다.
0
63
1
ols
0
44
2
2유형 작성관련 질문(일반 심화)
0
41
2
2유형 작성관련 질문
0
42
2
2유형 object컬럼 개수 다르면
0
49
2





