결측값 채우지관련해서
안녕하십니까?
결측값 채우기 중 최빈값 관련해서,,
m = X_train['workclass'].mode()[0]
여기서 mode()과 mode()[0]의 차이는 무엇인지요?
즉 [0]의 쓰임이 무엇인지? 다른 중앙값, 평균 등은 이런게
없는데 왜 최빈값만 이런게 뒤에 붙는지요?
답변 2
0
sum()과 mean(): 값을 반환해요
mode()는 시리즈 형태로 반환해요
이유는 사과가 5개, 배가 5개, 딸기가 2개가 있을 때
최빈값은 사과와 배 2개로 나와요, 값만 반환한다면 모두 표현할 수가 없습니다.
여러 개를 반환할 수 있게 하기 위해서 시리즈 형태로 반환하고
만약 한 개라면 인덱스[0]을 붙여서 첫번째 값만 반환 받는 것이에요~
화이팅 입니다 :)
0
안녕하세요, 인프런 AI 인턴입니다.
kccjjang 님의 질문에 대해 답변드리겠습니다. mode() 함수와 mode()[0]의 사용법에 대한 궁금증을 해결하는데 도움이 될 만한 내용을 찾았습니다.
Pandas의 mode() 함수는 데이터에서 가장 빈번하게 나타나는 값을 찾는데 사용됩니다. 이 함수는 최빈값이 하나 이상일 가능성이 있어, 결과로 시리즈(Series)를 반환할 수 있습니다. 만약 여러 개의 최빈값이 있다면, 그 중 첫 번째 값을 선택하기 위해 [0] 인덱스를 사용합니다. 평균값(mean())이나 중앙값(median())과는 달리, 이들은 항상 하나의 숫자만 반환하기 때문에 추가적인 인덱스가 필요하지 않습니다.
kccjjang 님의 경우에 해당되는 유사한 질문으로, 강의 수강생이 mode() 함수 뒤에 [0]을 사용하는 이유에 대해 문의한 내용이 있었습니다. 해당 수강생에게 제공된 답변을 참조하면, 이해에 도움이 될 것입니다:
- 최빈값 채우기 관련 질문 - 여기서 강사님은
mode()함수가 반환할 수 있는 여러 결과 중 첫 번째 값을 선택하기 위해[0]을 사용한다고 설명하고 있습니다.
이 설명이 kccjjang 님의 질문에 대한 답변이 되었으면 합니다. 저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
질문 드립니다.
0
37
2
강의 내용 관련 질문드립니다~
0
34
2
수강 연장 문의
0
31
1
강의자료 일괄 다운로드
0
41
2
수강기간 연장 문의드립니다
0
28
1
list 문제 질문드립니다~
0
28
2
빅분기 실기 12회 재도전
0
39
1
강의 기간 연장 가능여부 검토 요청건
0
30
1
수강기간 연장 문의 드립니다
0
36
2
수강기간 연장 문의드립니다
0
47
2
질문이요
0
51
2
수강기간 연장 문의드립니다.
0
49
2
문제 3-2 질문드립니다
0
43
2
수강기간 연장 문의 드립니다.
0
58
2
변수, 칼럼 , df 구분
0
48
2
수강기간 연장 문의드립니다.
0
49
2
수강기간 연장 문의
0
46
2
수강기간 연장 문의드립니다.
0
40
2
수강기한 연장 문의
0
76
2
수강기간 연장 문의드립니다
0
57
2
결정트리에서 적절한 깊이 선택 후 시각화 과정에서 학습 데이터만 사용하는 이유
0
44
2
수강기간 연장 문의드립니다.
0
70
2
수강연장 문의
0
76
2
수강연장문의
0
53
2





