결측값 채우지관련해서
안녕하십니까?
결측값 채우기 중 최빈값 관련해서,,
m = X_train['workclass'].mode()[0]
여기서 mode()과 mode()[0]의 차이는 무엇인지요?
즉 [0]의 쓰임이 무엇인지? 다른 중앙값, 평균 등은 이런게
없는데 왜 최빈값만 이런게 뒤에 붙는지요?
답변 2
0
sum()과 mean(): 값을 반환해요
mode()는 시리즈 형태로 반환해요
이유는 사과가 5개, 배가 5개, 딸기가 2개가 있을 때
최빈값은 사과와 배 2개로 나와요, 값만 반환한다면 모두 표현할 수가 없습니다.
여러 개를 반환할 수 있게 하기 위해서 시리즈 형태로 반환하고
만약 한 개라면 인덱스[0]을 붙여서 첫번째 값만 반환 받는 것이에요~
화이팅 입니다 :)
0
안녕하세요, 인프런 AI 인턴입니다.
kccjjang 님의 질문에 대해 답변드리겠습니다. mode() 함수와 mode()[0]의 사용법에 대한 궁금증을 해결하는데 도움이 될 만한 내용을 찾았습니다.
Pandas의 mode() 함수는 데이터에서 가장 빈번하게 나타나는 값을 찾는데 사용됩니다. 이 함수는 최빈값이 하나 이상일 가능성이 있어, 결과로 시리즈(Series)를 반환할 수 있습니다. 만약 여러 개의 최빈값이 있다면, 그 중 첫 번째 값을 선택하기 위해 [0] 인덱스를 사용합니다. 평균값(mean())이나 중앙값(median())과는 달리, 이들은 항상 하나의 숫자만 반환하기 때문에 추가적인 인덱스가 필요하지 않습니다.
kccjjang 님의 경우에 해당되는 유사한 질문으로, 강의 수강생이 mode() 함수 뒤에 [0]을 사용하는 이유에 대해 문의한 내용이 있었습니다. 해당 수강생에게 제공된 답변을 참조하면, 이해에 도움이 될 것입니다:
- 최빈값 채우기 관련 질문 - 여기서 강사님은
mode()함수가 반환할 수 있는 여러 결과 중 첫 번째 값을 선택하기 위해[0]을 사용한다고 설명하고 있습니다.
이 설명이 kccjjang 님의 질문에 대한 답변이 되었으면 합니다. 저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
1유형 강의 다 나간 후 어떻게 할까요?
0
16
1
점수차가 많이 나는데 따로 하신게 있으신가요?
0
13
1
작업형1 모의문제 4번에 3)문제 질문
0
22
2
이상치 전처리 작업
0
25
2
평가결과값 문의
0
29
2
시계열 데이터 날짜와 시간 format
0
36
2
평가지표 F1 스코어 질문드립니다.
0
27
2
작업형 2 기출7회분에서
0
38
2
작업형2 모의문제1 (30강)
0
34
2
수강 기간 연장 문의 드립니다.
0
42
2
수강 계획과 관련해 문의 드립니다.
0
30
2
작업형1 - 연습문제 16~39 풀이는 몇강을 보면 되나요?
0
50
2
작업형 1 -연습문제 4-6
0
38
2
작업형 1 유형 부분
0
42
2
작업형 1 (삭제예정, 구 버전)
0
51
2
수강기간 연장 문의드립니다.
0
38
2
2유형 레이블 인코딩 VS 원핫 인코딩
0
37
3
수강기간 연장 문의드립니다.
0
45
2
인덱스 슬라이싱
0
37
2
질문 드립니다.
0
50
2
강의 내용 관련 질문드립니다~
0
46
2
수강 연장 문의
0
63
2
강의자료 일괄 다운로드
0
62
2
수강기간 연장 문의드립니다
0
48
2





