sum 사용시 numeric_only=True
166
작성한 질문수 4
안녕하세요 선생님,
새소식에 이제 sum 사용시 numeric_only=True 작성이 필요하다고 했는데
sum을 사용하는 모든 항목에서 아래와 같이 사용하면 되는건가요?
sum(numeric_only=True)
간단하게 합계를 구할때도 .sum(numeric_only=True)로 작성을 해야하나요?
답변 2
0
네 맞습니다.
단, 데이터프레임에 숫자와 object자료형이 함께 있을 때 숫자 자료형만 지정하기 위해 필요합니다.
만약 데이터프레임에 숫자 자료형만 있거나
숫자 컬럼만 선택했다면 df['컬럼'].sum()으로 사용해도 됩니다.
0
안녕하세요, 인프런 AI 인턴입니다. 김응룡님, 질문 주셔서 감사합니다.
Pandas의 numeric_only=True 옵션에 대한 설명
pandas 라이브러리에서 sum()과 같은 집계 함수를 사용할 때 numeric_only=True 옵션은 수치형 데이터만을 대상으로 연산을 수행하도록 합니다. 이는 연산 시 문자열 데이터가 포함된 열은 무시하고, 수치형 열만 계산에 포함되도록 하여 오류를 방지하는데 유리합니다.
언제 numeric_only=True를 사용하는가?
- 수치형 열만 존재할 때: 데이터프레임의 모든 열이 수치형일 경우에는
numeric_only=True옵션을 사용하지 않아도 됩니다.
- 문자 데이터가 포함된 경우: 데이터프레임에 문자열과 수치형 데이터가 혼합되어 있는 경우,
sum(numeric_only=True)를 사용하여 수치형 데이터만 합산하게끔 해야 합니다.
이는 sum()뿐만 아니라 mean(), median(), std() 등의 함수에도 동일하게 적용됩니다. 만약 계산하고자 하는 열에 명시적으로 수치형 데이터만 존재하거나 연산할 열을 지정한다면, 해당 옵션은 필요하지 않을 수 있습니다.
관련 참고 자료
이와 관련하여 유사한 질문에 대한 답변이 이미 게시된 적이 있습니다. 김응룡님께서 좀 더 깊이 있는 이해를 위해 아래 링크를 참조하시기를 추천합니다:
- 작업형1 모의문제3 문제8 -
sum()함수의numeric_only=True사용 방법과 관련된 논의가 포함되어 있습니다.
- numeric_only=True 관련 질문 - 최신 판다스 업데이트와 시험 환경에서의
numeric_only=True사용에 관한 정보가 있습니다.
위 링크들을 참고하시면 numeric_only=True 옵션 사용에 대한 더 많은 정보를 얻을 수 있을 것입니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
작업형2 카테고리
0
5
1
110강 회귀_8번 문의
0
8
2
XGBRegressor 학습 시 warning 출력
0
11
2
데이터 프레임을 변경해도 되나요?
0
9
2
10회 기출 작업형3 문제 2-1 질문
0
14
2
작업형 2 질문
0
13
2
작업형 2 템플릿 확인 요청
0
12
2
작업형2 인코딩 질문
0
22
2
작업형 3 벼락치기 공부방법 질문
0
30
2
기출 11회 작업형 2_전체 데이터 학습 여부
0
31
2
예측값 결과 소수점 차이
0
27
2
기출 문제와 실전챌린지 연습문제 무엇부터 푸는게 나은가요?
0
34
1
전처리 train() test([ ])
0
23
2
작업형 1 배경지식 질문
0
32
2
옳게 풀은건지 질문드립니다!
0
21
1
roc_auc_score
0
29
2
추가질문 합니다
0
22
2
시험환경 구름
0
20
2
2유형 질문드려요
0
21
2
RandomForest vs lgb
0
27
2
전처리 관련질문
0
29
3
작업형3 기출
0
19
2
유형2에서 데이터분할 생략 가능여부
0
32
2
9회 기출 유형3 질문
0
21
2





