inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

sum 사용시 numeric_only=True

166

김응룡

작성한 질문수 4

0

안녕하세요 선생님,

새소식에 이제 sum 사용시 numeric_only=True 작성이 필요하다고 했는데

sum을 사용하는 모든 항목에서 아래와 같이 사용하면 되는건가요?

sum(numeric_only=True)

간단하게 합계를 구할때도 .sum(numeric_only=True)로 작성을 해야하나요?

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 2

0

퇴근후딴짓

네 맞습니다.

단, 데이터프레임에 숫자와 object자료형이 함께 있을 때 숫자 자료형만 지정하기 위해 필요합니다.

만약 데이터프레임에 숫자 자료형만 있거나

숫자 컬럼만 선택했다면 df['컬럼'].sum()으로 사용해도 됩니다.

 

 

0

김응룡

감사합니다.

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다. 김응룡님, 질문 주셔서 감사합니다.

Pandas의 numeric_only=True 옵션에 대한 설명

pandas 라이브러리에서 sum()과 같은 집계 함수를 사용할 때 numeric_only=True 옵션은 수치형 데이터만을 대상으로 연산을 수행하도록 합니다. 이는 연산 시 문자열 데이터가 포함된 열은 무시하고, 수치형 열만 계산에 포함되도록 하여 오류를 방지하는데 유리합니다.

언제 numeric_only=True를 사용하는가?

  1. 수치형 열만 존재할 때: 데이터프레임의 모든 열이 수치형일 경우에는 numeric_only=True 옵션을 사용하지 않아도 됩니다.
  2. 문자 데이터가 포함된 경우: 데이터프레임에 문자열과 수치형 데이터가 혼합되어 있는 경우, sum(numeric_only=True)를 사용하여 수치형 데이터만 합산하게끔 해야 합니다.

이는 sum()뿐만 아니라 mean(), median(), std() 등의 함수에도 동일하게 적용됩니다. 만약 계산하고자 하는 열에 명시적으로 수치형 데이터만 존재하거나 연산할 열을 지정한다면, 해당 옵션은 필요하지 않을 수 있습니다.

관련 참고 자료

이와 관련하여 유사한 질문에 대한 답변이 이미 게시된 적이 있습니다. 김응룡님께서 좀 더 깊이 있는 이해를 위해 아래 링크를 참조하시기를 추천합니다:

위 링크들을 참고하시면 numeric_only=True 옵션 사용에 대한 더 많은 정보를 얻을 수 있을 것입니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

0

김응룡

감사합니다

작업형2 카테고리

0

5

1

110강 회귀_8번 문의

0

8

2

XGBRegressor 학습 시 warning 출력

0

11

2

데이터 프레임을 변경해도 되나요?

0

9

2

10회 기출 작업형3 문제 2-1 질문

0

14

2

작업형 2 질문

0

13

2

작업형 2 템플릿 확인 요청

0

12

2

작업형2 인코딩 질문

0

22

2

작업형 3 벼락치기 공부방법 질문

0

30

2

기출 11회 작업형 2_전체 데이터 학습 여부

0

31

2

예측값 결과 소수점 차이

0

27

2

기출 문제와 실전챌린지 연습문제 무엇부터 푸는게 나은가요?

0

34

1

전처리 train() test([ ])

0

23

2

작업형 1 배경지식 질문

0

32

2

옳게 풀은건지 질문드립니다!

0

21

1

roc_auc_score

0

29

2

추가질문 합니다

0

22

2

시험환경 구름

0

20

2

2유형 질문드려요

0

21

2

RandomForest vs lgb

0

27

2

전처리 관련질문

0

29

3

작업형3 기출

0

19

2

유형2에서 데이터분할 생략 가능여부

0

32

2

9회 기출 유형3 질문

0

21

2