inflearn logo
강의

講義

知識共有

Python無料講義(活用編5) - データ分析と可視化

グループ化

goupby.mean() 오류

698

jmy9705225507

投稿した質問数 1

1

  1. 그룹화 강의에서 df.groupby('학교').mean() 이 문을 실행했을때 TypeError가 나타나는데 강사님께서는 결과값이 잘 나옵니다. 어떤 차이인지 그리고 어떤 부분이 틀린건지 알고싶습니다.
    자료형 문제인거 같은데 정확히 모르겠어서 문의드립니다.

     

    <데이터>

    <오류 내용>

     

python pandas groupby

回答 1

0

communityai8509

안녕하세요, 인프런 AI 인턴입니다.

사용자님께서 제시한 오류는 TypeError: agg function failed [how->mean,dtype->object]로, 이는 df.groupby('학교').mean() 실행 시 ‘학교’를 기준으로 그룹화한 뒤 평균을 계산하고자 할 때 특정 컬럼의 데이터 타입이 숫자형이 아닌 ‘object’ 형태로 인식되어 발생한 문제입니다. Pandas에서 ‘object’ 데이터 타입은 대개 문자열을 의미하며, 이러한 컬럼에 대해 평균(mean)과 같은 수치 연산을 진행할 수 없습니다.

해당 오류를 해결하기 위해서는 숫자로 변환 가능한 컬럼만 선택하거나, 혹은 문자열로 인식될 수 있는 컬럼을 제외하고 숫자형 컬럼에 대해서만 평균을 계산해야 합니다. 만약 ‘NaN’ 값으로 인해 숫자형 컬럼이 문자열로 인식되는 경우, 해당 컬럼을 숫자형으로 명시적으로 변환해주어야 합니다. 예를 들어, pandas의 to_numeric 함수를 사용해 변환을 시도할 수 있습니다.

다음은 ‘NaN’ 값을 포함할 수 있는 ‘과학’ 컬럼을 숫자형으로 변환하는 예시 코드입니다:

import pandas as pd
import numpy as np

# 데이터프레임 df를 예시로 들며, '과학' 컬럼에 NaN 값을 숫자형으로 변환합니다.
df['과학'] = pd.to_numeric(df['과학'], errors='coerce')

# 변환 후 df.groupby('학교').mean() 실행

errors='coerce' 옵션은 변환할 수 없는 값을 NaN으로 설정하기 때문에 수치 연산이 가능해집니다. 모든 컬럼에 대해 해당 작업을 수행한 후 평균을 다시 계산해 보세요.

디스코드 소통창구는 없어졌나요 ??

0

6

1

FOREIGN KEY 정리하기, 영상대로 SQL코드 복붙해도 안되요.

0

3

1

모델 서빙과 관련된 강좌 출시 예정된 바가 있으신지 여쭤봅니다!

0

6

1

모델 서빙과 관련된 강좌가 출시되는지 질문드립니다.

0

4

1

20번강좌에 대한 질문입니다.

0

5

1

6-6

0

17

1

작업형 1 유형 부분

0

16

2

수강평 이벤트

0

21

2

작업형 1 (삭제예정, 구 버전)

0

34

2

IN[ ] 번호 질문

0

185

1

존나 재밌다....형 왜이렇게 강의 잘해? 형 신이야? 사랑해

0

367

1

Group By 후 연산 적용 시 에러 나는 분들 참고하세요.

2

942

1

결측치 조건 질문있습니다!

0

270

1

오류

0

348

1

Capitalization 결과를 원 데이터에 반영시키려면?

0

366

1

에러 설명 좀

0

294

1

특정 컬럼만 가져오는 명령에서 아래와 같은 에러 발생 설명 좀 해주세요

0

291

1

구글 코랩으로 해도 될까요?

0

538

0

filter 역으로 적용

0

249

1

1

0

247

1

인구 피라미드 프로젝트에서...

0

355

0

출산율 수 및 합계 출산율에서 외부 범례 처리

0

291

0

여러 그래프관련 x축 값 rotationa 설정 방법

0

273

0

산점도 그래프 강의중 xlabel, ylabel 관련

0

212

0