goupby.mean() 오류
695
작성한 질문수 1
그룹화 강의에서 df.groupby('학교').mean() 이 문을 실행했을때 TypeError가 나타나는데 강사님께서는 결과값이 잘 나옵니다. 어떤 차이인지 그리고 어떤 부분이 틀린건지 알고싶습니다.
자료형 문제인거 같은데 정확히 모르겠어서 문의드립니다.<데이터>

<오류 내용>

답변 1
0
안녕하세요, 인프런 AI 인턴입니다.
사용자님께서 제시한 오류는 TypeError: agg function failed [how->mean,dtype->object]로, 이는 df.groupby('학교').mean() 실행 시 ‘학교’를 기준으로 그룹화한 뒤 평균을 계산하고자 할 때 특정 컬럼의 데이터 타입이 숫자형이 아닌 ‘object’ 형태로 인식되어 발생한 문제입니다. Pandas에서 ‘object’ 데이터 타입은 대개 문자열을 의미하며, 이러한 컬럼에 대해 평균(mean)과 같은 수치 연산을 진행할 수 없습니다.
해당 오류를 해결하기 위해서는 숫자로 변환 가능한 컬럼만 선택하거나, 혹은 문자열로 인식될 수 있는 컬럼을 제외하고 숫자형 컬럼에 대해서만 평균을 계산해야 합니다. 만약 ‘NaN’ 값으로 인해 숫자형 컬럼이 문자열로 인식되는 경우, 해당 컬럼을 숫자형으로 명시적으로 변환해주어야 합니다. 예를 들어, pandas의 to_numeric 함수를 사용해 변환을 시도할 수 있습니다.
다음은 ‘NaN’ 값을 포함할 수 있는 ‘과학’ 컬럼을 숫자형으로 변환하는 예시 코드입니다:
import pandas as pd
import numpy as np
# 데이터프레임 df를 예시로 들며, '과학' 컬럼에 NaN 값을 숫자형으로 변환합니다.
df['과학'] = pd.to_numeric(df['과학'], errors='coerce')
# 변환 후 df.groupby('학교').mean() 실행
errors='coerce' 옵션은 변환할 수 없는 값을 NaN으로 설정하기 때문에 수치 연산이 가능해집니다. 모든 컬럼에 대해 해당 작업을 수행한 후 평균을 다시 계산해 보세요.
python main.py 실행시 게임이 실행이 안돼요
0
1
1
antigravity 대신 cursor를 활용해도 되나요?
0
8
1
뉴스 검색 분류 한도초과
0
12
2
완성자료
0
8
2
섹션5 노션링크 는 따로 없나요?
0
15
2
필기자료 사라졌나요?(실기 일주일만에 안돼서 재도전-_-)
0
14
2
Part 4에서 강의 연관 노션 정보들이 워드파일에 없습니다.
0
17
2
첨부자료 Part 4 코드 확인 부탁드리겠습니다.
0
15
2
Free Edition 실습 영상은 아직 업데이트전인가요?
0
10
1
IN[ ] 번호 질문
0
184
1
존나 재밌다....형 왜이렇게 강의 잘해? 형 신이야? 사랑해
0
367
1
Group By 후 연산 적용 시 에러 나는 분들 참고하세요.
2
941
1
결측치 조건 질문있습니다!
0
270
1
오류
0
348
1
Capitalization 결과를 원 데이터에 반영시키려면?
0
366
1
에러 설명 좀
0
293
1
특정 컬럼만 가져오는 명령에서 아래와 같은 에러 발생 설명 좀 해주세요
0
290
1
구글 코랩으로 해도 될까요?
0
537
0
filter 역으로 적용
0
248
1
1
0
247
1
인구 피라미드 프로젝트에서...
0
354
0
출산율 수 및 합계 출산율에서 외부 범례 처리
0
290
0
여러 그래프관련 x축 값 rotationa 설정 방법
0
272
0
산점도 그래프 강의중 xlabel, ylabel 관련
0
212
0





