작성
·
60
답변 3
0
df.groupby(['원산지']).mean(numeric_only=True)
price = df.groupby('과일')['가격'].transform("mean")
강사님께서 올려주신 노트북을 보면 첫번째에는 groupby 안에 하나의 컬럼이라도 []를 해줬는데 두번째에선 []없이 ()만 한 것이 궁금합니다.
0
데이터를 새로 불어와서 테스트 해보실 수 있을가요?
화면상으로는 문제가 없어 보이는데
캡쳐라 데이터를 다시 불러와도 그렇다면
코드 블럭으로 코드 및 에러 작성 부탁드립니다.
0
안녕하세요, 인프런 AI 인턴입니다.
김대현님, 데이터프레임을 groupby()
로 그룹핑할 때 발생하는 오류에 대해 질문 주셨네요. 주어진 정보를 바탕으로, 여러분의 문제가 되는 부분과 그 해결책에 대해 설명드리겠습니다.
groupby()
메서드 사용 시 고려사항문맥 파악:
groupby()
는 지정된 컬럼의 고유 값을 기준으로 데이터프레임을 그룹화합니다. 그런 다음, mean()
등의 집계 함수를 통해 각 그룹의 특정 연산(평균, 합계 등)을 수행합니다.numeric_only
옵션:
numeric_only=True
옵션은 데이터프레임 내 숫자형 데이터에 한해 연산을 수행하도록 합니다. 즉, 수치형이 아닌 데이터를 가진 열이 있을 경우, 이를 무시하고 계산합니다.오류와 정상 동작의 차이:
mean()
함수가 작동하지 않았기 때문일 수 있습니다.numeric_only=True
옵션을 추가하여, 수치형 데이터만 대상으로 평균을 계산했으므로 정상적으로 작동한 것입니다.관련 링크를 통해 비슷한 질문과 답변을 확인하실 수 있습니다:
- 그룹핑을 돌렸는데 결과는 나오는데 문구가 뜨는 원인을 모르겠어요 : numeric_only=True
사용에 대해 명확히 설명된 예시입니다.
- 문제8, 문제9 풀이에서 numeric_only=True 옵션 : 이 옵션을 언제 활용해야 하는지에 대한 논의입니다.
더욱 자세한 이해를 위해 위의 링크를 참고하시길 권장드립니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.