강의

멘토링

로드맵

Inflearn brand logo image

인프런 커뮤니티 질문&답변

김대현님의 프로필 이미지
김대현

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

판다스5 - 그룹핑, 병합, 피벗테이블

groupby()안 괄호 관련

작성

·

60

0

image.pngimage.png

첫 번째, 두 번째 둘 다 groupby(컬럼명)했는데 왜 첫번째는 에러가 나고 두번째는 정사적으로 작동하나요??

답변 3

0

김대현님의 프로필 이미지
김대현
질문자

df.groupby(['원산지']).mean(numeric_only=True)
price = df.groupby('과일')['가격'].transform("mean")  

강사님께서 올려주신 노트북을 보면 첫번째에는 groupby 안에 하나의 컬럼이라도 []를 해줬는데 두번째에선 []없이 ()만 한 것이 궁금합니다.

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

데이터를 새로 불어와서 테스트 해보실 수 있을가요?

화면상으로는 문제가 없어 보이는데

캡쳐라 데이터를 다시 불러와도 그렇다면

코드 블럭으로 코드 및 에러 작성 부탁드립니다.

image.png

 

0

안녕하세요, 인프런 AI 인턴입니다.

김대현님, 데이터프레임을 groupby()로 그룹핑할 때 발생하는 오류에 대해 질문 주셨네요. 주어진 정보를 바탕으로, 여러분의 문제가 되는 부분과 그 해결책에 대해 설명드리겠습니다.

groupby() 메서드 사용 시 고려사항

  1. 문맥 파악:

    • groupby()는 지정된 컬럼의 고유 값을 기준으로 데이터프레임을 그룹화합니다. 그런 다음, mean() 등의 집계 함수를 통해 각 그룹의 특정 연산(평균, 합계 등)을 수행합니다.
  2. numeric_only 옵션:

    • numeric_only=True 옵션은 데이터프레임 내 숫자형 데이터에 한해 연산을 수행하도록 합니다. 즉, 수치형이 아닌 데이터를 가진 열이 있을 경우, 이를 무시하고 계산합니다.
  3. 오류와 정상 동작의 차이:

    • 첫 번째 시도에서 에러가 발생한 이유는 그룹화된 객체에 대해 비수치형 데이터가 있어서 mean() 함수가 작동하지 않았기 때문일 수 있습니다.
    • 두 번째 경우는 numeric_only=True 옵션을 추가하여, 수치형 데이터만 대상으로 평균을 계산했으므로 정상적으로 작동한 것입니다.

관련 링크를 통해 비슷한 질문과 답변을 확인하실 수 있습니다:
- 그룹핑을 돌렸는데 결과는 나오는데 문구가 뜨는 원인을 모르겠어요 : numeric_only=True 사용에 대해 명확히 설명된 예시입니다.
- 문제8, 문제9 풀이에서 numeric_only=True 옵션 : 이 옵션을 언제 활용해야 하는지에 대한 논의입니다.

더욱 자세한 이해를 위해 위의 링크를 참고하시길 권장드립니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

김대현님의 프로필 이미지
김대현

작성한 질문수

질문하기