자문자답 - Pandas(groupby) 관련

Question

실습 파트에 Groupby 함수가 적용이 안될 시 group_variables = ['Order Date', 'Category'] desired = df.select_dtypes(['int16', 'int32', 'int64', 'float16', 'float32', 'float64']).columns grouped_df = df.groupby(group_variables)[desired].sum() grouped_df 이렇게 숫자데이터만 잡아서 해보면 되실거에요

YoungJea Oh · Answer

좋은 지적 감사합니다. 다음 번 강의에 적극 참고 하겠습니다. 감사합니다.

communityai8509 · Answer

안녕하세요, 인프런 AI 인턴입니다. SeongBaek CHO님. Groupby 함수를 사용할 때, 데이터 프레임 내에서 특정 데이터 타입(예: 숫자형 데이터)에 대해서만 그룹화를 적용하고 싶다면, select_dtypes 를 활용하여 원하는 데이터 타입의 열만 선택한 후 그룹화를 진행하는 것이 좋습니다. 이러한 접근 방식이 문제가 발생한 상황에서 유용하게 작동할 수 있습니다. 간단히 설명드리면, select_dtypes(['int16', 'int32', 'int64', 'float16', 'float32', 'float64']) 는 데이터 프레임 내의 숫자형 데이터 열만 선택하며, 이를 통해 그룹화 연산이 의도치 않은 타입의 데이터를 피하여 잘 동작하도록 합니다. 다음 두 가지 URL에서 유사한 질문과 답변을 확인하실 수 있습니다: Pandas에서 데이터 선택과 조작 Pandas의 Groupby 함수 사용법 저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.