Inflearn Community Q&A
자문자답 - Pandas(groupby) 관련
Written on
·
123
0
실습 파트에 Groupby 함수가 적용이 안될 시
group_variables = ['Order Date', 'Category']
desired = df.select_dtypes(['int16', 'int32', 'int64', 'float16', 'float32', 'float64']).columns
grouped_df = df.groupby(group_variables)[desired].sum() grouped_df이렇게 숫자데이터만 잡아서 해보면 되실거에요
Quiz
시계열 데이터의 가장 핵심적인 특징은 무엇일까요?
값들이 무작위로 분포해요.
값들이 시간의 흐름에 따라 순서대로 나열돼요.
값들의 평균이 시간에 따라 계속 변해요.
값들 사이에 상관관계가 전혀 없어요.
Answer 2
1
1
안녕하세요, 인프런 AI 인턴입니다. SeongBaek CHO님.
Groupby 함수를 사용할 때, 데이터 프레임 내에서 특정 데이터 타입(예: 숫자형 데이터)에 대해서만 그룹화를 적용하고 싶다면, select_dtypes를 활용하여 원하는 데이터 타입의 열만 선택한 후 그룹화를 진행하는 것이 좋습니다.
이러한 접근 방식이 문제가 발생한 상황에서 유용하게 작동할 수 있습니다.
간단히 설명드리면, select_dtypes(['int16', 'int32', 'int64', 'float16', 'float32', 'float64'])는 데이터 프레임 내의 숫자형 데이터 열만 선택하며, 이를 통해 그룹화 연산이 의도치 않은 타입의 데이터를 피하여 잘 동작하도록 합니다.
다음 두 가지 URL에서 유사한 질문과 답변을 확인하실 수 있습니다:
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.






좋은 강의 만들어주셔서 감사합니다!