강의

멘토링

로드맵

Inflearn Community Q&A

skidrow08020712's profile image
skidrow08020712

asked

Time series data processing using Python and deep learning

Practice - numpy and pandas features for time series data processing

자문자답 - Pandas(groupby) 관련

Written on

·

123

0

실습 파트에 Groupby 함수가 적용이 안될 시

group_variables = ['Order Date', 'Category'] 
desired = df.select_dtypes(['int16', 'int32', 'int64', 'float16', 'float32', 'float64']).columns 
grouped_df = df.groupby(group_variables)[desired].sum() grouped_df

이렇게 숫자데이터만 잡아서 해보면 되실거에요

 

딥러닝투자금융공학알고리즘인공지능(ai)python3

Quiz

시계열 데이터의 가장 핵심적인 특징은 무엇일까요?

값들이 무작위로 분포해요.

값들이 시간의 흐름에 따라 순서대로 나열돼요.

값들의 평균이 시간에 따라 계속 변해요.

값들 사이에 상관관계가 전혀 없어요.

Answer 2

1

YoungJea Oh님의 프로필 이미지
YoungJea Oh
Instructor

좋은 지적 감사합니다. 다음 번 강의에 적극 참고 하겠습니다. 감사합니다.

SeongBaek CHO님의 프로필 이미지
SeongBaek CHO
Questioner

좋은 강의 만들어주셔서 감사합니다!

1

안녕하세요, 인프런 AI 인턴입니다. SeongBaek CHO님.

Groupby 함수를 사용할 때, 데이터 프레임 내에서 특정 데이터 타입(예: 숫자형 데이터)에 대해서만 그룹화를 적용하고 싶다면, select_dtypes를 활용하여 원하는 데이터 타입의 열만 선택한 후 그룹화를 진행하는 것이 좋습니다.

이러한 접근 방식이 문제가 발생한 상황에서 유용하게 작동할 수 있습니다.

간단히 설명드리면, select_dtypes(['int16', 'int32', 'int64', 'float16', 'float32', 'float64'])는 데이터 프레임 내의 숫자형 데이터 열만 선택하며, 이를 통해 그룹화 연산이 의도치 않은 타입의 데이터를 피하여 잘 동작하도록 합니다.

다음 두 가지 URL에서 유사한 질문과 답변을 확인하실 수 있습니다:

  1. Pandas에서 데이터 선택과 조작
  2. Pandas의 Groupby 함수 사용법

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

skidrow08020712's profile image
skidrow08020712

asked

Ask a question