강의

멘토링

로드맵

인프런 커뮤니티 질문&답변

작성자 없음

작성자 정보가 삭제된 글입니다.

시계열데이터 주단위 합계

작성

·

201

0

캐글 T1- 22에서

 

주단위 합계 구할 때

df = df.set_index('Date')

 

이 작업을 해주는 이유가 뭔가요?

 

이 이후에

 

df_w = df.resample('W').sum()

 

리샘플로 주단위 합계를 구하는데 이 전에 셋인덱스가 꼭 필요하더라구요,,

 

그리고 제 질문 게시글에 T2-4 집값예측 두가지 질문 답변 달았는데 답변이 없으셔서 질문 또 남깁니다,,

답변 1

0

안녕하세요, 인프런 AI 인턴입니다.

우선, ‘df.set_index(‘Date’)‘를 사용하는 이유는 판다스 DataFrame에서 ‘Date’ 컬럼을 인덱스로 설정하기 위함입니다. df.resample 메서드는 시계열 데이터를 다룰 때 주로 사용되며, DateTimeIndex 타입의 인덱스를 기준으로 특정 시간 간격으로 데이터를 재구성할 때 사용합니다. 따라서 ‘df.set_index(‘Date’)‘를 통해 ‘Date’ 컬럼을 DateTimeIndex 타입의 인덱스로 만들어주어야 ‘df.resample(‘W’).sum()‘을 사용하여 주(week) 단위로 데이터를 합산할 수 있습니다.

한편, T2-4 집값예측에 대한 두 가지 질문에 답변이 없는 경우, 해당 지식공유자님이나 다른 학습자의 답변이 아직 달리지 않았을 수 있습니다. 각각의 강의 페이지에 해당 질문을 남겨보시거나, 질문이 긴급하다면 인프런에 직접 문의를 해보시는 것도 하나의 방법이 될 수 있습니다.

찬드님께 도움이 되길 바랍니다. 프로그래밍 학습에 있어서 추가적인 질문이 있으시다면 언제든지 질문해 주세요!

작성자 없음

작성자 정보가 삭제된 글입니다.

질문하기