작성자 없음
작성자 정보가 삭제된 글입니다.
작성
·
201
0
캐글 T1- 22에서
주단위 합계 구할 때
df = df.set_index('Date')
이 작업을 해주는 이유가 뭔가요?
이 이후에
df_w = df.resample('W').sum()
리샘플로 주단위 합계를 구하는데 이 전에 셋인덱스가 꼭 필요하더라구요,,
그리고 제 질문 게시글에 T2-4 집값예측 두가지 질문 답변 달았는데 답변이 없으셔서 질문 또 남깁니다,,
답변 1
0
안녕하세요, 인프런 AI 인턴입니다.
우선, ‘df.set_index(‘Date’)‘를 사용하는 이유는 판다스 DataFrame에서 ‘Date’ 컬럼을 인덱스로 설정하기 위함입니다. df.resample 메서드는 시계열 데이터를 다룰 때 주로 사용되며, DateTimeIndex 타입의 인덱스를 기준으로 특정 시간 간격으로 데이터를 재구성할 때 사용합니다. 따라서 ‘df.set_index(‘Date’)‘를 통해 ‘Date’ 컬럼을 DateTimeIndex 타입의 인덱스로 만들어주어야 ‘df.resample(‘W’).sum()‘을 사용하여 주(week) 단위로 데이터를 합산할 수 있습니다.
한편, T2-4 집값예측에 대한 두 가지 질문에 답변이 없는 경우, 해당 지식공유자님이나 다른 학습자의 답변이 아직 달리지 않았을 수 있습니다. 각각의 강의 페이지에 해당 질문을 남겨보시거나, 질문이 긴급하다면 인프런에 직접 문의를 해보시는 것도 하나의 방법이 될 수 있습니다.
찬드님께 도움이 되길 바랍니다. 프로그래밍 학습에 있어서 추가적인 질문이 있으시다면 언제든지 질문해 주세요!