강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

민정님의 프로필 이미지
민정

작성한 질문수

단 두 장의 문서로 데이터 분석과 시각화 뽀개기

16) 시계열 데이터(Time Series Data) 분석을 위한 판다스 Expanding and Rolling 이해하기

강좌에서 나오는 window가 무슨 뜻인가요?

작성

·

1.3K

2

강좌에서 나오는 window가 무슨 의미로 쓰이는건가요?

답변 1

0

박조은님의 프로필 이미지
박조은
지식공유자

안녕하세요.

rolling과 expanding에 따라 window가 약간 다르게 쓰이는데요.

아래와 같은 차이가 있습니다.

아래 이미지가 잘 안 보인다면 다음 링크를 참고해 주세요. 

https://cdn.inflearn.com/public/comments/336b215c-2c48-4bbf-ace3-5f20e34e6ca1/rolling_expanding.png

rolling

  • window : 몇 개의 데이터를 가지고 연산을 할 것인지 결정
    • 의미 : window가 클수록 부드러운 선의 형태를 가지고 있음 window가 center에 있지 않으면 window는 클수록 위상 차가 큼
  • min_periods : 최소한 몇 개의 데이터가 있어야 연산을 할 것인지 결정
    • --> window 안의 데이터가 min_periods보다 적다면, 결과는 NaN이 된다
  • center : window의 위치를 window 끝으로 할 것인지 중간으로 할 것 인지 결정
    • 의미 : 시계열 데이터에서는 window를 중간으로 할 수 없다(미래의 데이터는 볼 수 없기 때문에)
  • 연산을 mean()으로 했을 경우 'rolling'은 전체적으로 진짜 데이터에서 잡음(noise)을 제거하는 의미를 가지고 있다.

expanding

  • window : expanding에서는 window를 결정하지 않는다.
    • 왜냐하면 window의 크기가 순차적으로 증가하기 때문이다.
  • min_periods : 최소한 몇 개의 데이터가 있어야 연산을 할 것인지 결정
    • --> 이것은 rolling과 같다.
  • expanding에서의 sum()은 cumsum() 연산과 동일하게 진행되나 NaN 이 있을 경우 expanding은 무난하게 처리할 수 있다.
  • 연산을 sum()으로 했을 경우, cumsum()과 같은 의미가 있다
  • 연산을 mean()으로 했을 경우 'expanding' 은 전체적으로 추세를 찾는 의미가 있다.

민정님의 프로필 이미지
민정

작성한 질문수

질문하기