-
카테고리
-
세부 분야
데이터 분석
-
해결 여부
미해결
강좌에서 나오는 window가 무슨 뜻인가요?
21.01.23 21:39 작성 조회수 850
2
강좌에서 나오는 window가 무슨 의미로 쓰이는건가요?
단 두 장의 문서로 데이터 분석과 시각화 뽀개기
16) 시계열 데이터(Time Series Data) 분석을 위한 판다스 Expanding and Rolling 이해하기
강의실 바로가기
답변을 작성해보세요.
0
박조은
지식공유자2021.01.23
안녕하세요.
rolling과 expanding에 따라 window가 약간 다르게 쓰이는데요.
아래와 같은 차이가 있습니다.
아래 이미지가 잘 안 보인다면 다음 링크를 참고해 주세요.
https://cdn.inflearn.com/public/comments/336b215c-2c48-4bbf-ace3-5f20e34e6ca1/rolling_expanding.png
rolling
- window : 몇 개의 데이터를 가지고 연산을 할 것인지 결정
- 의미 : window가 클수록 부드러운 선의 형태를 가지고 있음 window가 center에 있지 않으면 window는 클수록 위상 차가 큼
- min_periods : 최소한 몇 개의 데이터가 있어야 연산을 할 것인지 결정
- --> window 안의 데이터가 min_periods보다 적다면, 결과는 NaN이 된다
- center : window의 위치를 window 끝으로 할 것인지 중간으로 할 것 인지 결정
- 의미 : 시계열 데이터에서는 window를 중간으로 할 수 없다(미래의 데이터는 볼 수 없기 때문에)
- 연산을 mean()으로 했을 경우 'rolling'은 전체적으로 진짜 데이터에서 잡음(noise)을 제거하는 의미를 가지고 있다.
expanding
- window : expanding에서는 window를 결정하지 않는다.
- 왜냐하면 window의 크기가 순차적으로 증가하기 때문이다.
- min_periods : 최소한 몇 개의 데이터가 있어야 연산을 할 것인지 결정
- --> 이것은 rolling과 같다.
- expanding에서의 sum()은 cumsum() 연산과 동일하게 진행되나 NaN 이 있을 경우 expanding은 무난하게 처리할 수 있다.
- 연산을 sum()으로 했을 경우, cumsum()과 같은 의미가 있다
- 연산을 mean()으로 했을 경우 'expanding' 은 전체적으로 추세를 찾는 의미가 있다.
답변 1