inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

실전 데이터 사이언스 Part2. 데이터 전처리

시계열 선형 예측

n_step 값에 대하여

453

피카라이언

작성한 질문수 7

0

안녕하세요.

 n_step값에 대해 설명해 주 셨을때 과거 n일치 기온 데이터를 사용하여 내일 기온을 예측한다고 하셨습니다. 강의에서 본거처럼 n_step을 줄이면 큰 차이는 없지만 n_step을 계속올리고 300, 500, 700하면 R^2 값이 0.90 쯤까지 떨어지더군요. 

그러면 predicted값하고 real값하고 더 차이가 많이 납니다. 왜 그런지 알 수있을까요?? 과거 데이터가 더 많을수록 score값은 떨어질수밖에없나요? 

python

답변 1

0

김화종

좋은 질문입니다.

n_steps를 불필요하게 크게 키우면 오래전의 과거 데이터가 예측에 도움이 안되고 잡음으로 동작하기 때문입니다. 선형모델에서는 모든 입력 값들의 가중합을 사용하는데 불필요한 신호에 곱해지는 계수가 모두 0이 되지 않는 한 어떤 형태로든 (0이 아닌) 가중치가 존재하게 됩니다. 이와 같이 불필요한 신호들이 랜덤하게 (예측에 도움이 되지 않게) 더해지면 이것이 잡음으로 동작하게 되고 따라서 성능이 떨어지는 것입니다.

멍슨상이라 이름 변경하시는 게 어떠신지요?

1

12

0

수업 노트가 안 보입니다.

0

14

1

Python formatter 설치

0

11

1

55강 파이썬에만있는 연산자들

0

10

1

55강의 파이썬에서만 있는 연산자들

0

9

1

주말에 실행할 경우 update_economic_data_in_background에 로직 변경 필요성

1

17

1

naver 글자 수집 오류 건

0

14

1

쥬피터 노트북이 실행이 안됩니다.

0

17

1

뒤로가기 버튼 같은 것이 있나요?

0

21

1

Replit 강의 자료가 안나와요

0

16

1

강의 연장 문의

0

18

1

프로그램 실행시간에 대한 질문

1

20

2

비중 및 매수 종목수 조정.

1

22

2

Claude api가 소식 동기화가 늦는 문제

1

35

2

[긴급요청2] 28강 동영상 오류(27강 음성 재생) 수정 예정일자를 알려주세요

0

22

1

codex에게 대용량 코드베이스를 인식 시키는 방법은 어떤게 있나요?

0

29

1

결측값 처리

0

576

1

dir*.csv가 안됩니다.

0

329

1

6 시그마 이상 outlier

0

558

1

로그변환에 대하여

0

646

1

In[42] 14:50 코드 질문

0

249

1

Titanic 데이터셋 PClass cateogrical -> one hot encoding

0

385

1

표준 스케일링관련 문의

0

320

1

6:14초 dataframe 스케일링한 후 컬럼 추가에 대한 질문

0

741

1