inflearn logo
강의

Khóa học

Chia sẻ kiến thức

Khoa học dữ liệu thực tế Phần 2. Tiền xử lý dữ liệu

Dự báo tuyến tính chuỗi thời gian

n_step 값에 대하여

441

donggeunko2496

7 câu hỏi đã được viết

0

안녕하세요.

 n_step값에 대해 설명해 주 셨을때 과거 n일치 기온 데이터를 사용하여 내일 기온을 예측한다고 하셨습니다. 강의에서 본거처럼 n_step을 줄이면 큰 차이는 없지만 n_step을 계속올리고 300, 500, 700하면 R^2 값이 0.90 쯤까지 떨어지더군요. 

그러면 predicted값하고 real값하고 더 차이가 많이 납니다. 왜 그런지 알 수있을까요?? 과거 데이터가 더 많을수록 score값은 떨어질수밖에없나요? 

python

Câu trả lời 1

0

hjkim3

좋은 질문입니다.

n_steps를 불필요하게 크게 키우면 오래전의 과거 데이터가 예측에 도움이 안되고 잡음으로 동작하기 때문입니다. 선형모델에서는 모든 입력 값들의 가중합을 사용하는데 불필요한 신호에 곱해지는 계수가 모두 0이 되지 않는 한 어떤 형태로든 (0이 아닌) 가중치가 존재하게 됩니다. 이와 같이 불필요한 신호들이 랜덤하게 (예측에 도움이 되지 않게) 더해지면 이것이 잡음으로 동작하게 되고 따라서 성능이 떨어지는 것입니다.

구글 그래피티 마켓 오류...?!

0

7

2

디스코드 소통창구는 없어졌나요 ??

0

7

1

FOREIGN KEY 정리하기, 영상대로 SQL코드 복붙해도 안되요.

0

5

1

모델 서빙과 관련된 강좌 출시 예정된 바가 있으신지 여쭤봅니다!

0

7

1

모델 서빙과 관련된 강좌가 출시되는지 질문드립니다.

0

5

1

20번강좌에 대한 질문입니다.

0

6

1

6-6

0

18

1

작업형 1 유형 부분

0

16

2

수강평 이벤트

0

22

2

작업형 1 (삭제예정, 구 버전)

0

34

2

강의노트는 어디있나요?

0

21

1

노션 학습 자료 권한 요청

0

17

1

수강기간 연장 문의드립니다.

0

26

1

2유형 레이블 인코딩 VS 원핫 인코딩

0

25

3

part2강의 문의사항입니다.

0

23

2

수강기간 연장 문의드립니다.

0

28

1

결측값 처리

0

559

1

dir*.csv가 안됩니다.

0

314

1

6 시그마 이상 outlier

0

544

1

로그변환에 대하여

0

630

1

In[42] 14:50 코드 질문

0

240

1

Titanic 데이터셋 PClass cateogrical -> one hot encoding

0

376

1

표준 스케일링관련 문의

0

302

1

6:14초 dataframe 스케일링한 후 컬럼 추가에 대한 질문

0

733

1