강의

멘토링

커뮤니티

Cộng đồng Hỏi & Đáp của Inflearn

Hình ảnh hồ sơ của donggeunko2496
donggeunko2496

câu hỏi đã được viết

Khoa học dữ liệu thực tế Phần 2. Tiền xử lý dữ liệu

Dự báo tuyến tính chuỗi thời gian

n_step 값에 대하여

Viết

·

434

0

안녕하세요.

 n_step값에 대해 설명해 주 셨을때 과거 n일치 기온 데이터를 사용하여 내일 기온을 예측한다고 하셨습니다. 강의에서 본거처럼 n_step을 줄이면 큰 차이는 없지만 n_step을 계속올리고 300, 500, 700하면 R^2 값이 0.90 쯤까지 떨어지더군요. 

그러면 predicted값하고 real값하고 더 차이가 많이 납니다. 왜 그런지 알 수있을까요?? 과거 데이터가 더 많을수록 score값은 떨어질수밖에없나요? 

python

Câu trả lời 1

0

hjkim3님의 프로필 이미지
hjkim3
Người chia sẻ kiến thức

좋은 질문입니다.

n_steps를 불필요하게 크게 키우면 오래전의 과거 데이터가 예측에 도움이 안되고 잡음으로 동작하기 때문입니다. 선형모델에서는 모든 입력 값들의 가중합을 사용하는데 불필요한 신호에 곱해지는 계수가 모두 0이 되지 않는 한 어떤 형태로든 (0이 아닌) 가중치가 존재하게 됩니다. 이와 같이 불필요한 신호들이 랜덤하게 (예측에 도움이 되지 않게) 더해지면 이것이 잡음으로 동작하게 되고 따라서 성능이 떨어지는 것입니다.

Hình ảnh hồ sơ của donggeunko2496
donggeunko2496

câu hỏi đã được viết

Đặt câu hỏi