n_step 값에 대하여
451
작성한 질문수 7
안녕하세요.
n_step값에 대해 설명해 주 셨을때 과거 n일치 기온 데이터를 사용하여 내일 기온을 예측한다고 하셨습니다. 강의에서 본거처럼 n_step을 줄이면 큰 차이는 없지만 n_step을 계속올리고 300, 500, 700하면 R^2 값이 0.90 쯤까지 떨어지더군요.
그러면 predicted값하고 real값하고 더 차이가 많이 납니다. 왜 그런지 알 수있을까요?? 과거 데이터가 더 많을수록 score값은 떨어질수밖에없나요?
답변 1
0
좋은 질문입니다.
n_steps를 불필요하게 크게 키우면 오래전의 과거 데이터가 예측에 도움이 안되고 잡음으로 동작하기 때문입니다. 선형모델에서는 모든 입력 값들의 가중합을 사용하는데 불필요한 신호에 곱해지는 계수가 모두 0이 되지 않는 한 어떤 형태로든 (0이 아닌) 가중치가 존재하게 됩니다. 이와 같이 불필요한 신호들이 랜덤하게 (예측에 도움이 되지 않게) 더해지면 이것이 잡음으로 동작하게 되고 따라서 성능이 떨어지는 것입니다.
시험에서 문제 불러오기
0
2
1
2번문제 출력값 질문
0
5
1
pd.get_dummies()가 bool로 반환
0
8
1
대응표본검정 레빈
0
15
2
단일표본검정 문제 유형
0
17
2
[작업형 3] 6~7. 카이제곱 검정
0
15
2
시스템 아키텍처를 강의에 나온 것 처럼 그리고 싶은데 공유 가능할까요?
1
11
2
9회 작업형3 문제 1-1
0
23
2
최종답안 계산 방식 질문
0
16
1
PROJECT_STRUCTURE.md 파일 공유좀 해주세요
0
15
2
맥북에서 아이패드로 연결해서 보려고 하면 화면이 안뜹니다.
0
2
1
시험 치기 전 급하게 질문 사항
0
26
2
노션 사용권한 불편합니다.
0
12
2
유형3
0
25
2
작업형 2 연습문제 섹션 3
0
18
2
dags_email_on_failure
0
9
1
결측값 처리
0
576
1
dir*.csv가 안됩니다.
0
327
1
6 시그마 이상 outlier
0
557
1
로그변환에 대하여
0
644
1
In[42] 14:50 코드 질문
0
247
1
Titanic 데이터셋 PClass cateogrical -> one hot encoding
0
385
1
표준 스케일링관련 문의
0
317
1
6:14초 dataframe 스케일링한 후 컬럼 추가에 대한 질문
0
740
1





