주가 예측 실제값 스무딩 관련 질문드립니다.
338
작성한 질문수 5
안녕하세요!
강의를 수강하고 있는 학생입니다.
주가 예측 강의에서 2가지 질문사항이 있어서 문의드립니다.
7강 주가예측 - LSTM과 GRU 강의에서
2분 이후에 GRU 결과 그래프를 보시면서 설명해주시는 부분중에서
쉬프트 현상을 해결하기 위해서 실제값을 스무딩 처리해준다고 하셨는데, 실제값을 스무딩하는 방법은 어떤 방식을 사용하는 걸까요?
구글링을 해봤지만 잘 찾지 못했습니다.
혹시 참고할만한 자료나 링크가 있다면 공유해주실 수 있을까요?
아니면 15장 과적합에서 알려주신 레이블 스무딩을 응용해서 해야할까요?
다음으로는 쉬프트 현상을 완화하는 방법으로는 1일치만 계산하는게 아니라 3일치 4일치로 벡터를 늘려서 학습을 시킨다고 하셨는데,
이 부분은 seq_data함수를 정의하면서 시퀀스 길이를 정의할때 조정하면 될까요?
예를들어 위의 코드중에서
y_seq.append(y[i+sequence_length])를
-> y_seq.append(y[i+sequence_length:i+sequence_lenghth+3]) 과 같은 식으로
y데이터도 1일이 아닌 2일 데이터가 들어오게 하면 될지 문의드립니다.
감사합니다!
답변 1
1
안녕하세요. haha583님!
주가 예측에 관심이 있으시군요 :)
테크닉적인 부분을 질문 주셨는데요.
1. 스무딩 테크닉으로 사용할 수 있는 것이 Savitzky-Golay filter, polynomial approximation, Gaussian process, FFT 등등이 있어요. 함수들은 sklearn, scipy 등에서 라이브러리가 대부분 있긴한데 어떻게 적용할지가 어렵기 때문에 고민을 해보셔야해요.
2. 네 맞습니다! 말씀해 주신대로 하시되 변경된 사이즈만큼 연관된 데이터들도 사이즈를 다 맞춰주셔야해요.
개인적인 견해는 주가 예측 성능을 높이려면 변수 선택/생성/배제/스케일링 등에 대한 피쳐 엔지니어링이 가장 우선적으로 되어야 한다고 생각해요 :)
열공하세요!
수업자료 제공 부탁드립니다.
0
115
2
코드가 어디에 있는지 모르겠습니다.
0
114
2
논문 구현
0
208
2
overfitting이 나는 이유가 궁금합니다.
1
184
2
분류 성능이 잘 안 나오는 이유
0
226
1
AutoEncoder 차원 질문
1
258
2
사전 학습 모델에서의 layer 변경에 대한 질문
1
223
1
7강 폴더 만들
0
265
1
4-3강 cross-validation에서의 best model 선정 기준
0
460
1
regression 문제에 대한 결과 시각화
0
219
1
Loss function 관련하여 질문드립니다.
0
971
1
early stopping 코드 문의
0
331
1
예측 그래프
0
363
1
데이터 불균형
1
367
1
8강 전이 학습 질문
0
406
2
data의 gpu처리 질문
0
246
1
nn.Linear(1024, 10) 관련 질문드립니다.
0
296
1
학습과 평가시 Loss 함수가 다른 이유
0
254
1
전처리 관련해서 질문 있습니다.
0
230
1
데이터 엔지니어의 역량을 기르려면 어떻게 해야할까요?
0
947
2
역전파 내용 중 미분 관련 질문 드립니다
1
283
1
8강 전이학습에서 kernel size 관련 질문 드립니다.
1
966
1
이미지분류-합성곱신경망(CNN) 피쳐맵 질문입니다.
1
590
1
14강 데이터 불균형 RandomRotation
1
485
1





