주가 예측 실제값 스무딩 관련 질문드립니다.

Question

안녕하세요! 강의를 수강하고 있는 학생입니다. 주가 예측 강의에서 2가지 질문사항이 있어서 문의드립니다. 7강 주가예측 - LSTM과 GRU 강의에서 2분 이후에 GRU 결과 그래프를 보시면서 설명해주시는 부분중에서 쉬프트 현상을 해결하기 위해서 실제값을 스무딩 처리해준다고 하셨는데, 실제값을 스무딩하는 방법은 어떤 방식을 사용하는 걸까요? 구글링을 해봤지만 잘 찾지 못했습니다. 혹시 참고할만한 자료나 링크가 있다면 공유해주실 수 있을까요? 아니면 15장 과적합에서 알려주신 레이블 스무딩을 응용해서 해야할까요? 다음으로는 쉬프트 현상을 완화하는 방법으로는 1일치만 계산하는게 아니라 3일치 4일치로 벡터를 늘려서 학습을 시킨다고 하셨는데, 이 부분은 seq_data함수를 정의하면서 시퀀스 길이를 정의할때 조정하면 될까요? for i in range ( len ( x ) -sequence_length ): x_seq.append ( x [ i : i+sequence_length ]) # a[2:6] -> 2,3,4,5 y_seq.append ( y [ i+sequence_length ]) 예를들어 위의 코드중에서 y_seq.append(y[i+sequence_length])를 -> y_seq.append(y[i+sequence_length:i+sequence_lenghth+3]) 과 같은 식으로 y데이터도 1일이 아닌 2일 데이터가 들어오게 하면 될지 문의드립니다. 감사합니다!

딥러닝호형 · Answer

안녕하세요. haha583님! 주가 예측에 관심이 있으시군요 :) 테크닉적인 부분을 질문 주셨는데요. 1. 스무딩 테크닉으로 사용할 수 있는 것이 Savitzky-Golay filter, polynomial approximation, Gaussian process, FFT 등등이 있어요. 함수들은 sklearn, scipy 등에서 라이브러리가 대부분 있긴한데 어떻게 적용할지가 어렵기 때문에 고민을 해보셔야해요. 2. 네 맞습니다! 말씀해 주신대로 하시되 변경된 사이즈만큼 연관된 데이터들도 사이즈를 다 맞춰주셔야해요. 개인적인 견해는 주가 예측 성능을 높이려면 변수 선택/생성/배제/스케일링 등에 대한 피쳐 엔지니어링이 가장 우선적으로 되어야 한다고 생각해요 :) 열공하세요!