예측에 사용하는 경제지표의 활용에 대해
안녕하세요. 좋은 강의 감사합니다.
예측의 요인들을 넣고 빼는 과정에서 궁금한게 있어 질문드립니다.
강의 예시에서 QQQ 혹은 S&P 500 ETF 등의 인덱스 연동 ETF를 주로 예로 사용하였습니다.
이 때, 동일한 경제지표를 제외하는 예시를 보여주셨는데, 실제 QQQ의 경우는 나스닥 100을 추종하고 있으며 S&P 500(SPY)의 경우에는 S&P 500 지수를 추종하고 있습니다.
그렇다면, 해당 두 ETF를 제거하는 것 이외에 동일한 추종 지수도 제외해야 예측에서의 유효성이 더 높은 것 아닐까요?
Answer 2
0
안녕하세요, @Ingyun Son님.
정확하고 날카로운 지적이십니다.
말씀하신 대로 QQQ는 나스닥 100 지수를, SPY는 S&P 500 지수를 그대로 추종하기 때문에, 예측 모델에 ETF 가격 데이터와 해당 지수 데이터를 동시에 넣는 것은 사실상 동일한 정보를 중복해서 입력하는 것으로 생각할 수 있습니다.
통계학이나 머신러닝 관점에서는 이를 Multicollinearity 문제라고 부르는데, 서로 강한 상관관계를 가진 변수들이 모델에 함께 들어가면 오히려 예측의 왜곡이 발생하거나 유효성이 떨어질 수 있습니다.
따라서 말씀하신 것처럼 제외하는 것이 유효성을 높이는 좋은 접근법이 될 수 있습니다.
사실 데이터 분석과 자동매매 시스템 구축에 '완전한 정답'은 없습니다.
어떤 연구자는 데이터의 미세한 추적오차까지 학습시키기 위해 둘 다 넣기도 하고,
어떤 연구자는 모델의 경량화와 과적합 방지를 위해 중복 지수를 제거하기도 합니다.
"이렇게 구조를 바꾸면 더 유효하지 않을까?"라는 의문을 가지시고 직접 변수를 조정해 나가시는 과정 자체가 모델을 고도화하는 최고의 방법입니다.
제 강의의 기획 의도를 완벽하게 이해하고 계신 것 같아 저도 뿌듯합니다. ^^
수강중 궁금한 내용이 있으시다면 언제든 질문 올려주세요.
감사합니다.
0
안녕하세요, 인프런 AI 인턴입니다. Ingyun Son님.
강의에 대한 좋은 질문 감사합니다. 예측 모델에서 경제지표와 ETF를 다루는 방식에 대해 설명드리겠습니다.
경제지표와 ETF의 활용:
ETF와 예측의 관계:
QQQ와 S&P 500 ETF(SPY)와 같은 ETF는 각각 나스닥 100과 S&P 500 지수를 추종하며, 기본적으로 그 지수들의 움직임을 반영합니다. 따라서, 이 두 ETF를 포함한 다른 예측 변수들은 기본적으로 같은 정보를 포함하고 있을 가능성이 큽니다.중복 정보를 피하기:
당신이 말씀하신 대로, 동일하거나 비슷한 경제지표와 지수 관련 데이터를 예측 모델에 포함할 경우, 중복된 정보로 인해 모델의 과적합 또는 해석력이 떨어질 수 있습니다. 특히, QQQ와 같은 ETF를 사용할 때, 이미 나스닥 100을 추종하는 데이터를 포함하고 있다면 추가적으로 나스닥 100 지수를 별도로 포함할 필요는 없을 수 있습니다. 불필요한 중복을 줄이고 모델의 성능과 해석 가능성을 높이기 위해, 이와 같은 중복 정보를 제외하는 것이 유리할 수 있습니다.
이를 반영하여 예측 모델을 설계할 때는 중복 정보의 가능성을 고려하여 경제지표와 지수를 선택하는 것이 중요합니다.
아래의 링크에서는 예측 모델에 사용되는 데이터 처리와 관련된 유사한 질문과 답변을 확인할 수 있습니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
작업형3 기출
0
3
1
유형2에서 데이터분할 생략 가능여부
0
4
1
9회 기출 유형3 질문
0
7
1
lgb 기초편
0
5
1
수업자료 문의
0
7
1
괄호 사용
0
7
1
작업형 2 데이터 전처리 질문
0
9
0
11회 기출 유형 작업형1 문제 3-1
0
7
0
7회 3유형 2번문제 질문
0
7
1
예시문제 작업형2 (ver2023) 질문입니다
0
8
1
Data type에 따른 처리
0
5
1
Cursor 실행 문의
1
11
2
데이터 전처리 관련
0
13
2
시험에서 문제 불러오기
0
12
2
강의 자료를 어디서 확인 할 수 있나요?
1
30
3
주가 예측 정확도
1
151
2
섹션4의 10강 질문이 있습니다.
1
81
2
세션 3까지 듣고 궁금한점이 있어 문의 드립니다,
0
95
2
파이썬 스크립트 작성 프로그램은 뭘로 쓰시는건가요?
1
300
2
DB에 데이터 넣지 않는 이유가 무엇때문인가요?
1
122
1
국내시장용으로 제작하려면 어떻게 해야하나요?
0
152
2
feature 질문 드립니다.
0
81
2
노션 및 수업자료(코드) 다운로드는 어떻게 하나요?
1
216
2
주식 종목 추가
0
267
1

