inflearn logo
강의

Course

Instructor

The Secrets of Algorithmic Trading: How AI Predicts Stock Prices

NASDAQ Top 20 Individual Stock Price Prediction Practice

예측에 사용하는 경제지표의 활용에 대해

Resolved

27

Ingyun Son

1 asked

1

안녕하세요. 좋은 강의 감사합니다.

예측의 요인들을 넣고 빼는 과정에서 궁금한게 있어 질문드립니다.

 

강의 예시에서 QQQ 혹은 S&P 500 ETF 등의 인덱스 연동 ETF를 주로 예로 사용하였습니다.

이 때, 동일한 경제지표를 제외하는 예시를 보여주셨는데, 실제 QQQ의 경우는 나스닥 100을 추종하고 있으며 S&P 500(SPY)의 경우에는 S&P 500 지수를 추종하고 있습니다.

그렇다면, 해당 두 ETF를 제거하는 것 이외에 동일한 추종 지수도 제외해야 예측에서의 유효성이 더 높은 것 아닐까요?

python 딥러닝 재테크 lstm transformer

Answer 2

0

cheatkeylab

안녕하세요, @Ingyun Son님.

정확하고 날카로운 지적이십니다.

말씀하신 대로 QQQ는 나스닥 100 지수를, SPY는 S&P 500 지수를 그대로 추종하기 때문에, 예측 모델에 ETF 가격 데이터와 해당 지수 데이터를 동시에 넣는 것은 사실상 동일한 정보를 중복해서 입력하는 것으로 생각할 수 있습니다.

통계학이나 머신러닝 관점에서는 이를 Multicollinearity 문제라고 부르는데, 서로 강한 상관관계를 가진 변수들이 모델에 함께 들어가면 오히려 예측의 왜곡이 발생하거나 유효성이 떨어질 수 있습니다.

따라서 말씀하신 것처럼 제외하는 것이 유효성을 높이는 좋은 접근법이 될 수 있습니다.

사실 데이터 분석과 자동매매 시스템 구축에 '완전한 정답'은 없습니다.

어떤 연구자는 데이터의 미세한 추적오차까지 학습시키기 위해 둘 다 넣기도 하고,

어떤 연구자는 모델의 경량화와 과적합 방지를 위해 중복 지수를 제거하기도 합니다.

"이렇게 구조를 바꾸면 더 유효하지 않을까?"라는 의문을 가지시고 직접 변수를 조정해 나가시는 과정 자체가 모델을 고도화하는 최고의 방법입니다.

제 강의의 기획 의도를 완벽하게 이해하고 계신 것 같아 저도 뿌듯합니다. ^^

수강중 궁금한 내용이 있으시다면 언제든 질문 올려주세요.

감사합니다.

0

communityai8509

안녕하세요, 인프런 AI 인턴입니다. Ingyun Son님.

강의에 대한 좋은 질문 감사합니다. 예측 모델에서 경제지표와 ETF를 다루는 방식에 대해 설명드리겠습니다.

경제지표와 ETF의 활용:

  1. ETF와 예측의 관계:
    QQQ와 S&P 500 ETF(SPY)와 같은 ETF는 각각 나스닥 100과 S&P 500 지수를 추종하며, 기본적으로 그 지수들의 움직임을 반영합니다. 따라서, 이 두 ETF를 포함한 다른 예측 변수들은 기본적으로 같은 정보를 포함하고 있을 가능성이 큽니다.

  2. 중복 정보를 피하기:
    당신이 말씀하신 대로, 동일하거나 비슷한 경제지표와 지수 관련 데이터를 예측 모델에 포함할 경우, 중복된 정보로 인해 모델의 과적합 또는 해석력이 떨어질 수 있습니다. 특히, QQQ와 같은 ETF를 사용할 때, 이미 나스닥 100을 추종하는 데이터를 포함하고 있다면 추가적으로 나스닥 100 지수를 별도로 포함할 필요는 없을 수 있습니다. 불필요한 중복을 줄이고 모델의 성능과 해석 가능성을 높이기 위해, 이와 같은 중복 정보를 제외하는 것이 유리할 수 있습니다.

이를 반영하여 예측 모델을 설계할 때는 중복 정보의 가능성을 고려하여 경제지표와 지수를 선택하는 것이 중요합니다.

아래의 링크에서는 예측 모델에 사용되는 데이터 처리와 관련된 유사한 질문과 답변을 확인할 수 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

작업형3 기출

0

3

1

유형2에서 데이터분할 생략 가능여부

0

4

1

9회 기출 유형3 질문

0

7

1

lgb 기초편

0

5

1

수업자료 문의

0

7

1

괄호 사용

0

7

1

작업형 2 데이터 전처리 질문

0

9

0

11회 기출 유형 작업형1 문제 3-1

0

7

0

7회 3유형 2번문제 질문

0

7

1

예시문제 작업형2 (ver2023) 질문입니다

0

8

1

Data type에 따른 처리

0

5

1

Cursor 실행 문의

1

11

2

데이터 전처리 관련

0

13

2

시험에서 문제 불러오기

0

12

2

강의 자료를 어디서 확인 할 수 있나요?

1

30

3

주가 예측 정확도

1

151

2

섹션4의 10강 질문이 있습니다.

1

81

2

세션 3까지 듣고 궁금한점이 있어 문의 드립니다,

0

95

2

파이썬 스크립트 작성 프로그램은 뭘로 쓰시는건가요?

1

300

2

DB에 데이터 넣지 않는 이유가 무엇때문인가요?

1

122

1

국내시장용으로 제작하려면 어떻게 해야하나요?

0

152

2

feature 질문 드립니다.

0

81

2

노션 및 수업자료(코드) 다운로드는 어떻게 하나요?

1

216

2

주식 종목 추가

0

267

1