inflearn logo
강의

Khóa học

Chia sẻ kiến thức

Bí mật của giao dịch thuật toán, cách AI dự đoán giá cổ phiếu

Thực hành dự đoán giá cổ phiếu top 20 mã Nasdaq

예측에 사용하는 경제지표의 활용에 대해

Đã giải quyết

31

Ingyun Son

1 câu hỏi đã được viết

1

안녕하세요. 좋은 강의 감사합니다.

예측의 요인들을 넣고 빼는 과정에서 궁금한게 있어 질문드립니다.

 

강의 예시에서 QQQ 혹은 S&P 500 ETF 등의 인덱스 연동 ETF를 주로 예로 사용하였습니다.

이 때, 동일한 경제지표를 제외하는 예시를 보여주셨는데, 실제 QQQ의 경우는 나스닥 100을 추종하고 있으며 S&P 500(SPY)의 경우에는 S&P 500 지수를 추종하고 있습니다.

그렇다면, 해당 두 ETF를 제거하는 것 이외에 동일한 추종 지수도 제외해야 예측에서의 유효성이 더 높은 것 아닐까요?

python 딥러닝 재테크 lstm transformer

Câu trả lời 2

0

cheatkeylab

안녕하세요, @Ingyun Son님.

정확하고 날카로운 지적이십니다.

말씀하신 대로 QQQ는 나스닥 100 지수를, SPY는 S&P 500 지수를 그대로 추종하기 때문에, 예측 모델에 ETF 가격 데이터와 해당 지수 데이터를 동시에 넣는 것은 사실상 동일한 정보를 중복해서 입력하는 것으로 생각할 수 있습니다.

통계학이나 머신러닝 관점에서는 이를 Multicollinearity 문제라고 부르는데, 서로 강한 상관관계를 가진 변수들이 모델에 함께 들어가면 오히려 예측의 왜곡이 발생하거나 유효성이 떨어질 수 있습니다.

따라서 말씀하신 것처럼 제외하는 것이 유효성을 높이는 좋은 접근법이 될 수 있습니다.

사실 데이터 분석과 자동매매 시스템 구축에 '완전한 정답'은 없습니다.

어떤 연구자는 데이터의 미세한 추적오차까지 학습시키기 위해 둘 다 넣기도 하고,

어떤 연구자는 모델의 경량화와 과적합 방지를 위해 중복 지수를 제거하기도 합니다.

"이렇게 구조를 바꾸면 더 유효하지 않을까?"라는 의문을 가지시고 직접 변수를 조정해 나가시는 과정 자체가 모델을 고도화하는 최고의 방법입니다.

제 강의의 기획 의도를 완벽하게 이해하고 계신 것 같아 저도 뿌듯합니다. ^^

수강중 궁금한 내용이 있으시다면 언제든 질문 올려주세요.

감사합니다.

0

communityai8509

안녕하세요, 인프런 AI 인턴입니다. Ingyun Son님.

강의에 대한 좋은 질문 감사합니다. 예측 모델에서 경제지표와 ETF를 다루는 방식에 대해 설명드리겠습니다.

경제지표와 ETF의 활용:

  1. ETF와 예측의 관계:
    QQQ와 S&P 500 ETF(SPY)와 같은 ETF는 각각 나스닥 100과 S&P 500 지수를 추종하며, 기본적으로 그 지수들의 움직임을 반영합니다. 따라서, 이 두 ETF를 포함한 다른 예측 변수들은 기본적으로 같은 정보를 포함하고 있을 가능성이 큽니다.

  2. 중복 정보를 피하기:
    당신이 말씀하신 대로, 동일하거나 비슷한 경제지표와 지수 관련 데이터를 예측 모델에 포함할 경우, 중복된 정보로 인해 모델의 과적합 또는 해석력이 떨어질 수 있습니다. 특히, QQQ와 같은 ETF를 사용할 때, 이미 나스닥 100을 추종하는 데이터를 포함하고 있다면 추가적으로 나스닥 100 지수를 별도로 포함할 필요는 없을 수 있습니다. 불필요한 중복을 줄이고 모델의 성능과 해석 가능성을 높이기 위해, 이와 같은 중복 정보를 제외하는 것이 유리할 수 있습니다.

이를 반영하여 예측 모델을 설계할 때는 중복 정보의 가능성을 고려하여 경제지표와 지수를 선택하는 것이 중요합니다.

아래의 링크에서는 예측 모델에 사용되는 데이터 처리와 관련된 유사한 질문과 답변을 확인할 수 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

벡터저장소 코드 실행시 경고메시지가 나타납니다.

0

4

0

2유형 원핫인코딩 오류

0

10

2

시험장에서 주석 단축키 안될 때 많나요?

0

14

2

라벨인코딩 방식

0

16

2

test 재학습 관련

0

10

2

target 빈도 확인

0

13

2

작업형 2 연습문제 섹션 6

0

15

2

F1-score

0

16

2

작업형 2번 섹션 3

0

14

2

작업형 2 인코딩, 결측치, 모델 선택 질문

0

19

1

인코딩 방식 문의

0

23

2

9회 3유형 ==> 7회 3유형 질문드려요

0

13

2

예제를 좀 다양하게 해주세요. 너무 간단한 예제만 있어서 ... 좀 그렇습니다.

0

3

0

17강 강의 마지막 부분에서 헷갈리는 부분이 있습니다.

0

7

0

강의 자료를 어디서 확인 할 수 있나요?

1

37

3

주가 예측 정확도

1

157

2

섹션4의 10강 질문이 있습니다.

1

82

2

세션 3까지 듣고 궁금한점이 있어 문의 드립니다,

0

102

2

파이썬 스크립트 작성 프로그램은 뭘로 쓰시는건가요?

1

305

2

DB에 데이터 넣지 않는 이유가 무엇때문인가요?

1

122

1

국내시장용으로 제작하려면 어떻게 해야하나요?

0

153

2

feature 질문 드립니다.

0

82

2

노션 및 수업자료(코드) 다운로드는 어떻게 하나요?

1

223

2

주식 종목 추가

0

270

1