뉴스 검색에서 날짜 필터링
13
5 câu hỏi đã được viết
안녕하세요. 강의 재밌게 잘 듣고 있습니다.
뉴스 검색 부분에서 날짜 기준 없이 뉴스를 가져오고 있는데요.
그렇게 되면 오래된 뉴스를 오늘의 호재 뉴스로 잘못 판단할 우려가 있지 않을까요?

24시간 정도의 기간동안의 뉴스를 검색해야 되지 않을까 합니다.
Câu trả lời 2
0
안녕하세요!
답변 드립니다.
- 네이버 종목뉴스는 최신순으로 정렬되고, 저희는 page=1에서 최신 3건(limit=3)만 가져옵니다 → 보통은 최근 기사
- 분석 대상이 "오늘 급등한 종목"이라, 대개 급등을 만든 신선한 뉴스가 상단에 있습니다
그래서 문제가 되는 건 이 경우입니다: 뉴스 없이 수급·차트만으로 급등한 종목. 이때는 상단 3건이 며칠 전 기사일 수 있고, 그게 그대로 호재로 잡힙니다. 말씀하신
우려가 바로 이 케이스예요.
해결은 두 군데를 보강하면 됩니다. 아래 프롬프트를 Claude Code에 그대로 붙여넣으시면 됩니다.
① 수집 단계 — 오래된 뉴스를 애초에 거르기 (collectors.py)
collectors.py의 get_stock_news 함수를 수정해줘.
각 뉴스의 날짜(published_at)를 파싱해서, 오늘 기준 최근 N일 이내의
뉴스만 남기도록 필터를 추가해줘.
- max_age_days 파라미터 추가 (기본값 3)
- published_at은 "2026.02.17" 또는 "2026.02.17 14:30" 형태로 오니
날짜 부분만 datetime으로 변환
- 오늘로부터 max_age_days를 초과한 뉴스는 제외
- 날짜 파싱에 실패한 뉴스는 일단 보존하되 로그만 남겨줘
- 필터 후 뉴스가 limit보다 적어도 억지로 오래된 뉴스로 채우지 말고 그대로 반환
- 필터 전/후 건수를 출력해줘
② 분석 단계 — Gemini에게 날짜를 알려주고 가중치를 낮추게 하기 (llm_analyzer.py)
llm_analyzer.py의 analyze_news를 수정해줘.
news_items의 각 뉴스에 published_at(날짜)도 포함시키고,
Gemini 프롬프트에 각 뉴스의 날짜를 함께 넣어줘.
프롬프트에 다음 지시를 추가해줘:
- 오늘 날짜는 {today}야.
- 발행일이 3일 이상 지난 뉴스는 '오늘의 호재'로 보지 말고 점수에 거의 반영하지 마.
- 최신(1~2일 이내) 뉴스를 위주로 호재 여부를 판단해.
- reason에 어떤 날짜의 뉴스를 근거로 점수를 줬는지 명시해줘.
마지막으로 한 가지 꼭 짚고 싶은 점이 있어요. 이렇게 날짜 필터를 넣었을 때 "최근 뉴스가 하나도 없어서 뉴스 점수가 0점"이 나온다면, 그게 틀린 게 아니라 오히려
정확한 신호입니다. 그 종목은 뉴스가 아니라 수급·차트로 오른 것이고, 시스템은 그 사실을 다른 점수 항목(수급·차트)으로 이미 반영하고 있으니까요. 오래된 뉴스로
억지로 호재 점수를 만드는 것보다, "오늘은 뉴스 재료 없음"을 정직하게 0점으로 두는 편이 예측 정확도에 훨씬 좋습니다.
이런 데이터 신선도(freshness) 점검은 실제 운영 시스템에서 가장 중요하게 다루는 부분 중 하나인데, 그걸 강의만 보고 스스로 발견하셨다는 게 정말 훌륭합니다.
같은 의문을 가질 다른 수강생분들을 위해 다음 강의 업데이트 때 이 내용을 보강 노트로 추가하겠습니다. 좋은 질문 감사합니다 🙌
0
안녕하세요, 인프런 AI 인턴입니다. 강저그님.
뉴스 데이터에서 날짜 필터링은 매우 중요한 요소입니다. 특히 주식과 같이 빠르게 변화하는 시장에서는 오래된 뉴스가 현재의 투자 결정을 오도할 수 있습니다. 따라서 최신 뉴스만을 반영하여 분석하는 것이 권장됩니다.
날짜 필터링의 중요성 및 방법
일반적인 접근 방법:
- 뉴스 API를 사용할 때 날짜를 필터링하여 최근의 뉴스만 수집하는 것이 중요합니다. 보통
timestamp를 기준으로 하거나 특정 기간 내의 뉴스를 불러오는 파라미터(from,to)가 API에 포함되어 있습니다.
- 뉴스 API를 사용할 때 날짜를 필터링하여 최근의 뉴스만 수집하는 것이 중요합니다. 보통
코드 구현 방안:
- 구현 중이신 주식 자동 분석 시스템에서도 이와 같은 날짜 기준을 설정하여, 뉴스 데이터를 가져올 때 ‘지난 24시간’으로 제한하도록 파라미터를 추가할 수 있습니다.
- 구현 중이신 주식 자동 분석 시스템에서도 이와 같은 날짜 기준을 설정하여, 뉴스 데이터를 가져올 때 ‘지난 24시간’으로 제한하도록 파라미터를 추가할 수 있습니다.
주기적인 데이터 갱신:
- 만약 크롤링을 통해 직접 데이터를 수집하신다면, 스케줄러를 통해 정기적으로(예: 매일 1회) 데이터를 최신화하고, 규칙적인 간격으로 최근 뉴스를 갱신하는 기능을 추가하면 좋습니다.
- 만약 크롤링을 통해 직접 데이터를 수집하신다면, 스케줄러를 통해 정기적으로(예: 매일 1회) 데이터를 최신화하고, 규칙적인 간격으로 최근 뉴스를 갱신하는 기능을 추가하면 좋습니다.
유사한 질문과 해결책을 제공한 게시물을 안내드립니다:
- Python에서 뉴스 API 사용 시 날짜 필터링 구현 관련 질의: 수강생들이 API를 통해 뉴스 필터링 기능을 구현한 경험을 공유합니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
scorer.py 에 뉴스/재료 점수 부분이 없어요.
0
16
2
제가 만든 파일로 강의 수강을 이어가도 되나요?
0
23
2
14강은 언제 올라올까요??
0
43
2
Part03 프롬프트 14 기간 조정(횡보 후 돌파) 입력 시 claude에서 수정안 발생
0
41
1
best of best 점수 합산
0
47
1
질문이 있습니다.
0
57
2
안녕하세요? 섹션14는 강의가 언제부터 올라오나요? 너무나 궁금하고 기대가 됩니다~ ^^
0
61
2
antigravity 2.0은 화면이 많이 다르네요.
0
90
2
36. 텔레그램 연동(특강) 노션 링크
0
54
2
오류 문구 입니다.
0
52
1
Part2 - 19번 ~ 20번 강의 사이에 일부 내용이 생략된듯합니다.
0
67
2
Gemini 모델 변경 문의
0
64
2
part2 gemini api 연동
0
60
3
늘 컴퓨터를 켜두어야 하는 것에 대한 질문입니다.
0
48
1
노션 승인 관련
0
65
2
Part2 자료에 대한 질문입니다.
0
56
3
강의 일정
0
57
2
Notion 권한 승인 요청 드립니다.
0
58
2
강의와는 별개로...
0
54
3
안녕하세요 유튜브 보고 재밌을꺼 같아서 강의 결제해서 보고잇습니다.
0
46
2
노션 열기에 도움이 필요합니다.
0
42
2
노션 파일 권한
0
47
2
좋은 강의 자료 감사합니다.
0
37
2
유튜브 영상보고 강의 등록하였습니다.
0
41
2

