[R] KOSPI/KOSDAQ 全銘柄データの収集および管理

証券市場に上場されている全銘柄を収集し、管理する方法について学びます。自動化を通じて毎日株価を新しく収集し、業種別の銘柄トレンドも把握できるダッシュボードまで、shinyを使って制作してみます。

難易度 中級以上

受講期間 無制限

R
R
Web Crawling
Web Crawling
R
R
Web Crawling
Web Crawling

学習した受講者のレビュー

4.9

5.0

DT로

100% 受講後に作成

実習課題で最高です。

5.0

hakjuknu

87% 受講後に作成

いいね!

5.0

조정태

100% 受講後に作成

講義内容にとても満足しています。ずっと復習をして完璧に理解できるようにします。ありがとうございます。

受講後に得られること

  • KOSPI/KOSDAQ全銘柄収集

  • 業種別銘柄データの管理

  • 業種別銘柄トレンドの把握

🙆🏻‍♀ 全ての株式データの収集および管理/業種別の銘柄管理まで自動化してみる 🙆🏻‍♂

KOSPI/KOSDAQ
全銘柄のデータ収集および管理

🗒 講義紹介

KOSPI/KOSDAQに上場している関心のある銘柄、またはすべての銘柄について分析したいですか?
分析を行うためにはデータが必要です。

この講義は、韓国の株式市場に上場されているすべての銘柄を収集および管理する講義です。
講義では時間の都合上、すべての銘柄について直近3年分のデータを収集しますが、
3を10に変更すれば、簡単に10年分のデータを収集することができます。

今日から直近10年分のデータだけでなく、新しく発生するデータ、つまり翌日に発生するデータも収集します。
自動化を通じて、株式市場の取引が完了する午後4時頃に当日取引されたデータを収集し、毎日銘柄をアップデートします。

以下のアドレスのようなShinyダッシュボードを制作します。

https://leegt.shinyapps.io/shiny/

(一定人数以上が接続すると、アクセスできなくなる場合があります)

🌈 銘柄コードの取得

株式市場に上場している会社(銘柄)は、すべて固有のコードを持っています。
このコードによって、クローリングするアドレスが異なります。
そのため、各会社ごとの固有コードをまず収集します。
あわせて、ネイバー金融から取得できるように、コードの前処理を行います。

🌈 全株式銘柄の収集

各銘柄ごとのネイバー金融のURLを設定した後、全銘柄に対して直近3年分のデータを収集します。
3年分を基準に約4時間かかったため、10年分であれば12時間ほどで収集が完了するものと思われます。

銘柄別の株式日次データを収集した後、各銘柄別のフォルダを作成し、それぞれのフォルダ内に保存します。
さらに、エラーが発生した場合に備えて例外処理まで併せて行います。

🌈 日別株価収集の自動化

このように毎日毎日10年分のデータをスクレイピングしてくることはできません。非常に非効率的だからです。
今日の株式取引が終わったら、今日の株式データだけを収集し、既存の保存データに統合する方式で自動化を進めます。
これで、私たちは毎日午後4時に自動ですべての日別株式データを更新できるようになります。

🌈 業種別株式トレンドの把握およびShinyを通じたダッシュボード制作

中長期的な株式投資の観点から、業種・テーマ別のトレンドを把握することが重要です。
業種別の株式銘柄コードを収集し、これらの銘柄のデータを読み込んでトレンドを把握し、可視化してみます。

🌈 全工程の自動化

毎日株式市場が終わると、日次データを追加で収集し、業種別の銘柄管理および視覚化まで、すべての過程を自動化します。

✅ 必ずご確認ください!

本講義は<R로 하는 웹 크롤링 - 입문편>の続編講義です。
R言語の基礎とクローリングに関する基礎知識があることを前提に講義を進行します。

Rによるウェブスクレイピング - 入門編
Rの概念を学習し、スクレイピングに入門することができます。

こんな方に
おすすめです

学習対象は
誰でしょう?

  • Rが基本的にできる方

  • 株式データを必要とされている方

  • 投資のための基礎データを蓄積したい方

こんにちは
cocoです。

8,480

受講生

522

受講レビュー

136

回答

4.4

講座評価

20

講座

学部では統計学を専攻し、産業工学(人工知能)の博士号を取得して今もなお勉強中の無職です。

受賞

ㆍ 第6回ビッグコンテスト ゲームユーザー離脱アルゴリズム開発 / NCソフト賞(2018)

ㆍ 第5回ビッグコンテスト 住宅ローン延滞者予測アルゴリズム開発 / 韓国情報通信振興協会長賞(2017)

ㆍ 2016 気象ビッグデータコンテスト / 気象産業振興院長賞(2016)

ㆍ 第4回ビッグコンテスト 保険詐欺予測アルゴリズム開発 / 本選進出(2016)

ㆍ 第3回ビッグコンテスト 野球試合予測アルゴリズム開発 / 未来創造科学部 長官賞(2015)

* blog : https://bluediary8.tistory.com

主に研究している分野は、データサイエンス、強化学習、ディープラーニングです。

クローリングとテキストマイニングは、現在は趣味でやっています :)

クローリングを利用して、人気のコミュニティ投稿だけを収集して表示する「マロン」というアプリを開発し、

全国のグルメ店リストとブログを収集して、グルメ推薦アプリも作りましたね :) (見事に大失敗しましたが..)

現在は人工知能を研究している博士課程の学生です。

もっと見る

カリキュラム

全体

23件 ∙ (3時間 55分)

講座資料(こうぎしりょう):

授業資料
講座掲載日: 
最終更新日: 

受講レビュー

全体

8件

4.9

8件の受講レビュー

  • psangkuk6551님의 프로필 이미지
    psangkuk6551

    受講レビュー 4

    平均評価 5.0

    5

    100% 受講後に作成

    実習課題で最高です。

    • taehwanan1911님의 프로필 이미지
      taehwanan1911

      受講レビュー 4

      平均評価 5.0

      5

      100% 受講後に作成

      お得な講義でした。

      • hakjuknu님의 프로필 이미지
        hakjuknu

        受講レビュー 155

        平均評価 5.0

        5

        87% 受講後に作成

        いいね!

        • jtcho님의 프로필 이미지
          jtcho

          受講レビュー 15

          平均評価 5.0

          5

          100% 受講後に作成

          講義内容にとても満足しています。ずっと復習をして完璧に理解できるようにします。ありがとうございます。

          • jangdh1993 (탈퇴)님의 프로필 이미지
            jangdh1993 (탈퇴)

            受講レビュー 1

            平均評価 5.0

            5

            100% 受講後に作成

            ありがとうございます。

            cocoの他の講座

            知識共有者の他の講座を見てみましょう!

            似ている講座

            同じ分野の他の講座を見てみましょう!