강의

멘토링

로드맵

Inflearn brand logo image
AI Development

/

Deep Learning & Machine Learning

Rで簡単に学ぶ強化学習

Q-learningからDeep Q-learningについて学び、強化学習をRで具現してみる時間があります。 Deep Q-network を超えて Self-imitation learning と Random Netowrk Distillation までの全体的な強化学習内容を扱います。

  • coco
Machine Learning(ML)
R
Reinforcement Learning(RL)

こんなことが学べます

  • 強化学習理論

  • Q-learningからDeep Reinforcement Learningまで

  • Explorationのためのいくつかの強化学習技術

🙆🏻‍♀ Q-learningとDeep Q-learningを超えてRNDまで🙆🏻‍♂

🗒講義紹介

アルファゴで始まった強化学習のブーム、強化学習はアルファゴが出る以前から存在していたアルゴリズムであることを知っていましたか?

強化学習は、一般的に勉強するのに進入障壁が高い分野として知られています。アルファゴが出てきてから多くの人が興味を持ち始めていましたが、内容が簡単ではなく、勉強するのが難しいです。強化学習を勉強したかったのですが、難しくて始まらなかった方のために重要な部分だけを選んでまとめてお知らせします。 Q-learning から DQN そして DQN を超えて強化学習の主な問題である sparse reward problem と、これを解決するためのいくつかのアイデアを紹介します。短時間で強化学習を全体的に勉強できる良い講義になります。

🌈強化学習は何ですか?

強化学習がいったい何なのか、強化学習にはどのような要素があり、どのように学習が進行するのかを例に次々と説明します。

🌈手で直接解くQ-learning

言葉だけ説明しては理解できません。手で直接Q-learingを解きながら強化学習の概念をしっかり理解してみましょう。


🌈 Deep Reinforcemen learningの基本となるDQN

Deep reinforcement learningの基本これは、Deep Q-network(DQN)からPerDQNを含む多くのDQN変形、actorcritic、Self-Imitation learingまで重要な内容を中心にまとめています。

🌈強化学習の主な問題であるSparse reward problem

強化学習の主な問題である sparse reward problem について話し、これを解決するためのいくつかの技法について話します。

私たちは主に「curiosity」または「prediction error」について話し、それらを活用したいくつかのアルゴリズムについて紹介します。

(SIL、Random Network Distillationなど)

🌈 Rで直接実装してみるDQN/ActorCritic/SIL/RND

直接コードで実装してみないと半分だけ知っているのでしょう?最も重要なモデルについては、Rで直接強化学習アルゴリズムを組み込み、結果を一緒に確認してみてください。

そしてExplorationのためのRNDが本当に効果があるかどうかを一緒に確認してみましょう。

🙋🏻‍♂️講義に関する予想される質問

Q. 選手の知識はありますか?
A. 機械学習、NNに関する基本的な概念があることをお勧めします。

Q. Pythonで練習しませんか?
A. 現在はRで実習コードを実装して講義をアップロードし、今後はpythonで実習するコードをアップロードする予定です。

こんな方に
おすすめです

学習対象は
誰でしょう?

  • 強化学習簡単に学びたい人

  • 短時間で全体的な強化学習を学びたい人

前提知識、
必要でしょうか?

  • Rプログラミング中級スキル

  • Neural ネットワークの基本的な理解

  • 機械学習の基本的な知識

こんにちは
です。

8,278

受講生

500

受講レビュー

136

回答

4.4

講座評価

20

講座

학부에서는 통계학을 전공하고 산업공학(인공지능) 박사를 받고 여전히 공부중인 백수입니다.

 

수상

ㆍ 제6회 빅콘테스트 게임유저이탈 알고리즘 개발 / 엔씨소프트상(2018)

ㆍ 제5회 빅콘테스트 대출 연체자 예측 알고리즘개발 / 한국정보통신진흥협회장상(2017)

ㆍ 2016 날씨 빅데이터 콘테스트/ 기상산업 진흥원장상(2016) 

ㆍ 제4회 빅콘테스트 보험사기 예측 알고리즘 개발 / 본선진출(2016)

ㆍ 제3회 빅콘테스트 야구 경기 예측 알고리즘 개발 / 미래창조과학부 장관상(2015)

* blog : https://bluediary8.tistory.com

주로 연구하는 분야는 데이터 사이언스, 강화학습, 딥러닝 입니다.

크롤링과 텍스트마이닝은 현재는 취미로 하고있습니다 :) 

크롤링을 이용해서 인기있는 커뮤니티 글만 수집해서 보여주는 마롱이라는 앱을 개발하였고

전국의 맛집리스트와 블로그를 수집해서 맛집 추천 앱도 만들었었죠 :) (시원하게 말아먹..)

지금은 인공지능을 연구하는 박사과정생입니다.

 

 

 

 

カリキュラム

全体

20件 ∙ (4時間 31分)

講座資料(こうぎしりょう):

授業資料
講座掲載日: 
最終更新日: 

受講レビュー

全体

3件

4.3

3件の受講レビュー

  • chihooi19851635님의 프로필 이미지
    chihooi19851635

    受講レビュー 5

    平均評価 5.0

    5

    100% 受講後に作成

    It helped me a lot

    • doabc님의 프로필 이미지
      doabc

      受講レビュー 1

      平均評価 3.0

      3

      35% 受講後に作成

      It's a bit difficult to look at without a foundation in artificial intelligence + reinforcement learning.

      • krstyle03v님의 프로필 이미지
        krstyle03v

        受講レビュー 5

        平均評価 5.0

        5

        70% 受講後に作成

        I tried to watch several reinforcement learning lectures, but I personally think that this person is the best at explaining the overall picture of reinforcement learning in an interesting way. I have only read up to section 2, but it keeps making me curious. However, since I have limited access to R, I have a hard time understanding the code, so I really hope that the Python code comes out soon.

        ¥6,526

        cocoの他の講座

        知識共有者の他の講座を見てみましょう!

        似ている講座

        同じ分野の他の講座を見てみましょう!