あなたが今、強化学習を学ぶべき理由 😆
強化学習とは、簡単に言えば、コンピュータプログラムが与えられた状況でどのような行動を取るかを学習することを 意味します。つまり、難しい意思決定問題を簡単に解決できる一種の機械学習だと理解すればいいと思います。強化学習は人工知能が意思決定をする上で最も重要な内容の一つであり、自ら機械が相互作用を通じて最適な結論を出すことができるプログラムを設計できるようになります。
しかし難しい。難しいとても難しいです 😱
強化学習を勉強したい私たちの風と違って、強化学習を一人で勉強するのは難しいです。最大の2つの理由を挙げてみましょう。
代表的な強化学習公式が盛り込まれている原理を理解するのは難しい。 TD vs MC、Value-based vs Policy-basedなどのアルゴリズムには様々な概念が混在している。 基本欺瞞でもしっかりしても、学習スピードにブースターができますよ🔥 強化学習を勉強すれば最新の論文や眩しいデモを夢見ることができますが、もっと遠い未来のためには強化学習の基本基を忠実に身につける必要があります。 この講義を通じて、皆さんは強化学習の 基礎概念を深く学び、次のような姿で生まれ変わることができます。
強化学習の問題定義を明確に理解できるようになります。 MDP、ダイナミックプログラミングについて理解できるようになります。 時間差学習、モンテカルロ方法など強化学習の核心技術について次々と知ることができます。 強化学習の論文を見ると、数式が理解され始めます。 私の講義だけの特別な点😗 強化学習の各コアコンセプトだけを選んで! マルチアームバンディット、マルコフギャル決定過程から動的プログラミング、モンテカルロ法など 強化学習に必要な核心概念だけを整理し、基礎からきちんとお知らせします。 特定の問題でどの強化学習技法を使用すべきかを理解することができます! 理論を知ることで終わらない。実際の練習過程を私と一緒に経験してみて 特定の状況でどのように対処すべきかを直感的に理解することができます。 様々な実習を通じたコンセプト体化! 基礎理論を学んだ後、すぐに実習として適用する過程を通じて学んだ内容をすぐに 私のものにするのに役立ちます。
この講義で学ぶ内容 😝 強化学習の基礎 強化学習の基礎理論とフレームワークについて学び、人工知能の報酬体系に関連する基礎概念であるマルチアームバンディットとマルコフの状態、報酬、状態遷移などについて学びます。
動的プログラミング 前述のマルコフ決定プロセスの内容に基づいて、動的プログラミングの定義と活用方法についてお知らせします。
モンテカルロの方法 計算しようとしている値が複雑な場合に使用するモンテカルロ法の基礎概念について学びます。
時間差学習 実際の学習の経験から直接学ぶ形の時間差学習の基礎概念を調べ、モンテカルロ方法と直接比較し、どのような状況で活用できるかを学びます。
モデルベースの強化学習
機械学習におけるモデルの概念を学び、表とモデルに基づく強化学習理論を学び、自分で練習してみます。
政策ベースの強化学習
価値関数に基づいて行動を決定するのではなく、状況に応じて行動を選択する方針ベースの強化学習について学びます。
私はこんな人です😝
私のキャリアは次のとおりです。 県)Riiid VP of AIOps 県)Google Developer Expert for ML 前)ネイバーAI Research Engineer 前)カカオData Engineer
講義受講前、気になる点をあらかじめご確認ください! 😝 Q. 非専攻者、入門者も聞ける講義ですか?
はい、そうです。基礎概念を扱うため、専攻者ではない方も明確に理解できるよう、次々とお知らせします。
Q. なぜ強化学習を学ぶべきですか?
私は人工知能の未来が強化学習にかかっていると信じています。特にAI Productionと強化学習をキャリアの2つのキーワードにしただけに強化学習に対する確信があります。
Q. 強化学習を学ぶと何がいいですか?
人工知能が与えられた状況で意思決定を下す方法の理論的基盤を築くことができます。
Q. 講義を聞く前に、準備すべきことはありますか?
Pythonの基礎を少し覚えておくと、講義の受講に役立ちます。
Q. 授業内容をどのレベルまで扱いますか?
基礎理論と簡単な実習まで扱うことになります。
もしかしたら、この講義も聞いてみましたか? ✨ Chris Song 知識共有者の機械学習講義