講義のテーマ 📖
今回のユニティマシンラーニングエージェント完全征服(応用編)講義を通じて、次のような内容を学習することができます!
- Unityを利用した強化学習環境の制作方法
- 応用強化学習技術のための機械学習エージェントの適用方法
- 応用強化学習アルゴリズム理論とコードを書く方法
- mlagents-learnを用いた応用強化学習アルゴリズムの学習方法
講義の特徴✨
本講義では、強化学習の理論を学習してコードを作成するだけでなく、そのアルゴリズムを学習するための強化学習環境を制作する内容まで取り上げる講義として、強化学習のためのすべての内容を扱うといえます。
また、本講義では一般的な強化学習アルゴリズムだけでなく、マルチエージェント、カリキュラム学習、分散学習、難しい探検環境など、様々な応用強化学習の内容まで幅広く取り上げています。

学習内容📚
Unity Machine Learning Agentの完全征服(応用編)では、応用強化学習技術のための環境制作および強化学習アルゴリズム理論、コード内容を学習します。
具体的に本講義で取り上げる内容は次のとおりです。
アルゴリズム
- Proximal Policy Optimization (PPO)
- Attention PPO
- Adversarial PPO
- MA-POCA
- Exploration by RND (Random Network Distillation)
- HyperNetworks
環境
- Dodge
- ポン
- EscapeRoom
- Maze
- TwoMission
以下の映像は、今回の講義を通じて直接実装してみる強化学習環境と、これを皆さんが実装する強化学習アルゴリズムを通じて学習した結果です。





受講前の注意事項📢
本講義の内容は、Inflearnの「ユニティマシンラーニングエージェント完全征服(基礎編)」の受講を完了したという仮定をして説明を進めています! (基礎編リンク)
もし基礎編を受講していない方は、まず基礎編を受講することをお勧めします!しかし、強化学習の基礎、Unityや機械学習エージェントの基本的な使い方を知っている方は、すぐに応用編講義を受講しても大丈夫です。

練習環境
実習環境の場合、講義を行ったバージョンが若干古いバージョンである関係で、比較的最新のソフトウェアで互換性を確認しました!下記の「講義進行バージョン」と「互換性確認バージョン」のいずれの設定で進めても講義内容を進めることができます。
実習環境(講義進行版)
- Windows 10
- Unity 2021.1.18
- ML-Agents 2.0(Unity)/ML-Agents 0.26.0(Python)
- Python 3.8
- Pytorch 2.0
実習環境(互換性確認版)
- Windows 10
- Unity 2022.3.4
- ML-Agents 3.0(Unity)/ML-Agents 1.0.0(Python)
- Python 3.8
- Pytorch 2.1
ハブハブ🐙
この講義のすべての環境とアルゴリズムのコードは、次のFigHubで見ることができます!よくお聞きする質問内容も該当フラッグハブウィキにまとめられていますのでご参考お願いします!
https://github.com/reinforcement-learning-kr/Unity_ML_Agents_2.0
受講対象/講義目的 🙆♀️
知識共有者が考える受講生の種類
- 強化学習環境の開発に興味のある開発者
- 強化学習の理論と実施に興味がある学生と研究者