作りながら学ぶ人工知能(強化学習編)
このコースでは、強化学習を数学的に説明します。 さらに、言語の中で一番アクセスしやすいPythonで書いておいたRLkitを直接コーディングしながら、実際のティックタックトークゲームを実装して実行することができます。

お知らせ
1 件
こんにちは。 「作りながら学ぶ人工知能(強化学習編) in inflearn」の講師Kwangです。
まず、講義を受講していただきありがとうございます。
「作りながら学ぶ人工知能」講義は、私がアルファゴを見て、私もあんなことを作りたいという衝動から始めました。実際、アルファゴは、単純なQ-learningアルゴリズムではなく、DQN(Deep Q-learning network)と呼ばれるニューナルネットワークを使用する複雑なノームでした。私がDQNまで学んでいるので、Tensorflowの障壁は大変でした。それで、単純なQ-learningだけでティックタックトークを学習しました。
今、強化学習の花であるDQNを利用して素敵なやつを作るよう努めています。そしてこの過程を講義にしています。言うことと学ぶ内容が多すぎて小さな講義単位に分けて作ってみようと思います。その中で最初の講座である「必ず知っておくべきTensorflow数学」の講義が出ました。
Tensorflowネットワーク学習は最終的に傾斜降下法を実行するプロセスです。傾斜下降法?その未知の数学を聞いてみましたが、私たちは数学として理解していません。私はアルゴリズムを数学的に理解しなければはっきりわからないと思います。それで、Tensorfowで本格底に入る前に傾斜下降法を知っていく講義を作りました。
このシリーズの最終目標は、本来のTickTaktokをTensorflowとして実行することです。
https://www.inflearn.com/course/%ED%85%90%EC%84%9C%ED%94%8C%EB%A1%9C%EC%9A%B0-%EC%88%98% ED%95%99#
この船に皆さんも一緒に乗船してみてください。

