강의

멘토링

로드맵

プログラマーのための強化学習(著者直講)

ビジネスイノベーションの核心技術、強化学習に関する最も簡単で詳細な講義!!! 1日2時間(2つの講義)、17日以内に強化学習をあなたの手の中に収めます。今この瞬間から、強化学習は理解しがたい問題ではなく、あなたのための素晴らしいツールになります。

難易度 初級

受講期間 無制限

Reinforcement Learning(RL)
Reinforcement Learning(RL)
Artificial Neural Network
Artificial Neural Network
Reinforcement Learning(RL)
Reinforcement Learning(RL)
Artificial Neural Network
Artificial Neural Network

プログラムエラーアクションガイド(2022年12月10日)

2022年12月10日エラーに関するお知らせです。

私が講義をした後、関連パッケージに多くの変更がありました。

次の3種類のエラーが発生する可能性があります。

1番エラーはprotocパッケージが変更された原因で発生しています。

protobufパッケージを削除し、バージョン3.8をインストールすると問題を解決できます。

エラー2は、gymパッケージが提供するリセット関数の問題です。戻り値を辞書として与えるため、最初の値を選択するstate [0]コードを追加すると問題が解決します。

3番目のエラーは、gymパッケージが提供するstep関数の戻り値が1つ追加されたために発生する問題です。受信部にnone2変数を1つ追加することで解決できます。

1. サンプルプログラムを実行すると、次のようなエラーが発生します。

TypeError: Descriptors cannot not be created directly.

If this call came from a _ pb2.py file, your generated code is out of date and must be regenerated with protoc >= 3.19.0.

If you cannot immediately regenerate your protos, some other possible workarounds are:

1. Downgrade the protobuf package to 3.20.x or lower.

2. Set PROTOCOL_BUFFERS_PYTHON_IMPLEMENTATION=python (but this will use pure-Python parsing and will be much slower).

1. 解決方法

pip uninstall protobuf

pip install protobuf==3.8

2. 辞書処理の解決方法

state = env.reset()

state = state[0] #コード追加

3. return値追加部分の解決方法

state_next, reward, done, none, none2 = self.env.step(action)

 

コメント