강의

멘토링

로드맵

Học tăng cường cho lập trình viên (tác giả trực tiếp giảng dạy)

Khóa học dễ nhất và chi tiết nhất về Học tăng cường - Công nghệ cốt lõi cho Đổi mới Kinh doanh!!! Mỗi ngày 2 tiếng (2 bài giảng), trong 17 ngày, chúng tôi sẽ giúp bạn nắm vững Học tăng cường. Kể từ giờ phút này, Học tăng cường không còn là vấn đề khó hiểu mà sẽ trở thành công cụ tuyệt vời dành cho bạn.

(4.5) 32 đánh giá

471 học viên

Độ khó Cơ bản

Thời gian Không giới hạn

Reinforcement Learning(RL)
Reinforcement Learning(RL)
Artificial Neural Network
Artificial Neural Network
Reinforcement Learning(RL)
Reinforcement Learning(RL)
Artificial Neural Network
Artificial Neural Network

Thông tin về các hành động xảy ra lỗi của chương trình (10/12/2022)

Đây là thông báo liên quan đến lỗi xảy ra vào ngày 10 tháng 12 năm 2022.

Sau khi tôi đăng bài giảng thì các gói liên quan đã có nhiều thay đổi.

Có ba loại lỗi có thể xảy ra:

Lỗi số 1 xảy ra do gói protoc đã bị thay đổi.

Bạn có thể giải quyết vấn đề bằng cách xóa gói protobuf và cài đặt phiên bản 3.8.

Lỗi số 2 là do vấn đề với chức năng reset do gói gym cung cấp. Vì giá trị trả về được đưa ra dưới dạng từ điển nên việc thêm mã trạng thái [0] để chọn giá trị đầu tiên sẽ giải quyết được vấn đề.

Lỗi số 3 là sự cố xảy ra do giá trị trả về bổ sung của hàm bước do gói phòng tập thể dục cung cấp được thêm vào. Điều này có thể được giải quyết bằng cách thêm một biến none2 nữa vào bộ thu.

1. Khi chạy chương trình ví dụ, xảy ra lỗi sau:

TypeError: Không thể tạo trực tiếp bộ mô tả.

Nếu cuộc gọi này đến từ tệp _ pb2.py thì mã được tạo của bạn đã lỗi thời và phải được tạo lại bằng protoc >= 3.19.0.

Nếu bạn không thể tạo lại proto của mình ngay lập tức, một số cách giải quyết khác có thể là:

1. Hạ cấp gói protobuf xuống 3.20.x hoặc thấp hơn.

2. Đặt PROTOCOL_BUFFERS_PYTHON_IMPLEMENTATION=python (nhưng điều này sẽ sử dụng phân tích cú pháp Python thuần túy và sẽ chậm hơn nhiều).

1. Giải pháp

pip gỡ cài đặt protobuf

pip cài đặt protobuf==3.8

2. Giải pháp xử lý từ điển

trạng thái = env.reset()

state = state[0] #Thêm mã

3. Giải pháp cộng giá trị trả về

state_next, phần thưởng, xong, không có, không có2 = self.env.step(hành động)

 

Bình luận