Học tăng cường cho lập trình viên (tác giả trực tiếp giảng dạy)
Khóa học dễ nhất và chi tiết nhất về Học tăng cường - Công nghệ cốt lõi cho Đổi mới Kinh doanh!!! Mỗi ngày 2 tiếng (2 bài giảng), trong 17 ngày, chúng tôi sẽ giúp bạn nắm vững Học tăng cường. Kể từ giờ phút này, Học tăng cường không còn là vấn đề khó hiểu mà sẽ trở thành công cụ tuyệt vời dành cho bạn.
471 học viên
Độ khó Cơ bản
Thời gian Không giới hạn


Thông tin về các hành động xảy ra lỗi của chương trình (10/12/2022)
Đây là thông báo liên quan đến lỗi xảy ra vào ngày 10 tháng 12 năm 2022.
Sau khi tôi đăng bài giảng thì các gói liên quan đã có nhiều thay đổi.
Có ba loại lỗi có thể xảy ra:
Lỗi số 1 xảy ra do gói protoc đã bị thay đổi.
Bạn có thể giải quyết vấn đề bằng cách xóa gói protobuf và cài đặt phiên bản 3.8.
Lỗi số 2 là do vấn đề với chức năng reset do gói gym cung cấp. Vì giá trị trả về được đưa ra dưới dạng từ điển nên việc thêm mã trạng thái [0] để chọn giá trị đầu tiên sẽ giải quyết được vấn đề.
Lỗi số 3 là sự cố xảy ra do giá trị trả về bổ sung của hàm bước do gói phòng tập thể dục cung cấp được thêm vào. Điều này có thể được giải quyết bằng cách thêm một biến none2 nữa vào bộ thu.
1. Khi chạy chương trình ví dụ, xảy ra lỗi sau:
TypeError: Không thể tạo trực tiếp bộ mô tả.
Nếu cuộc gọi này đến từ tệp _ pb2.py thì mã được tạo của bạn đã lỗi thời và phải được tạo lại bằng protoc >= 3.19.0.
Nếu bạn không thể tạo lại proto của mình ngay lập tức, một số cách giải quyết khác có thể là:
1. Hạ cấp gói protobuf xuống 3.20.x hoặc thấp hơn.
2. Đặt PROTOCOL_BUFFERS_PYTHON_IMPLEMENTATION=python (nhưng điều này sẽ sử dụng phân tích cú pháp Python thuần túy và sẽ chậm hơn nhiều).
1. Giải pháp
pip gỡ cài đặt protobuf
pip cài đặt protobuf==3.8
2. Giải pháp xử lý từ điển
trạng thái = env.reset()
state = state[0] #Thêm mã
3. Giải pháp cộng giá trị trả về
state_next, phần thưởng, xong, không có, không có2 = self.env.step(hành động)




