Học tăng cường cho lập trình viên (tác giả trực tiếp giảng dạy)
Khóa học dễ nhất và chi tiết nhất về Học tăng cường - Công nghệ cốt lõi cho Đổi mới Kinh doanh!!! Mỗi ngày 2 tiếng (2 bài giảng), trong 17 ngày, chúng tôi sẽ giúp bạn nắm vững Học tăng cường. Kể từ giờ phút này, Học tăng cường không còn là vấn đề khó hiểu mà sẽ trở thành công cụ tuyệt vời dành cho bạn.
471 học viên
Độ khó Cơ bản
Thời gian Không giới hạn

Tin tức
2 bài viết
Phiên bản sửa đổi của khóa học học tăng cường dành cho lập trình viên đã được phát hành với tên gọi " Học tăng cường trọn gói: Cơ bản, Thuật toán mới nhất và Ứng dụng thực tế ". Nếu bạn đăng ký ngay bây giờ, bạn có thể tham gia khóa học với mức giảm giá 60% cho đến hết ngày 29 tháng 6.
Đã thêm những giải thích thân thiện và trực quan hơn .
Đã thêm các công cụ thực hành tiên tiến ( Stable Baselines3 ) và các kỹ thuật ( Optuna ).
Chúng tôi đã triển khai rất nhiều dự án ví dụ thực tế ( chiến lược phân bổ tài sản, luân chuyển chi nhánh ).
Cảm ơn
Đây là thông báo liên quan đến lỗi xảy ra vào ngày 10 tháng 12 năm 2022.
Sau khi tôi đăng bài giảng thì các gói liên quan đã có nhiều thay đổi.
Có ba loại lỗi có thể xảy ra:
Lỗi số 1 xảy ra do gói protoc đã bị thay đổi.
Bạn có thể giải quyết vấn đề bằng cách xóa gói protobuf và cài đặt phiên bản 3.8.
Lỗi số 2 là do vấn đề với chức năng reset do gói gym cung cấp. Vì giá trị trả về được đưa ra dưới dạng từ điển nên việc thêm mã trạng thái [0] để chọn giá trị đầu tiên sẽ giải quyết được vấn đề.
Lỗi số 3 là sự cố xảy ra do giá trị trả về bổ sung của hàm bước do gói phòng tập thể dục cung cấp được thêm vào. Điều này có thể được giải quyết bằng cách thêm một biến none2 nữa vào bộ thu.
1. Khi chạy chương trình ví dụ, xảy ra lỗi sau:
TypeError: Không thể tạo trực tiếp bộ mô tả.
Nếu cuộc gọi này đến từ tệp _ pb2.py thì mã được tạo của bạn đã lỗi thời và phải được tạo lại bằng protoc >= 3.19.0.
Nếu bạn không thể tạo lại proto của mình ngay lập tức, một số cách giải quyết khác có thể là:
1. Hạ cấp gói protobuf xuống 3.20.x hoặc thấp hơn.
2. Đặt PROTOCOL_BUFFERS_PYTHON_IMPLEMENTATION=python (nhưng điều này sẽ sử dụng phân tích cú pháp Python thuần túy và sẽ chậm hơn nhiều).
1. Giải pháp
pip gỡ cài đặt protobuf
pip cài đặt protobuf==3.8
2. Giải pháp xử lý từ điển
trạng thái = env.reset()
state = state[0] #Thêm mã
3. Giải pháp cộng giá trị trả về
state_next, phần thưởng, xong, không có, không có2 = self.env.step(hành động)

