Khóa học này giải thích việc học tăng cường mà không cần đến toán học. Bạn có thể tìm hiểu các khái niệm một cách dễ dàng và rõ ràng. Đúng. Bạn có thể triển khai và chạy trò chơi Tic Tac Tok thực tế bằng cách mã hóa trực tiếp RLkit được viết bằng Python, ngôn ngữ dễ tiếp cận nhất.
Các khái niệm cơ bản về học tăng cường
Quá trình ra quyết định của Markov
Triển khai học tăng cường bằng Python
Cách sử dụng khung RLkit
Luyện tập qua trò chơi tic-tac-toe
AlphaGo của Deepman Guide thi đấu với Lee Sedol, được huấn luyện bằng kỹ thuật học máy gọi là học tăng cường. Học tăng cường được coi là giải pháp thay thế tốt nhất khi đào tạo máy móc. Khóa học này giải thích việc học tăng cường mà không cần đến toán học. Bạn có thể tìm hiểu các khái niệm một cách dễ dàng và rõ ràng. Đúng. Bạn có thể triển khai và chạy trò chơi Tic Tac Tok thực tế bằng cách mã hóa trực tiếp RLkit, được viết bằng Python, ngôn ngữ dễ tiếp cận nhất.
Đây là một lĩnh vực của máy học và là phương pháp trong đó tác nhân được xác định trong môi trường sẽ nhận ra trạng thái hiện tại và chọn một hành động hoặc trình tự nhằm tối đa hóa phần thưởng trong số các hành động có thể chọn.
Kwangseong Choi
Tôi đam mê lập trình từ khi còn học cao học. Sau khi tốt nghiệp, tôi ở lại phòng thí nghiệm và tham gia phát triển phần mềm mô phỏng dự đoán nhà máy bán dẫn. Ngôn ngữ chính là C++ và CUDA. Tôi từng làm CTO tại một công ty khởi nghiệp tên là CCG. Chúng tôi đã phát triển ngôn ngữ thông dịch cho GPU có tên SIMPLE. https://github.com/cks3443/simple
Khóa học này dành cho ai?
Những người quan tâm đến trí tuệ nhân tạo
Người mới bắt đầu muốn học học tăng cường
Bất cứ ai quen thuộc với lập trình Python
Những người muốn học thông qua thực hành
Bất kỳ ai quan tâm đến việc phát triển trò chơi
4,923
Học viên
116
Đánh giá
29
Trả lời
3.8
Xếp hạng
9
Các khóa học
Tất cả
16 bài giảng ∙ (58phút)
Tài liệu khóa học: