Cuộc chinh phục hoàn chỉnh của Unity Machine Learning Agent (Cơ bản)
Thông qua bài giảng này, sinh viên sẽ không chỉ học các lý thuyết khác nhau về học tăng cường và trực tiếp triển khai chúng mà còn có thể tạo ra môi trường học tăng cường để kiểm tra thuật toán học tăng cường được triển khai bằng tác nhân học máy Unity.
Triển khai môi trường học tăng cường, Dễ dàng và tiện lợi với Unity!
môi trường học tăng cường , Tôi nên chuẩn bị như thế nào?
Kể từ màn trình diễn đột phá của AlphaGo vào năm 2016, sự quan tâm đến học tăng cường , được biết đến là đã được áp dụng cho AlphaGo, đã tăng lên đáng kể, và sự nhiệt tình vẫn còn rất lớn. Các thành phần chính của học tăng cường là thuật toán học tăng cường và môi trường học tăng cường, như được hiển thị bên dưới. Hai thành phần này trao đổi thông tin, bao gồm hành động, trạng thái và phần thưởng, cho phép thuật toán học tăng cường học tập.
Kể từ AlphaGo, các thuật toán học tăng cường đã có những tiến bộ đáng kể. Để đáp ứng nhu cầu đó, nhiều môi trường học tăng cường đã được phát hành, bao gồm OpenAI GYM, Mujoco, Atari, GTA5 và Malmo. Hầu hết các môi trường này đều dựa trên trò chơi. Mặc dù học tăng cường rõ ràng là một thuật toán lý tưởng cho trò chơi, nhưng gần đây đã có sự gia tăng đột biến trong các nỗ lực áp dụng nó ngoài trò chơi vào nhiều lĩnh vực khác nhau, bao gồm đề xuất, robot, máy bay không người lái, năng lượng và tài chính.
Tuy nhiên, môi trường học tăng cường cho các lĩnh vực đa dạng này vẫn còn thiếu. Đặc biệt, rất khó để mong đợi một môi trường đáp ứng chính xác các yêu cầu cụ thể của nhà phát triển được phát hành. Ngay cả khi bạn có một môi trường robot với cấu hình cảm biến và cấu trúc khớp cụ thể mà bạn muốn áp dụng học tăng cường, việc bắt đầu nghiên cứu mà không có môi trường học tăng cường công khai cho lĩnh vực đó có thể là bất khả thi.
Nếu bạn sử dụng một môi trường đã được tạo ra, Có những nhược điểm sau:
Về môi trường Sujeong khó khăn
Đối với mỗi môi trường Cách sử dụng sự khác biệt
cần thiết Môi trường Có thể không có bất kỳ
Nhưng vào tháng 9 năm 2017, Unity, một trong những công ty phát triển game lớn nhất thế giới, đã phát hành một công cụ có tên là Unity Machine-Learning Agent có thể giải quyết vấn đề này.
Với Unity ML-Agents Triển khai môi trường học tăng cường!
Nếu chúng ta sử dụng Unity Machine Learning Agents thì sao?
Trong bài giảng này, bạn sẽ tìm hiểu cách triển khai nhiều môi trường học tăng cường khác nhau bằng Unity Machine Learning Agent, cũng như lý thuyết và cách triển khai mã của các thuật toán học tăng cường áp dụng cho các môi trường đó.
Thông tin trước khi tham gia lớp học!
Nội dung của khóa học này giống hệt với cuốn sách "Học tăng cường với PyTorch và Unity ML-Agents". Vui lòng lưu ý điều này trước khi tham dự.
Làm chủ các tác nhân học máy Unity - Cơ bản
Toàn bộ khóa học "Nắm vững hoàn toàn các Agent Học máy của Unity" sẽ được chia thành hai phần: Cơ bản và Ứng dụng. Bài giảng này sẽ đề cập đến phần Cơ bản. Nội dung cụ thể được trình bày trong phần Cơ bản như sau:
Cơ bản và lý thuyết về học tăng cường
Cài đặt Unity và sử dụng cơ bản
Cài đặt Unity Machine Learning Agents, Mô tả thành phần và Cách sử dụng (mlagents-learn, Python API)
Tạo môi trường
GridWorld, Drone, KartRacing
Học lý thuyết thuật toán học tăng cường và triển khai mã
DQN, A2C, DDPG, Nhân bản hành vi
Mã cho môi trường chúng ta sẽ tạo và các thuật toán chúng ta sẽ học trong bài giảng này đều có trên GitHub . Những hình ảnh bên dưới là môi trường học tăng cường mà bạn sẽ triển khai trong bài giảng này và kết quả học tập bằng thuật toán học tăng cường mà bạn sẽ triển khai.
Tạo môi trường Gridworld
Tạo môi trường máy bay không người lái
Tạo môi trường đua xe kart
Những câu hỏi thường gặp Hãy xem thử nhé.
H. Tôi chưa từng sử dụng Unity trước đây. Tôi có thể tham gia khóa học này không?
Ngay cả người mới bắt đầu sử dụng Unity cũng sẽ thấy khóa học này dễ hiểu, bắt đầu từ cài đặt và chuyển sang quy trình tạo một môi trường đơn giản. Mặc dù khóa học không đề cập chi tiết về Unity, nhưng sau khi hoàn thành khóa học, bạn sẽ có thể tạo môi trường bằng cách sử dụng tài nguyên từ Asset Store hoặc tự tạo một môi trường đơn giản, tạo môi trường học tăng cường.
H. Tôi có cần phải quen thuộc với học tăng cường để sử dụng tác nhân học máy không?
Tác tử học máy là các công cụ hỗ trợ cơ bản cho học tăng cường, vì vậy việc hiểu biết cơ bản về các khái niệm học tăng cường là điều cần thiết để sử dụng dễ dàng hơn. Tuy nhiên, Unity Machine Learning Agents cũng cung cấp nhiều thuật toán học tăng cường, cho phép các tác tử học trong môi trường học tăng cường. Chức năng này cho phép bạn dễ dàng sử dụng các tác tử học máy ngay cả khi không có kiến thức chuyên sâu về học tăng cường.
H. Tôi có cần hiểu biết sâu sắc về học sâu hoặc kinh nghiệm triển khai rộng rãi để tham gia khóa học này không?
Nếu bạn đã triển khai mô hình phân loại dữ liệu MNIST bằng PyTorch, bạn sẽ có thể dễ dàng tham gia khóa học này. Ngay cả những người đã có kinh nghiệm sử dụng TensorFlow 2.x cũng có thể dễ dàng tham gia khóa học này nếu họ chỉ cần nắm vững những kiến thức cơ bản về PyTorch.
Khuyến nghị cho những người này
Khóa học này dành cho ai?
Các nhà phát triển quan tâm đến việc phát triển môi trường học tập tăng cường
Sinh viên và nhà nghiên cứu quan tâm đến lý thuyết và thực hiện học tập tăng cường
Đánh giá ngắn gọn từ sinh viên không chuyên ngành và nghệ thuật tự do
"Bài giảng cung cấp góc nhìn và kiến thức rộng rãi cho người mới bắt đầu cũng như các mẹo về học tập củng cố và Đoàn kết cho người khác"
Mình mua sách cũng lâu rồi mà khi nghe có video bài giảng là mình lao ngay vào xem...!
Đây là một bài giảng thực sự giàu thông tin, bao gồm tạo môi trường Unity, lý thuyết và thực hành học tập tăng cường, v.v.
Nhìn vào bức tranh tổng thể, những bài giảng dạy chi tiết về hai lĩnh vực thực sự rất hiếm (thực tế là không có... phải không?). Ngoài ra, nội dung chi tiết thực sự đa dạng, bao gồm không chỉ lý thuyết học tăng cường đơn giản mà còn cả thực hành và các mẹo xây dựng môi trường Unity.
Đặc biệt, thật thú vị khi thực hiện mô phỏng với Unity thay vì chỉ văn bản và tôi có thể tạo một tác nhân học máy...! Rất nhiều điều để suy nghĩ! Nếu bạn đang cân nhắc việc mua hàng, tôi thực sự khuyên bạn nên mua!!
Tôi thực sự rất thích bài giảng!! Đó thực sự là bài giảng tốt nhất cho người mới bắt đầu học tăng cường. Tôi sẽ tiếp tục tự học chăm chỉ cho đến khi bạn quay lại với phiên bản nâng cao/ứng dụng. Cảm ơn
Tôi rất thích các video bài giảng! Ngay cả khi không có kiến thức chuyên môn về học tăng cường, tôi vẫn có thể hiểu đầy đủ về nó. Thật khó để tìm thấy tài liệu giải thích bằng tiếng Hàn cho Unity ML-Agent, nhưng thật tốt khi bạn có thể đề cập đến tất cả thiết kế cơ bản chỉ bằng một bài giảng này. Tôi không chỉ mong đợi những điều cơ bản mà còn cả những phiên bản trung cấp và nâng cao.
Tôi đã có thể hiểu biết chung về việc triển khai học tăng cường bằng cách định cấu hình môi trường học tập trong Unity. Vẫn còn lỗi khi thực thi tập lệnh trong Unity, nhưng điều này sẽ dần dần được cải thiện. Nó đã giúp ích cho tôi rất nhiều và tôi rất mong chờ phiên bản ứng dụng.
Xin chào! Cảm ơn bạn rất nhiều vì đã để lại một đánh giá tuyệt vời! Những lỗi nào xảy ra trong tập lệnh Unity? Vui lòng gửi câu hỏi của bạn vào ô câu hỏi và chúng tôi sẽ trả lời nhanh nhất có thể! :)