
유니티 머신러닝 에이전트 완전정복 (응용편)
민규식
이 강의를 통해 멀티에이전트, 커리큘럼 학습, 분산학습 등 머신러닝 에이전트의 다양한 기능들을 배우고 직접 사용해볼 수 있습니다. 또한 호기심 기반 탐험, 가변적인 입력에도 대응 가능한 강화학습 알고리즘에 대해서도 학습할 수 있습니다.
Intermediate
강화학습, Unity, Unity ML-Agents
Thông qua bài giảng này, sinh viên sẽ không chỉ học các lý thuyết khác nhau về học tăng cường và trực tiếp triển khai chúng mà còn có thể tạo ra môi trường học tăng cường để kiểm tra thuật toán học tăng cường được triển khai bằng tác nhân học máy Unity.
497 học viên
đoàn kết phát triển
Tác nhân học máy Unity
Xây dựng môi trường học tập củng cố
Lý thuyết học tăng cường
Triển khai mã học tập tăng cường
Triển khai môi trường học tăng cường,
Dễ dàng và tiện lợi với Unity!
Kể từ màn trình diễn đột phá của AlphaGo vào năm 2016, sự quan tâm đến học tăng cường , được biết đến là đã được áp dụng cho AlphaGo, đã tăng lên đáng kể, và sự nhiệt tình vẫn còn rất lớn. Các thành phần chính của học tăng cường là thuật toán học tăng cường và môi trường học tăng cường, như được hiển thị bên dưới. Hai thành phần này trao đổi thông tin, bao gồm hành động, trạng thái và phần thưởng, cho phép thuật toán học tăng cường học tập.
Kể từ AlphaGo, các thuật toán học tăng cường đã có những tiến bộ đáng kể. Để đáp ứng nhu cầu đó, nhiều môi trường học tăng cường đã được phát hành, bao gồm OpenAI GYM, Mujoco, Atari, GTA5 và Malmo. Hầu hết các môi trường này đều dựa trên trò chơi. Mặc dù học tăng cường rõ ràng là một thuật toán lý tưởng cho trò chơi, nhưng gần đây đã có sự gia tăng đột biến trong các nỗ lực áp dụng nó ngoài trò chơi vào nhiều lĩnh vực khác nhau, bao gồm đề xuất, robot, máy bay không người lái, năng lượng và tài chính.
Tuy nhiên, môi trường học tăng cường cho các lĩnh vực đa dạng này vẫn còn thiếu. Đặc biệt, rất khó để mong đợi một môi trường đáp ứng chính xác các yêu cầu cụ thể của nhà phát triển được phát hành. Ngay cả khi bạn có một môi trường robot với cấu hình cảm biến và cấu trúc khớp cụ thể mà bạn muốn áp dụng học tăng cường, việc bắt đầu nghiên cứu mà không có môi trường học tăng cường công khai cho lĩnh vực đó có thể là bất khả thi.
Về môi trường
Sujeong
khó khăn
Đối với mỗi môi trường
Cách sử dụng
sự khác biệt
cần thiết
Môi trường
Có thể không có bất kỳ
Nhưng vào tháng 9 năm 2017, Unity, một trong những công ty phát triển game lớn nhất thế giới, đã phát hành một công cụ có tên là Unity Machine-Learning Agent có thể giải quyết vấn đề này.
Trong bài giảng này, bạn sẽ tìm hiểu cách triển khai nhiều môi trường học tăng cường khác nhau bằng Unity Machine Learning Agent, cũng như lý thuyết và cách triển khai mã của các thuật toán học tăng cường áp dụng cho các môi trường đó.
Nội dung của khóa học này giống hệt với cuốn sách "Học tăng cường với PyTorch và Unity ML-Agents". Vui lòng lưu ý điều này trước khi tham dự.
Toàn bộ khóa học "Nắm vững hoàn toàn các Agent Học máy của Unity" sẽ được chia thành hai phần: Cơ bản và Ứng dụng. Bài giảng này sẽ đề cập đến phần Cơ bản. Nội dung cụ thể được trình bày trong phần Cơ bản như sau:
Mã cho môi trường chúng ta sẽ tạo và các thuật toán chúng ta sẽ học trong bài giảng này đều có trên GitHub .
Những hình ảnh bên dưới là môi trường học tăng cường mà bạn sẽ triển khai trong bài giảng này và kết quả học tập bằng thuật toán học tăng cường mà bạn sẽ triển khai.
Tạo môi trường Gridworld
Tạo môi trường máy bay không người lái
Tạo môi trường đua xe kart
H. Tôi chưa từng sử dụng Unity trước đây. Tôi có thể tham gia khóa học này không?
Ngay cả người mới bắt đầu sử dụng Unity cũng sẽ thấy khóa học này dễ hiểu, bắt đầu từ cài đặt và chuyển sang quy trình tạo một môi trường đơn giản. Mặc dù khóa học không đề cập chi tiết về Unity, nhưng sau khi hoàn thành khóa học, bạn sẽ có thể tạo môi trường bằng cách sử dụng tài nguyên từ Asset Store hoặc tự tạo một môi trường đơn giản, tạo môi trường học tăng cường.
H. Tôi có cần phải quen thuộc với học tăng cường để sử dụng tác nhân học máy không?
Tác tử học máy là các công cụ hỗ trợ cơ bản cho học tăng cường, vì vậy việc hiểu biết cơ bản về các khái niệm học tăng cường là điều cần thiết để sử dụng dễ dàng hơn. Tuy nhiên, Unity Machine Learning Agents cũng cung cấp nhiều thuật toán học tăng cường, cho phép các tác tử học trong môi trường học tăng cường. Chức năng này cho phép bạn dễ dàng sử dụng các tác tử học máy ngay cả khi không có kiến thức chuyên sâu về học tăng cường.
H. Tôi có cần hiểu biết sâu sắc về học sâu hoặc kinh nghiệm triển khai rộng rãi để tham gia khóa học này không?
Nếu bạn đã triển khai mô hình phân loại dữ liệu MNIST bằng PyTorch, bạn sẽ có thể dễ dàng tham gia khóa học này. Ngay cả những người đã có kinh nghiệm sử dụng TensorFlow 2.x cũng có thể dễ dàng tham gia khóa học này nếu họ chỉ cần nắm vững những kiến thức cơ bản về PyTorch.
Khóa học này dành cho ai?
Các nhà phát triển quan tâm đến việc phát triển môi trường học tập tăng cường
Sinh viên và nhà nghiên cứu quan tâm đến lý thuyết và thực hiện học tập tăng cường
Cần biết trước khi bắt đầu?
Kinh nghiệm sử dụng Python và PyTorch
Lý thuyết deep learning cơ bản (ANN, CNN)
Tất cả
38 bài giảng ∙ (7giờ 18phút)
Tài liệu khóa học:
Tất cả
21 đánh giá
4.1
21 đánh giá
Đánh giá 1
∙
Đánh giá trung bình 5.0
5
비전공, 문과생의 간단 후기 "초보자에게는 넓은 시야와 지식을 그 외에 분들에게는 강화학습 및 유니티 꿀팁을 얻을 수 있는 강의" 예전에 책도 구매하였는데 영상 강의가 있다는 소식에 달려왔습니다...! 유니티 환경 제작, 강화학습 이론 및 실습 등 정말 알차게 담겨있는 강의입니다. 크게 봐도 2개의 분야를 세세하게 알려주는 강의는 정말 흔하지 않습니다 (사실 없...죠 ㅠ) . 거기다가 단순 강화학습 이론뿐만 아니라 실습, 유니티 환경 구축 꿀팁까지 세부적인 내용이 정말 다채롭습니다. 특히 단순하게 글만 있는 것 보다 Unity로 시뮬레이션을 진행하니 되게 재밌으면서도 내가 머신러닝 에이전트를 만들 수 있구나....! 생각이 많이 들었습니다! 구매를 고민하신다면 저는 구매 강력 추천드립니다!!
Đánh giá 1
∙
Đánh giá trung bình 5.0
Đánh giá 10
∙
Đánh giá trung bình 5.0
Đánh giá 1
∙
Đánh giá trung bình 5.0
Đánh giá 1
∙
Đánh giá trung bình 5.0
5
유니티에서 학습 환경을 구성하여 강화학습을 구현하는데 전반적인 이해를 할 수 있었습니다. 아직 유니티에서 스크립트 실행에 에러가 발생하는데 앞으로 차차 나아지겠지요 도움이 많이 되었고 응용편도 아주 기대하고 있겠습니다.
안녕하세요! 좋은 수강평 남겨주셔서 정말 감사드립니다! 유니티 스크립트에서 어떤 에러가 발생하실까요? 질문란에 올려주시면 최대한 빠르게 답변 드리겠습니다! :)
1.405.028 ₫
Hãy khám phá các khóa học khác của giảng viên!
Khám phá các khóa học khác trong cùng lĩnh vực!