
Xây dựng kiến thức cơ bản về lập trình R
coco
Lớp này được thiết kế để đặt nền tảng về lập trình R cho những người chưa biết gì về lập trình R.
Beginner
R
Bạn sẽ tìm hiểu về Q-learning và Deep Q-learning, đồng thời có thời gian triển khai học tăng cường trong R. Nó bao gồm toàn bộ nội dung học tập tăng cường ngoài mạng Q sâu đến học tự bắt chước và Chưng cất mạng ngẫu nhiên.
96 học viên
Độ khó Trung cấp trở lên
Thời gian Không giới hạn

Lý thuyết học tăng cường
Từ Q-learning đến Học tăng cường sâu
Các kỹ thuật học tăng cường khác nhau để khám phá
🙆🏻♀ Vượt xa Q-learning và Deep Q-learning đến RND🙆🏻♂
Sự bùng nổ của học tăng cường bắt đầu với AlphaGo. Bạn có biết rằng học tăng cường là một thuật toán đã tồn tại từ rất lâu trước AlphaGo không?
Học tăng cường thường được biết đến là một lĩnh vực có rào cản gia nhập cao. Mặc dù sự xuất hiện của AlphaGo đã khơi dậy sự quan tâm, nhưng bản chất phức tạp của chủ đề này lại khiến việc học trở nên khó khăn. Dành cho những ai đã háo hức tìm hiểu về học tăng cường nhưng còn ngần ngại chưa dám bắt đầu, khóa học này sẽ tóm tắt những điểm chính. Từ học Q đến DQN, và hơn thế nữa, khóa học này khám phá bài toán phần thưởng thưa thớt, một thách thức quan trọng trong học tăng cường, và các ý tưởng khác nhau để giải quyết nó. Khóa học này sẽ cung cấp tổng quan toàn diện về học tăng cường trong một thời gian ngắn.
Chúng tôi sẽ giải thích từng bước, bằng ví dụ, về học tăng cường là gì, nó bao gồm những yếu tố nào và quá trình học diễn ra như thế nào.
Chỉ giải thích bằng lời thôi là chưa đủ. Hãy cùng thử tự mình giải các bài toán Q-learning để thực sự nắm bắt các khái niệm về học tăng cường.
Cuốn sách này tóm tắt các khái niệm cốt lõi của Học tăng cường sâu, từ mạng Q sâu (DQN) đến nhiều biến thể DQN khác nhau bao gồm PerDQN, actorcritic và học tự mô phỏng.
Chúng ta sẽ thảo luận về vấn đề phần thưởng thưa thớt, một vấn đề lớn trong học tăng cường, và thảo luận về các kỹ thuật khác nhau để giải quyết vấn đề này.
Chúng tôi chủ yếu nói về 'sự tò mò' hoặc 'lỗi dự đoán' và giới thiệu một số thuật toán sử dụng chúng.
(SIL, Chưng cất mạng ngẫu nhiên, v.v.)
Trừ khi bạn tự triển khai bằng mã, bạn chỉ biết một nửa thôi, phải không? Hãy cùng viết các thuật toán học tăng cường cho các mô hình quan trọng nhất trong R và cùng nhau kiểm tra kết quả.
Và chúng ta hãy cùng xem liệu RND dành cho Khám phá có thực sự hiệu quả không.

H. Bạn có hiểu biết gì về người chơi không?
A. Có hiểu biết cơ bản về máy học và NN là điều tốt.
H. Bạn không tham gia khóa đào tạo thực hành nào về Python sao?
A. Hiện tại, tôi đã tải bài giảng lên bằng cách triển khai mã thực hành trong R, và tôi dự định sẽ tải mã thực hành bằng Python trong tương lai. (Tôi sẽ tải nó lên cùng với bài giảng này, thay vì mở nó như một bài giảng khác.)
Khóa học này dành cho ai?
Bất cứ ai muốn học tăng cường học tập một cách dễ dàng
Bất cứ ai muốn học học tăng cường tổng thể trong một khoảng thời gian ngắn
Cần biết trước khi bắt đầu?
Kỹ năng lập trình R trung cấp
Hiểu biết cơ bản về mạng lưới thần kinh
Kiến thức cơ bản về học máy
8,390
Học viên
509
Đánh giá
136
Trả lời
4.4
Xếp hạng
20
Các khóa học
Tôi là một người thất nghiệp vẫn đang tiếp tục học tập, sau khi tốt nghiệp cử nhân chuyên ngành Thống kê và nhận bằng Tiến sĩ Kỹ thuật Công nghiệp (Trí tuệ nhân tạo).
Giải thưởng
ㆍ Cuộc thi Big Contest lần thứ 6: Phát triển thuật toán dự đoán người dùng rời bỏ trò chơi / Giải thưởng NCSOFT (2018)
ㆍ Cuộc thi Big Contest lần thứ 5 - Phát triển thuật toán dự đoán người nợ quá hạn khoản vay / Giải thưởng của Chủ tịch Hiệp hội Xúc tiến Công nghệ Thông tin và Truyền thông Hàn Quốc (2017)
ㆍ Cuộc thi Big Data Thời tiết 2016 / Giải thưởng của Viện trưởng Viện Thúc đẩy Công nghiệp Khí tượng (2016)
ㆍ Phát triển thuật toán dự đoán gian lận bảo hiểm tại Big Contest lần thứ 4 / Lọt vào vòng chung kết (2016)
ㆍ Cuộc thi Big Contest lần thứ 3: Phát triển thuật toán dự đoán trận đấu bóng chày / Giải thưởng của Bộ trưởng Bộ Khoa học, Công nghệ thông tin và Hoạch định tương lai (2015)
* blog : https://bluediary8.tistory.com
Lĩnh vực nghiên cứu chính của tôi là khoa học dữ liệu, học tăng cường và học sâu.
Hiện tại tôi đang thực hiện việc thu thập dữ liệu (crawling) và khai phá văn bản (text mining) như một sở thích :)
Tôi đã phát triển một ứng dụng có tên là Marong, sử dụng kỹ thuật crawling để thu thập và hiển thị những bài viết phổ biến từ các cộng đồng trực tuyến, và
Tôi cũng từng thu thập danh sách các quán ăn ngon và blog trên toàn quốc để tạo ra một ứng dụng gợi ý quán ăn :) (nhưng rồi cũng thất bại thảm hại..)
Hiện tại, tôi đang là nghiên cứu sinh tiến sĩ chuyên nghiên cứu về trí tuệ nhân tạo.
Tôi đã từng phát triển và tạo ra một ứng dụng gợi ý quán ăn ngon bằng cách thu thập danh sách các nhà hàng và blog ẩm thực trên toàn quốc :) (nhưng đã thất bại thảm hại..). Hiện tại, tôi đang là nghiên cứu sinh tiến sĩ chuyên ngành trí tuệ nhân tạo.
Tôi đã từng phát triển và tạo ra một ứng dụng gợi ý quán ăn ngon bằng cách thu thập danh sách các quán ăn và blog trên toàn quốc :) (nhưng đã thất bại thảm hại..). Hiện tại, tôi đang là nghiên cứu sinh tiến sĩ chuyên ngành trí tuệ nhân tạo.
Tôi đã từng phát triển và tạo ra một ứng dụng gợi ý quán ăn ngon bằng cách thu thập danh sách các quán ăn cũng như các bài blog trên toàn quốc :) (nhưng đã thất bại thảm hại..). Hiện tại, tôi đang là nghiên cứu sinh tiến sĩ chuyên ngành trí tuệ nhân tạo.
Tôi đã từng phát triển và tạo ra một ứng dụng gợi ý quán ăn ngon bằng cách thu thập danh sách các quán ăn và blog trên toàn quốc :) (nhưng đã thất bại thảm hại..). Hiện tại, tôi đang là nghiên cứu sinh tiến sĩ chuyên ngành trí tuệ nhân tạo.
Tất cả
20 bài giảng ∙ (4giờ 31phút)
Tài liệu khóa học:
1. định hướng
07:40
6. Mạng Q sâu (DQN)
08:30
13. Học tập tự bắt chước
06:17
Tất cả
3 đánh giá
4.3
3 đánh giá
Đánh giá 5
∙
Đánh giá trung bình 5.0
Đánh giá 5
∙
Đánh giá trung bình 5.0
5
Tôi đã cố gắng xem một số bài giảng về học tăng cường, nhưng cá nhân tôi nghĩ rằng người này giải thích bức tranh tổng thể về học tăng cường rất hay và theo một cách thú vị. Mình mới xem đến phần 2 thôi nhưng nó khiến mình tò mò. Tuy nhiên, vì tôi có quyền truy cập hạn chế vào R nên tôi khó hiểu mã, vì vậy tôi thực sự hy vọng rằng mã Python sẽ sớm ra mắt.
Đánh giá 3
∙
Đánh giá trung bình 4.0
1.146.211 ₫
Hãy khám phá các khóa học khác của giảng viên!
Khám phá các khóa học khác trong cùng lĩnh vực!