강의

멘토링

커뮤니티

AI Technology

/

Deep Learning & Machine Learning

Học tăng cường học dễ dàng với R

Bạn sẽ tìm hiểu về Q-learning và Deep Q-learning, đồng thời có thời gian triển khai học tăng cường trong R. Nó bao gồm toàn bộ nội dung học tập tăng cường ngoài mạng Q sâu đến học tự bắt chước và Chưng cất mạng ngẫu nhiên.

(4.3) 3 đánh giá

96 học viên

Độ khó Trung cấp trở lên

Thời gian Không giới hạn

  • coco
Machine Learning(ML)
Machine Learning(ML)
R
R
Reinforcement Learning(RL)
Reinforcement Learning(RL)
Machine Learning(ML)
Machine Learning(ML)
R
R
Reinforcement Learning(RL)
Reinforcement Learning(RL)

Bạn sẽ nhận được điều này sau khi học.

  • Lý thuyết học tăng cường

  • Từ Q-learning đến Học tăng cường sâu

  • Các kỹ thuật học tăng cường khác nhau để khám phá

🙆🏻‍♀ Vượt xa Q-learning và Deep Q-learning đến RND🙆🏻‍♂

🗒 Giới thiệu khóa học

Sự bùng nổ của học tăng cường bắt đầu với AlphaGo. Bạn có biết rằng học tăng cường là một thuật toán đã tồn tại từ rất lâu trước AlphaGo không?

Học tăng cường thường được biết đến là một lĩnh vực có rào cản gia nhập cao. Mặc dù sự xuất hiện của AlphaGo đã khơi dậy sự quan tâm, nhưng bản chất phức tạp của chủ đề này lại khiến việc học trở nên khó khăn. Dành cho những ai đã háo hức tìm hiểu về học tăng cường nhưng còn ngần ngại chưa dám bắt đầu, khóa học này sẽ tóm tắt những điểm chính. Từ học Q đến DQN, và hơn thế nữa, khóa học này khám phá bài toán phần thưởng thưa thớt, một thách thức quan trọng trong học tăng cường, và các ý tưởng khác nhau để giải quyết nó. Khóa học này sẽ cung cấp tổng quan toàn diện về học tăng cường trong một thời gian ngắn.

🌈 Học tăng cường là gì?

Chúng tôi sẽ giải thích từng bước, bằng ví dụ, về học tăng cường là gì, nó bao gồm những yếu tố nào và quá trình học diễn ra như thế nào.

🌈 Q-learning mà bạn có thể giải bằng tay

Chỉ giải thích bằng lời thôi là chưa đủ. Hãy cùng thử tự mình giải các bài toán Q-learning để thực sự nắm bắt các khái niệm về học tăng cường.


🌈 DQN, nền tảng của học tăng cường sâu

Cuốn sách này tóm tắt các khái niệm cốt lõi của Học tăng cường sâu, từ mạng Q sâu (DQN) đến nhiều biến thể DQN khác nhau bao gồm PerDQN, actorcritic và học tự mô phỏng.

🌈 Vấn đề phần thưởng thưa thớt, vấn đề chính của học tăng cường

Chúng ta sẽ thảo luận về vấn đề phần thưởng thưa thớt, một vấn đề lớn trong học tăng cường, và thảo luận về các kỹ thuật khác nhau để giải quyết vấn đề này.

Chúng tôi chủ yếu nói về 'sự tò mò' hoặc 'lỗi dự đoán' và giới thiệu một số thuật toán sử dụng chúng.

(SIL, Chưng cất mạng ngẫu nhiên, v.v.)

🌈 Triển khai DQN/ActorCritic/SIL/RND trực tiếp trong R

Trừ khi bạn tự triển khai bằng mã, bạn chỉ biết một nửa thôi, phải không? Hãy cùng viết các thuật toán học tăng cường cho các mô hình quan trọng nhất trong R và cùng nhau kiểm tra kết quả.

Và chúng ta hãy cùng xem liệu RND dành cho Khám phá có thực sự hiệu quả không.

🙋🏻‍♂️ Những câu hỏi dự kiến liên quan đến bài giảng

H. Bạn có hiểu biết gì về người chơi không?
A. Có hiểu biết cơ bản về máy học và NN là điều tốt.

H. Bạn không tham gia khóa đào tạo thực hành nào về Python sao?
A. Hiện tại, tôi đã tải bài giảng lên bằng cách triển khai mã thực hành trong R, và tôi dự định sẽ tải mã thực hành bằng Python trong tương lai. (Tôi sẽ tải nó lên cùng với bài giảng này, thay vì mở nó như một bài giảng khác.)

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • Bất cứ ai muốn học tăng cường học tập một cách dễ dàng

  • Bất cứ ai muốn học học tăng cường tổng thể trong một khoảng thời gian ngắn

Cần biết trước khi bắt đầu?

  • Kỹ năng lập trình R trung cấp

  • Hiểu biết cơ bản về mạng lưới thần kinh

  • Kiến thức cơ bản về học máy

Xin chào
Đây là

8,390

Học viên

509

Đánh giá

136

Trả lời

4.4

Xếp hạng

20

Các khóa học

Tôi là một người thất nghiệp vẫn đang tiếp tục học tập, sau khi tốt nghiệp cử nhân chuyên ngành Thống kê và nhận bằng Tiến sĩ Kỹ thuật Công nghiệp (Trí tuệ nhân tạo).

Giải thưởng

ㆍ Cuộc thi Big Contest lần thứ 6: Phát triển thuật toán dự đoán người dùng rời bỏ trò chơi / Giải thưởng NCSOFT (2018)

ㆍ Cuộc thi Big Contest lần thứ 5 - Phát triển thuật toán dự đoán người nợ quá hạn khoản vay / Giải thưởng của Chủ tịch Hiệp hội Xúc tiến Công nghệ Thông tin và Truyền thông Hàn Quốc (2017)

ㆍ Cuộc thi Big Data Thời tiết 2016 / Giải thưởng của Viện trưởng Viện Thúc đẩy Công nghiệp Khí tượng (2016)

ㆍ Phát triển thuật toán dự đoán gian lận bảo hiểm tại Big Contest lần thứ 4 / Lọt vào vòng chung kết (2016)

ㆍ Cuộc thi Big Contest lần thứ 3: Phát triển thuật toán dự đoán trận đấu bóng chày / Giải thưởng của Bộ trưởng Bộ Khoa học, Công nghệ thông tin và Hoạch định tương lai (2015)

* blog : https://bluediary8.tistory.com

Lĩnh vực nghiên cứu chính của tôi là khoa học dữ liệu, học tăng cường và học sâu.

Hiện tại tôi đang thực hiện việc thu thập dữ liệu (crawling) và khai phá văn bản (text mining) như một sở thích :)

Tôi đã phát triển một ứng dụng có tên là Marong, sử dụng kỹ thuật crawling để thu thập và hiển thị những bài viết phổ biến từ các cộng đồng trực tuyến, và

Tôi cũng từng thu thập danh sách các quán ăn ngon và blog trên toàn quốc để tạo ra một ứng dụng gợi ý quán ăn :) (nhưng rồi cũng thất bại thảm hại..)

Hiện tại, tôi đang là nghiên cứu sinh tiến sĩ chuyên nghiên cứu về trí tuệ nhân tạo.

Tôi đã từng phát triển và tạo ra một ứng dụng gợi ý quán ăn ngon bằng cách thu thập danh sách các nhà hàng và blog ẩm thực trên toàn quốc :) (nhưng đã thất bại thảm hại..). Hiện tại, tôi đang là nghiên cứu sinh tiến sĩ chuyên ngành trí tuệ nhân tạo.

Tôi đã từng phát triển và tạo ra một ứng dụng gợi ý quán ăn ngon bằng cách thu thập danh sách các quán ăn và blog trên toàn quốc :) (nhưng đã thất bại thảm hại..). Hiện tại, tôi đang là nghiên cứu sinh tiến sĩ chuyên ngành trí tuệ nhân tạo.

Tôi đã từng phát triển và tạo ra một ứng dụng gợi ý quán ăn ngon bằng cách thu thập danh sách các quán ăn cũng như các bài blog trên toàn quốc :) (nhưng đã thất bại thảm hại..). Hiện tại, tôi đang là nghiên cứu sinh tiến sĩ chuyên ngành trí tuệ nhân tạo.

Tôi đã từng phát triển và tạo ra một ứng dụng gợi ý quán ăn ngon bằng cách thu thập danh sách các quán ăn và blog trên toàn quốc :) (nhưng đã thất bại thảm hại..). Hiện tại, tôi đang là nghiên cứu sinh tiến sĩ chuyên ngành trí tuệ nhân tạo.

Chương trình giảng dạy

Tất cả

20 bài giảng ∙ (4giờ 31phút)

Tài liệu khóa học:

Tài liệu bài giảng
Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Tất cả

3 đánh giá

4.3

3 đánh giá

  • chihooi19851635님의 프로필 이미지
    chihooi19851635

    Đánh giá 5

    Đánh giá trung bình 5.0

    5

    100% đã tham gia

    Nó rất hữu ích

    • krstyle03v님의 프로필 이미지
      krstyle03v

      Đánh giá 5

      Đánh giá trung bình 5.0

      5

      70% đã tham gia

      Tôi đã cố gắng xem một số bài giảng về học tăng cường, nhưng cá nhân tôi nghĩ rằng người này giải thích bức tranh tổng thể về học tăng cường rất hay và theo một cách thú vị. Mình mới xem đến phần 2 thôi nhưng nó khiến mình tò mò. Tuy nhiên, vì tôi có quyền truy cập hạn chế vào R nên tôi khó hiểu mã, vì vậy tôi thực sự hy vọng rằng mã Python sẽ sớm ra mắt.

      • doabc님의 프로필 이미지
        doabc

        Đánh giá 3

        Đánh giá trung bình 4.0

        3

        35% đã tham gia

        Hơi khó nhận thấy nếu không có nền tảng về trí tuệ nhân tạo + học tập tăng cường.

        1.146.211 ₫

        Khóa học khác của coco

        Hãy khám phá các khóa học khác của giảng viên!

        Khóa học tương tự

        Khám phá các khóa học khác trong cùng lĩnh vực!