Inflearn brand logo image
Inflearn brand logo image
Inflearn brand logo image
AI Development

/

Deep Learning & Machine Learning

Học tăng cường học dễ dàng với R

Bạn sẽ tìm hiểu về Q-learning và Deep Q-learning, đồng thời có thời gian triển khai học tăng cường trong R. Nó bao gồm toàn bộ nội dung học tập tăng cường ngoài mạng Q sâu đến học tự bắt chước và Chưng cất mạng ngẫu nhiên.

(4.3) 3 đánh giá

94 học viên

  • coco
Machine Learning(ML)
R
Reinforcement Learning(RL)

Dịch cái này sang tiếng Việt

  • Lý thuyết học tăng cường

  • Từ Q-learning đến Học tăng cường sâu

  • Các kỹ thuật học tăng cường khác nhau để khám phá

🙆🏻‍♀ Vượt xa Q-learning và Deep Q-learning đến RND🙆🏻‍♂

🗒 Giới thiệu khóa học

Sự bùng nổ của học tăng cường bắt đầu với AlphaGo. Bạn có biết rằng học tăng cường là một thuật toán đã tồn tại từ rất lâu trước AlphaGo không?

Học tăng cường thường được biết đến là một lĩnh vực có rào cản gia nhập cao. Mặc dù sự xuất hiện của AlphaGo đã khơi dậy sự quan tâm, nhưng bản chất phức tạp của chủ đề này lại khiến việc học trở nên khó khăn. Dành cho những ai đã háo hức tìm hiểu về học tăng cường nhưng còn ngần ngại chưa dám bắt đầu, khóa học này sẽ tóm tắt những điểm chính. Từ học Q đến DQN, và hơn thế nữa, khóa học này khám phá bài toán phần thưởng thưa thớt, một thách thức quan trọng trong học tăng cường, và các ý tưởng khác nhau để giải quyết nó. Khóa học này sẽ cung cấp tổng quan toàn diện về học tăng cường trong một thời gian ngắn.

🌈 Học tăng cường là gì?

Chúng tôi sẽ giải thích từng bước, bằng ví dụ, về học tăng cường là gì, nó bao gồm những yếu tố nào và quá trình học diễn ra như thế nào.

🌈 Q-learning mà bạn có thể giải bằng tay

Chỉ giải thích bằng lời thôi là chưa đủ. Hãy cùng thử tự mình giải các bài toán Q-learning để thực sự nắm bắt các khái niệm về học tăng cường.


🌈 DQN, nền tảng của học tăng cường sâu

Cuốn sách này tóm tắt các khái niệm cốt lõi của Học tăng cường sâu, từ mạng Q sâu (DQN) đến nhiều biến thể DQN khác nhau bao gồm PerDQN, actorcritic và học tự mô phỏng.

🌈 Vấn đề phần thưởng thưa thớt, vấn đề chính của học tăng cường

Chúng ta sẽ thảo luận về vấn đề phần thưởng thưa thớt, một vấn đề lớn trong học tăng cường, và thảo luận về các kỹ thuật khác nhau để giải quyết vấn đề này.

Chúng tôi chủ yếu nói về 'sự tò mò' hoặc 'lỗi dự đoán' và giới thiệu một số thuật toán sử dụng chúng.

(SIL, Chưng cất mạng ngẫu nhiên, v.v.)

🌈 Triển khai DQN/ActorCritic/SIL/RND trực tiếp trong R

Trừ khi bạn tự triển khai bằng mã, bạn chỉ biết một nửa thôi, phải không? Hãy cùng viết các thuật toán học tăng cường cho các mô hình quan trọng nhất trong R và cùng nhau kiểm tra kết quả.

Và chúng ta hãy cùng xem liệu RND dành cho Khám phá có thực sự hiệu quả không.

🙋🏻‍♂️ Những câu hỏi dự kiến liên quan đến bài giảng

H. Bạn có hiểu biết gì về người chơi không?
A. Có hiểu biết cơ bản về máy học và NN là điều tốt.

H. Bạn không tham gia khóa đào tạo thực hành nào về Python sao?
A. Hiện tại, tôi đã tải bài giảng lên bằng cách triển khai mã thực hành trong R, và tôi dự định sẽ tải mã thực hành bằng Python trong tương lai. (Tôi sẽ tải nó lên cùng với bài giảng này, thay vì mở nó như một bài giảng khác.)

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • Bất cứ ai muốn học tăng cường học tập một cách dễ dàng

  • Bất cứ ai muốn học học tăng cường tổng thể trong một khoảng thời gian ngắn

Cần biết trước khi bắt đầu?

  • Kỹ năng lập trình R trung cấp

  • Hiểu biết cơ bản về mạng lưới thần kinh

  • Kiến thức cơ bản về học máy

Xin chào
Đây là

8,274

Học viên

500

Đánh giá

136

Trả lời

4.4

Xếp hạng

20

Các khóa học

학부에서는 통계학을 전공하고 산업공학(인공지능) 박사를 받고 여전히 공부중인 백수입니다.

 

수상

ㆍ 제6회 빅콘테스트 게임유저이탈 알고리즘 개발 / 엔씨소프트상(2018)

ㆍ 제5회 빅콘테스트 대출 연체자 예측 알고리즘개발 / 한국정보통신진흥협회장상(2017)

ㆍ 2016 날씨 빅데이터 콘테스트/ 기상산업 진흥원장상(2016) 

ㆍ 제4회 빅콘테스트 보험사기 예측 알고리즘 개발 / 본선진출(2016)

ㆍ 제3회 빅콘테스트 야구 경기 예측 알고리즘 개발 / 미래창조과학부 장관상(2015)

* blog : https://bluediary8.tistory.com

주로 연구하는 분야는 데이터 사이언스, 강화학습, 딥러닝 입니다.

크롤링과 텍스트마이닝은 현재는 취미로 하고있습니다 :) 

크롤링을 이용해서 인기있는 커뮤니티 글만 수집해서 보여주는 마롱이라는 앱을 개발하였고

전국의 맛집리스트와 블로그를 수집해서 맛집 추천 앱도 만들었었죠 :) (시원하게 말아먹..)

지금은 인공지능을 연구하는 박사과정생입니다.

 

 

 

 

Chương trình giảng dạy

Tất cả

20 bài giảng ∙ (4giờ 31phút)

Tài liệu khóa học:

Tài liệu bài giảng
Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Tất cả

3 đánh giá

4.3

3 đánh giá

  • chihooi19851635님의 프로필 이미지
    chihooi19851635

    Đánh giá 5

    Đánh giá trung bình 5.0

    5

    100% đã tham gia

    Nó rất hữu ích

    • doabc님의 프로필 이미지
      doabc

      Đánh giá 1

      Đánh giá trung bình 3.0

      3

      35% đã tham gia

      Hơi khó nhận thấy nếu không có nền tảng về trí tuệ nhân tạo + học tập tăng cường.

      • krstyle03v님의 프로필 이미지
        krstyle03v

        Đánh giá 5

        Đánh giá trung bình 5.0

        5

        70% đã tham gia

        Tôi đã cố gắng xem một số bài giảng về học tăng cường, nhưng cá nhân tôi nghĩ rằng người này giải thích bức tranh tổng thể về học tăng cường rất hay và theo một cách thú vị. Mình mới xem đến phần 2 thôi nhưng nó khiến mình tò mò. Tuy nhiên, vì tôi có quyền truy cập hạn chế vào R nên tôi khó hiểu mã, vì vậy tôi thực sự hy vọng rằng mã Python sẽ sớm ra mắt.

        1.164.107 ₫

        Khóa học khác của coco

        Hãy khám phá các khóa học khác của giảng viên!

        Khóa học tương tự

        Khám phá các khóa học khác trong cùng lĩnh vực!