강의

멘토링

로드맵

Inflearn brand logo image
AI Development

/

Deep Learning & Machine Learning

Lý thuyết cơ bản về học tăng cường

Nó rất hữu ích cho những ai muốn củng cố lý thuyết và các khái niệm cơ bản về học tăng cường cũng như những ai muốn tìm hiểu cách áp dụng deep learning vào học tăng cường.

(5.0) 22 đánh giá

2,616 học viên

  • pangyolab8774
Reinforcement Learning(RL)

Đánh giá từ những học viên đầu tiên

Dịch cái này sang tiếng Việt

  • Đọc bài học củng cố

Lý thuyết cơ bản về học tăng cường

Chính sách, phần thưởng, MDP, Monte-Carlo, chênh lệch thời gian... Đây là những khái niệm thường gặp trong các bài báo và dự án liên quan đến học tăng cường. Tuy nhiên, không có nhiều tài liệu giảng dạy giải thích chi tiết định nghĩa chính xác của từng thuật ngữ, bắt đầu từ những điều cơ bản nhất. Việc lao vào một bài báo hoặc dự án mà không có sự hiểu biết vững chắc về những khái niệm này sẽ khiến bạn bị mắc kẹt, lạc lối, giống như một con tàu không có bánh lái.

Tôi tin rằng nguồn tài nguyên tốt nhất để giải thích những kiến thức cơ bản, kết hợp những lời giải thích phong phú với sự hiểu biết trực quan, chính là bài giảng trên YouTube của Giáo sư D. Silver thuộc DeepMind. Tuy nhiên, bài giảng được trình bày bằng tiếng Anh và có thể hơi khó hiểu đối với người mới bắt đầu. Do đó, bài giảng này nhằm mục đích giải thích lại nội dung tương tự bằng tiếng Hàn, giúp người học dễ hiểu hơn. Cũng như bài giảng của D. Silver gồm 10 bài giảng, bài giảng của chúng tôi cũng sẽ gồm 10 bài giảng.

Những người hữu ích

  • Những người muốn củng cố hiểu biết của mình về lý thuyết học tăng cường và các khái niệm cơ bản.
  • Bất kỳ ai muốn tìm hiểu cách học sâu được áp dụng vào học tăng cường

Đánh giá bài báo AlphaGo

Nếu bạn tò mò về những gì bạn có thể làm với phương pháp học tăng cường, trước tiên hãy xem video đánh giá bài báo AlphaGo của Pangyo Lab.
Đánh giá bài báo AlphaGo: https://www.youtube.com/watch?v=SRVx2DFu_tY&list=PLpRS2w0xWHTfnWmr95LtIu4v4HbVxqTlM
Đánh giá AlphaGo Zero Paper: https://youtu.be/CgOGKChwWrw

Học tăng cường là gì?

Học tăng cường, một trong những lĩnh vực của học máy
Học máy có thể được chia thành học có giám sát, học không giám sát và học tăng cường. Học máy liên quan đến việc nhận dạng trạng thái hiện tại và lựa chọn hành động hoặc chuỗi hành động tối đa hóa phần thưởng trong số các hành động khả dụng.

Giới thiệu những người chia sẻ kiến thức

No Seung-eun
Đại học Quốc gia Seoul - Kỹ thuật máy tính và Kinh tế (2010-2015)
Khoa Khoa học và Công nghệ Hội tụ, Đại học Quốc gia Seoul - Nghiên cứu về Tối ưu hóa Siêu tham số trong Học sâu (2015-2017)
NCsoft AI Research - Nhà nghiên cứu trí tuệ nhân tạo, Nhóm học tăng cường (2017-)

Jeon Min-young
Đại học Quốc gia Seoul - Khoa học máy tính và Thiết kế hình ảnh (2011-2017)
Gameberry - Nhà phát triển (2014)
Ringle - Nhà phát triển (2015)
Madup - Nhà phát triển (2016-2017)
Naver - Đội ngũ phát triển giao diện người dùng Papago (2018-)

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • Những người mới học tăng cường

Cần biết trước khi bắt đầu?

  • sự khác biệt

Xin chào
Đây là

2,616

Học viên

22

Đánh giá

5.0

Xếp hạng

1

Khóa học

Chương trình giảng dạy

Tất cả

10 bài giảng ∙ (13giờ 2phút)

Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Tất cả

22 đánh giá

5.0

22 đánh giá

  • jh41gong5625님의 프로필 이미지
    jh41gong5625

    Đánh giá 2

    Đánh giá trung bình 5.0

    5

    60% đã tham gia

    • kukaeden님의 프로필 이미지
      kukaeden

      Đánh giá 436

      Đánh giá trung bình 5.0

      5

      40% đã tham gia

      I learned a lot about reinforcement learning. Thank you for the great lecture~^^

      • devkuka님의 프로필 이미지
        devkuka

        Đánh giá 286

        Đánh giá trung bình 5.0

        5

        30% đã tham gia

        I had a lot of questions about reinforcement learning, but I learned a lot! Thank you for the great lecture~^^

        • weirdo님의 프로필 이미지
          weirdo

          Đánh giá 4

          Đánh giá trung bình 4.8

          5

          100% đã tham gia

          • yubii021288님의 프로필 이미지
            yubii021288

            Đánh giá 1

            Đánh giá trung bình 5.0

            5

            100% đã tham gia

            This is a very helpful lecture, especially for beginners in reinforcement learning like me. Thank you for sharing this great lecture.

            Miễn phí

            Khóa học tương tự

            Khám phá các khóa học khác trong cùng lĩnh vực!