강의

멘토링

로드맵

AI Development

/

Deep Learning & Machine Learning

Lý thuyết cơ bản về học tăng cường

Nó rất hữu ích cho những ai muốn củng cố lý thuyết và các khái niệm cơ bản về học tăng cường cũng như những ai muốn tìm hiểu cách áp dụng deep learning vào học tăng cường.

(5.0) 23 đánh giá

2,631 học viên

  • pangyolab8774
Reinforcement Learning(RL)

Đánh giá từ những học viên đầu tiên

Dịch cái này sang tiếng Việt

  • Đọc bài học củng cố

Lý thuyết cơ bản về học tăng cường

Chính sách, phần thưởng, MDP, Monte-Carlo, chênh lệch thời gian... Đây là những khái niệm thường gặp trong các bài báo và dự án liên quan đến học tăng cường. Tuy nhiên, không có nhiều tài liệu giảng dạy giải thích chi tiết định nghĩa chính xác của từng thuật ngữ, bắt đầu từ những điều cơ bản nhất. Việc lao vào một bài báo hoặc dự án mà không có sự hiểu biết vững chắc về những khái niệm này sẽ khiến bạn bị mắc kẹt, lạc lối, giống như một con tàu không có bánh lái.

Tôi tin rằng nguồn tài nguyên tốt nhất để giải thích những kiến thức cơ bản, kết hợp những lời giải thích phong phú với sự hiểu biết trực quan, chính là bài giảng trên YouTube của Giáo sư D. Silver thuộc DeepMind. Tuy nhiên, bài giảng được trình bày bằng tiếng Anh và có thể hơi khó hiểu đối với người mới bắt đầu. Do đó, bài giảng này nhằm mục đích giải thích lại nội dung tương tự bằng tiếng Hàn, giúp người học dễ hiểu hơn. Cũng như bài giảng của D. Silver gồm 10 bài giảng, bài giảng của chúng tôi cũng sẽ gồm 10 bài giảng.

Những người hữu ích

  • Những người muốn củng cố hiểu biết của mình về lý thuyết học tăng cường và các khái niệm cơ bản.
  • Bất kỳ ai muốn tìm hiểu cách học sâu được áp dụng vào học tăng cường

Đánh giá bài báo AlphaGo

Nếu bạn tò mò về những gì bạn có thể làm với phương pháp học tăng cường, trước tiên hãy xem video đánh giá bài báo AlphaGo của Pangyo Lab.
Đánh giá bài báo AlphaGo: https://www.youtube.com/watch?v=SRVx2DFu_tY&list=PLpRS2w0xWHTfnWmr95LtIu4v4HbVxqTlM
Đánh giá AlphaGo Zero Paper: https://youtu.be/CgOGKChwWrw

Học tăng cường là gì?

Học tăng cường, một trong những lĩnh vực của học máy
Học máy có thể được chia thành học có giám sát, học không giám sát và học tăng cường. Học máy liên quan đến việc nhận dạng trạng thái hiện tại và lựa chọn hành động hoặc chuỗi hành động tối đa hóa phần thưởng trong số các hành động khả dụng.

Giới thiệu những người chia sẻ kiến thức

No Seung-eun
Đại học Quốc gia Seoul - Kỹ thuật máy tính và Kinh tế (2010-2015)
Khoa Khoa học và Công nghệ Hội tụ, Đại học Quốc gia Seoul - Nghiên cứu về Tối ưu hóa Siêu tham số trong Học sâu (2015-2017)
NCsoft AI Research - Nhà nghiên cứu trí tuệ nhân tạo, Nhóm học tăng cường (2017-)

Jeon Min-young
Đại học Quốc gia Seoul - Khoa học máy tính và Thiết kế hình ảnh (2011-2017)
Gameberry - Nhà phát triển (2014)
Ringle - Nhà phát triển (2015)
Madup - Nhà phát triển (2016-2017)
Naver - Đội ngũ phát triển giao diện người dùng Papago (2018-)

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • Những người mới học tăng cường

Cần biết trước khi bắt đầu?

  • sự khác biệt

Xin chào
Đây là

2,631

Học viên

23

Đánh giá

5.0

Xếp hạng

1

Khóa học

Chương trình giảng dạy

Tất cả

10 bài giảng ∙ (13giờ 2phút)

Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Tất cả

23 đánh giá

5.0

23 đánh giá

  • Jang Jaehoon님의 프로필 이미지
    Jang Jaehoon

    Đánh giá 603

    Đánh giá trung bình 4.9

    5

    30% đã tham gia

    좋은 강의 감사합니다!

    • 공준호님의 프로필 이미지
      공준호

      Đánh giá 2

      Đánh giá trung bình 5.0

      5

      60% đã tham gia

      • 쿠카이든님의 프로필 이미지
        쿠카이든

        Đánh giá 484

        Đánh giá trung bình 5.0

        5

        40% đã tham gia

        강화학습에 대해서 많은 것을 배웠습니다. 좋은 강의 감사드립니다~^^

        • KYUNG TAE BAE님의 프로필 이미지
          KYUNG TAE BAE

          Đánh giá 286

          Đánh giá trung bình 5.0

          5

          30% đã tham gia

          강화 학습에 대해 궁금한 점이 많았는데.. 많이 배워갑니다! 좋은 강의 감사해요~^^

          • 이상님의 프로필 이미지
            이상

            Đánh giá 4

            Đánh giá trung bình 4.8

            5

            100% đã tham gia

            Miễn phí

            Khóa học tương tự

            Khám phá các khóa học khác trong cùng lĩnh vực!