Inflearn brand logo image
Inflearn brand logo image
Inflearn brand logo image
AI Development

/

Deep Learning & Machine Learning

Lý thuyết cốt lõi của học tăng cường dễ hiểu

Thông qua bài giảng này, bạn sẽ tìm hiểu lý thuyết cơ bản về học tăng cường.

(3.5) 2 đánh giá

78 học viên

  • chris
Reinforcement Learning(RL)
Tensorflow
Machine Learning(ML)

Dịch cái này sang tiếng Việt

  • Lý thuyết cơ bản về học tăng cường

  • Lập trình học tăng cường Tensorflow 2.0

Tại sao bạn nên học phương pháp học tăng cường ngay bây giờ 😆

Nói một cách đơn giản, học tăng cường đề cập đến việc một chương trình máy tính học cách thực hiện các hành động cần thiết trong một tình huống nhất định . Nó có thể được hiểu là một loại hình học máy có thể dễ dàng giải quyết các vấn đề ra quyết định khó khăn. Học tăng cường là một trong những khía cạnh thiết yếu nhất của việc ra quyết định AI, cho phép máy móc thiết kế các chương trình tương tác với nhau và đạt được kết quả tối ưu.

Nhưng mà khó quá. Khó quá. Khó quá 😱

Mặc dù chúng ta mong muốn nghiên cứu học tăng cường, nhưng việc tự nghiên cứu nó lại vô cùng khó khăn. Dưới đây là hai lý do chính:

  • Thật khó để hiểu được các nguyên tắc có trong các công thức học tăng cường mang tính đại diện.
  • Nhiều khái niệm khác nhau được kết hợp trong một thuật toán, chẳng hạn như TD so với MC, Dựa trên giá trị so với Dựa trên chính sách, v.v.

Ngay cả khi bạn có nền tảng vững chắc, tốc độ học tập của bạn vẫn sẽ được tăng tốc 🔥

Nếu bạn đang học về học tăng cường, bạn có thể mơ ước về những bài báo khoa học tiên tiến và những bài demo ấn tượng. Tuy nhiên, trong tương lai xa hơn, bạn cần nắm vững những kiến thức cơ bản về học tăng cường. Khóa học này sẽ cung cấp cho bạn sự hiểu biết sâu sắc về các khái niệm cơ bản của học tăng cường và giúp bạn đạt được những mục tiêu sau:

Bạn sẽ trông như thế nào sau khi tham gia khóa học này!

  • Bạn sẽ có thể hiểu rõ định nghĩa vấn đề của học tăng cường.
  • Bạn sẽ có thể hiểu được MDP, lập trình động.
  • Bạn có thể tìm hiểu từng bước về các kỹ thuật cốt lõi của học tăng cường, chẳng hạn như học chênh lệch thời gian và phương pháp Monte Carlo.
  • Nếu bạn xem các bài báo về học tăng cường, các công thức sẽ bắt đầu có ý nghĩa.

Bài giảng của tôi có gì đặc biệt 😗

  • Chỉ cần chọn ra từng khái niệm cốt lõi của học tăng cường!
    Máy đánh bạc nhiều tay, quy trình quyết định Markov, lập trình động, phương pháp Monte Carlo, v.v.
    Chúng tôi sẽ dạy bạn những khái niệm cốt lõi cần thiết cho phương pháp học tăng cường từ những điều cơ bản.

  • Hiểu rõ kỹ thuật học tăng cường nào cần sử dụng cho một vấn đề cụ thể!
    Không chỉ dừng lại ở việc biết lý thuyết. Bạn sẽ được trải nghiệm quá trình thực hành thực tế cùng tôi.
    Bạn sẽ có thể hiểu một cách trực quan cách phản ứng trong những tình huống nhất định.

  • Thể hiện các khái niệm thông qua nhiều hoạt động khác nhau!
    Sau khi học lý thuyết cơ bản, bạn có thể áp dụng ngay những gì đã học thông qua thực hành.
    Hãy để tôi giúp bạn biến nó thành của bạn.

Những gì bạn sẽ học được trong bài giảng này 😝

Cơ bản về học tăng cường

Tìm hiểu về lý thuyết và khuôn khổ cơ bản của học tăng cường và khám phá các khái niệm cơ bản liên quan đến hệ thống phần thưởng AI, chẳng hạn như máy đánh bạc nhiều tay, trạng thái Markov, phần thưởng và chuyển đổi trạng thái.

lập trình động

Dựa trên quy trình quyết định Markov đã học trước đó, chúng ta sẽ tìm hiểu về định nghĩa và ứng dụng của lập trình động.

Phương pháp Monte Carlo

Tìm hiểu các khái niệm cơ bản của phương pháp Monte Carlo, được sử dụng khi các giá trị bạn muốn tính toán phức tạp.

Học theo thời gian thực

Chúng ta sẽ khám phá các khái niệm cơ bản về học tập theo thời gian, một hình thức học tập trực tiếp từ kinh nghiệm học tập trong thế giới thực, so sánh trực tiếp với phương pháp Monte Carlo và xem phương pháp này có thể áp dụng trong những tình huống nào.

Học tăng cường dựa trên mô hình

Tìm hiểu về khái niệm mô hình trong học máy, khám phá lý thuyết học tăng cường dựa trên bảng và mô hình và tự mình thực hành.

Học tăng cường dựa trên chính sách

Tìm hiểu về học tăng cường dựa trên chính sách, phương pháp này lựa chọn hành động dựa trên trạng thái thay vì xác định hành động dựa trên hàm giá trị.

Tôi là kiểu người như thế này 😝


Sự nghiệp của tôi như sau:

Hiện tại) Phó chủ tịch của AIOps
Chuyên gia phát triển Google hiện tại cho ML
Cựu kỹ sư nghiên cứu AI của Naver
Cựu kỹ sư dữ liệu Kakao

Trước khi tham dự buổi thuyết trình, vui lòng kiểm tra trước bất kỳ câu hỏi nào bạn có thể có! 😝

H. Đây có phải là khóa học mà người không chuyên ngành và người mới bắt đầu cũng có thể tham gia không?

Vâng, đúng vậy. Vì chúng ta đang đề cập đến những khái niệm cơ bản, tôi sẽ giải thích từng bước một để ngay cả những người không chuyên cũng có thể hiểu rõ.

H. Tại sao tôi nên học phương pháp học tăng cường?

Tôi tin rằng tương lai của trí tuệ nhân tạo nằm ở học tăng cường. Tôi tin chắc vào tầm quan trọng của nó đến nỗi tôi đã chọn "Sản xuất AI" và học tăng cường làm hai từ khóa cho sự nghiệp của mình.

H. Lợi ích của việc học phương pháp học tăng cường là gì?

Điều này sẽ cho phép chúng ta xây dựng nền tảng lý thuyết về cách trí tuệ nhân tạo đưa ra quyết định trong những tình huống nhất định.

H. Tôi có cần chuẩn bị gì trước khi tham dự buổi thuyết trình không?

Sẽ rất hữu ích nếu bạn có một số kiến thức cơ bản về Python để tham gia khóa học.

H. Nội dung bài học được trình bày ở mức độ nào?

Chúng tôi sẽ trình bày lý thuyết cơ bản và các bài tập thực hành đơn giản.

Bạn có tình cờ học khóa học này không? ✨

Bài giảng về Học máy của Chris Song, Người chia sẻ kiến thức

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • Những người muốn tìm hiểu những điều cơ bản về học tăng cường

  • Những người muốn hiểu nguyên tắc của AlphaGo

  • Những người dự định vào học cao học về học máy

  • Những người muốn thay đổi nghề nghiệp sang học máy

Cần biết trước khi bắt đầu?

  • Python cơ bản

Xin chào
Đây là

1,039

Học viên

90

Đánh giá

8

Trả lời

4.4

Xếp hạng

3

Các khóa học

(현) 뤼이드 VP of AIOps

(현) Google Developer Expert for Machine Learning

(전) Naver - AI Research Engineer

(전) Kakao - Data Engineer

Chương trình giảng dạy

Tất cả

12 bài giảng ∙ (5giờ 2phút)

Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Tất cả

2 đánh giá

3.5

2 đánh giá

  • seonwhee님의 프로필 이미지
    seonwhee

    Đánh giá 3

    Đánh giá trung bình 3.7

    4

    100% đã tham gia

    커리큘럼이 입문자에게 딱 적당한 것 같습니다. 강좌가 너무 많지도 않고, 부족하지도 않은 것 같고, 이 강의의 후속으로 중급 수준 강의도 개설되었으면 좋겠습니다

    • 송태영님의 프로필 이미지
      송태영

      Đánh giá 21

      Đánh giá trung bình 4.4

      3

      100% đã tham gia

      강의 자체는 무난한데...왜 얼굴 배치를 왼쪽으로 했는지 모르겠어요. 슬라이드 아래쪽을 가려서 너무 보기 불편합니다.

      1.165.653 ₫

      Khóa học khác của chris

      Hãy khám phá các khóa học khác của giảng viên!

      Khóa học tương tự

      Khám phá các khóa học khác trong cùng lĩnh vực!