강의

멘토링

커뮤니티

BEST
AI Technology

/

Deep Learning & Machine Learning

Học tăng cường cho lập trình viên (tác giả trực tiếp giảng dạy)

Khóa học dễ nhất và chi tiết nhất về Học tăng cường - Công nghệ cốt lõi cho Đổi mới Kinh doanh!!! Mỗi ngày 2 tiếng (2 bài giảng), trong 17 ngày, chúng tôi sẽ giúp bạn nắm vững Học tăng cường. Kể từ giờ phút này, Học tăng cường không còn là vấn đề khó hiểu mà sẽ trở thành công cụ tuyệt vời dành cho bạn.

(4.5) 32 đánh giá

470 học viên

  • multicoreit
Reinforcement Learning(RL)
Artificial Neural Network

Đánh giá từ những học viên đầu tiên

Bạn sẽ nhận được điều này sau khi học.

  • Lý thuyết cơ bản về Học tăng cường (Toán học, Thống kê, MDP)

  • Khái niệm mạng nơ-ron nhân tạo (Hồi quy thần kinh, Phân tích phân loại, Mạng nơ-ron nhân tạo)

  • Thuật toán học tăng cường (DQN, REINFORCE, A2C, PPO)

  • Tinh chỉnh thuật toán học tăng cường (Tìm kiếm lưới, Tối ưu hóa Bayesian)

  • Tinh chỉnh mạng nơ-ron (tối ưu hóa, hàm kích hoạt, tiền xử lý)

'Học tăng cường', công nghệ cốt lõi cho doanh nghiệp tương lai
Chúng tôi sẽ giải thích các khái niệm cơ bản một cách dễ hiểu và chi tiết. 🦾

■ Tổng quan về khóa học

Bài giảng này được biên soạn dựa trên cuốn sách Học tăng cường cho lập trình viên . Tác giả sẽ đích thân giảng dạy những nội dung không thể đưa vào bài báo . Trong 17 ngày, 2 giờ mỗi ngày , bạn có thể biến học tăng cường thành công nghệ của riêng mình . Từ thời điểm này, học tăng cường sẽ không còn là bức tường khó khăn và khó hiểu nữa mà sẽ là một công cụ tuyệt vời mà bạn có thể thoải mái sử dụng để gia tăng giá trị của mình .

Các ví dụ được sử dụng trong bài giảng có thể được tải xuống từ trang web https://github.com/multicore-it/rl .

Phiên bản sửa đổi của bài giảng đã được phát hành.

Phiên bản sửa đổi của 『Học tăng cường cho lập trình viên』 cuối cùng đã được phát hành cho những ai còn ngần ngại học học tăng cường vì lý thuyết toán học và mã phức tạp. Thông qua học tăng cường, bạn sẽ phát triển các kỹ năng phát triển thực tế có thể tạo ra các hệ thống thông minh có thể đưa ra phán đoán và tự thích ứng trong các tình huống không thể đoán trước. 🔗Phím tắt

  • Thêm các giải thích thân thiện và trực quan hơn.
  • Đã thêm các công cụ thực hành hiện đại (Stable Baselines3) và các kỹ thuật (Optuna).
  • Chúng tôi đã triển khai rất nhiều dự án ví dụ thực tế (chiến lược phân bổ tài sản, luân chuyển chi nhánh).

Tại sao lại là Học tăng cường?

Học tăng cường dựa trên kỹ năng chứ không phải vốn.

Học tăng cường không học từ dữ liệu được gắn nhãn trước mà tự tạo dữ liệu trong khi chạy tác nhân, do đó, gánh nặng về dữ liệu ít hơn yêu cầu ít năng lực tính toán hơn . Đây là một lĩnh vực có thể bị loại vì nó phụ thuộc rất nhiều vào sự hiểu biết sâu sắc về các thuật toán học tăng cường và kỹ năng lập trình để giải quyết vấn đề.

Học tăng cường là công nghệ quan trọng cho sự đổi mới kinh doanh trong tương lai.

Học tăng cường là công nghệ AI phù hợp với môi trường có vốn hạn chế như Hàn Quốc . Nhiều vấn đề phát sinh trong môi trường kinh doanh có thể được giải quyết bằng kỹ năng lập trình và thuật toán học tăng cường , và các dịch vụ và sản phẩm tiên tiến hơn có thể được tạo ra dựa trên các đặc điểm này .

Tính năng của khóa học

Nội dung học tập

Trong phần về các khái niệm cơ bản của học tăng cường, trước tiên chúng tôi giải thích các lý thuyết thống kê và toán học cần thiết cho học tăng cường, sau đó giải thích chi tiết quá trình từ thuật toán MDP đến thuật toán DQN .

Trong phần về mạng nơ-ron nhân tạo, thay vì tập trung vào mạng nơ-ron nhân tạo, quá trình dẫn đến mạng nơ-ron nhân tạo được giải thích từng bước, bắt đầu từ hồi quy tuyến tính . Vì nó giải thích từ những điều cơ bản để ngay cả những người không có khái niệm về trí tuệ nhân tạo cũng có thể hiểu được , bất kỳ ai chỉ có một chút kiến ​​thức về lập trình cũng có thể dễ dàng hiểu được .

Trong phần học tăng cường dựa trên giá trị , thuật toán DQN được giải thích theo hướng tập trung vào mã . Trong số các thuật toán học tăng cường khác nhau, học tăng cường dựa trên giá trị tương đối dễ hiểu, vì vậy nó được giới thiệu đầu tiên .

Trong phần học tăng cường dựa trên chính sách , các thuật toán REINFORCE, A2C và PPO được giải thích thông qua mã và được hướng dẫn thực hiện trực tiếp . Các thuật toán dựa trên chính sách khó hiểu hơn các thuật toán dựa trên giá trị, nhưng chúng cho thấy hiệu suất tương đối ổn định, do đó cần dành nhiều thời gian để giải thích chúng .

Cuối cùng, chúng tôi giải thích về điều chỉnh học tăng cường . Nó bao gồm mọi thứ từ lý thuyết chi tiết về mạng nơ-ron nhân tạo, điều cần thiết để điều chỉnh , đến các kỹ thuật tối ưu hóa Bayesian, giúp điều chỉnh hiệu quả các tham số thuật toán .

■ Đo lường lỗi chương trình

Vui lòng tham khảo tin tức mới nhất "Hướng dẫn hành động lỗi chương trình (ngày 10 tháng 12 năm 2022)"

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • 인공지능으로 업무를 개선하고 싶은 분

  • Người muốn tạo bot phần mềm thông minh giúp tôi

  • Người muốn tạo ra sản phẩm đổi mới bằng công nghệ AI

Cần biết trước khi bắt đầu?

  • Kinh nghiệm lập trình (Java, C, v.v.) và một ít cú pháp Python

Xin chào
Đây là

866

Học viên

52

Đánh giá

112

Trả lời

4.7

Xếp hạng

4

Các khóa học

멀티코어는 프로그래머이자 인공지능 전문가입니다. 프로그래머로서 다양한 분야에서 활동했으며 현재는 기업에서 데이터분석과 강화학습을 활용한 비즈니스 환경 개선 업무를 담당하고 있습니다. 인공지능이 학위를 받은 소수의 전문가만을 위한 영역이 아니라 프로그래머도 충분히 도전할 수 있음을 후배들에게 보여주기 위해 부단히 노력하고 있습니다. "프로그래머를 위한 강화학습"을 집필했습니다.

 

  • 집필 및 자격사항

  1. 개발자 답게 코드로 익히는 강화학습 (2025) / 프리렉

  2. 딥페이크 모델 분석을 통한 딥페이크 이미지 분류 개선에 대한 고찰 (2024) / 한국융합보안학회

  3. 비트코인 선물 자동매매시스템 집필 (2022) / 프리렉

  4. 프로그래머를 위한 강화학습 집필 (2021) / 프리렉

  5. 멀티플 DOM 트리를 활용한 브라우저 퍼징기법 연구(2017) / 연세대학교

     

  6. 정보시스템 수석감리원 자격증 취득(2015) / 정보시스템감리협회

     

  7. 컴퓨터시스템응용기술사 (2013) / 한국산업인력공단

  • 기업 및 개인 강의 문의 : multicore.it@gmail.com

Chương trình giảng dạy

Tất cả

35 bài giảng ∙ (6giờ 48phút)

Tài liệu khóa học:

Tài liệu bài giảng
Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Tất cả

32 đánh giá

4.5

32 đánh giá

  • nanamjk8391님의 프로필 이미지
    nanamjk8391

    Đánh giá 3

    Đánh giá trung bình 5.0

    5

    6% đã tham gia

    Tôi quan tâm đến trí tuệ nhân tạo nên đã mua một cuốn sách và nghe giảng. Các video và bài viết khác giải thích MDP một cách khó hiểu, khó hiểu. Mỗi lần đi làm, tôi cố gắng đọc sách và hiểu chúng, nghe đi nghe lại các bài giảng. Dần dần, MDP khó khăn đã lộ rõ. Nếu bạn muốn học học tăng cường, tôi khuyên bạn nên đọc, nghe sách và bài giảng cùng nhau.

    • multicoreit
      Giảng viên

      Xin chào Baguette. Trước hết tôi xin cảm ơn bạn đã tham gia khóa học. Như Baguette đã nói, MDP là điểm mà nhiều người lần đầu tiên nghiên cứu học tăng cường đã bỏ cuộc. MDP là cửa ngõ đầu tiên để hiểu về học tập tăng cường. Trong nhiều cuốn sách và bài giảng trực tuyến khác, MDP được giải thích trước tiên và sau đó là thuật toán học tăng cường toàn diện được giải thích. Tuy nhiên, không dễ để những người thiếu kiến ​​thức nền tảng về trí tuệ nhân tạo có thể hiểu được MDP. Vì vậy, trong bài giảng này, chúng tôi sẽ giải thích từng bước về khái niệm xác suất. Chúng tôi đã cố gắng tổ chức bài giảng một cách dễ dàng nhất có thể, nhưng nếu có điều gì bạn không hiểu, vui lòng để lại tin nhắn trong phần Hỏi đáp. Chúng tôi sẽ trả lời bạn một cách chân thành. Cảm ơn

  • qudansdl3115님의 프로필 이미지
    qudansdl3115

    Đánh giá 1

    Đánh giá trung bình 5.0

    5

    14% đã tham gia

    Tôi đã bỏ cuộc sau khi đọc một số cuốn sách về học tăng cường. Thật tuyệt khi có thể nghe điều này một cách nhất quán.

    • multicoreit
      Giảng viên

      Xin chào, PyoungMoon. Cảm ơn bạn đã tham gia khóa học. Khóa học này được tạo ra cho nhiều người quan tâm đến việc học tăng cường nhưng đã bỏ cuộc vì quá khó. Học tăng cường là lĩnh vực khó khăn nhất trong trí tuệ nhân tạo. Bạn phải có kiến ​​thức cơ bản về toán học và mạng lưới thần kinh nhân tạo, đồng thời MDP, nền tảng của việc học tăng cường, cũng có rất nhiều nội dung chưa quen thuộc. Bài giảng này được giải thích từ lý thuyết cơ bản nên ngay cả những người không có kiến ​​thức nền tảng về toán học và trí tuệ nhân tạo cũng có thể hiểu hết được. Nếu bạn lắng nghe cẩn thận ngay từ đầu và lặp lại những phần bạn không hiểu nhiều lần, bạn sẽ có thể tự mình thực hiện việc học củng cố. Nếu có điều gì không hiểu, vui lòng để lại tin nhắn trong phần Hỏi & Đáp bất cứ lúc nào. Cảm ơn

  • geonheeye0122님의 프로필 이미지
    geonheeye0122

    Đánh giá 1

    Đánh giá trung bình 5.0

    5

    100% đã tham gia

    • multicoreit님의 프로필 이미지
      multicoreit

      Đánh giá 2

      Đánh giá trung bình 5.0

      5

      31% đã tham gia

      • ewiz2117942님의 프로필 이미지
        ewiz2117942

        Đánh giá 1

        Đánh giá trung bình 5.0

        5

        100% đã tham gia

        Ưu đãi có thời hạn, kết thúc sau 6 ngày ngày

        23.100 ₫

        30%

        715.993 ₫

        Khóa học khác của multicoreit

        Hãy khám phá các khóa học khác của giảng viên!

        Khóa học tương tự

        Khám phá các khóa học khác trong cùng lĩnh vực!