강의

멘토링

커뮤니티

BEST
AI Technology

/

Deep Learning & Machine Learning

Reinforcement Learning for Programmers (Author's Direct Lecture)

The easiest and most detailed lecture on reinforcement learning, the core technology for business innovation!!! We will put reinforcement learning in your hands within 17 days, dedicating 2 hours a day (2 lectures). From now on, reinforcement learning will not be a difficult problem to understand, but a great tool for you.

(4.5) 31 reviews

469 learners

  • multicoreit
Reinforcement Learning(RL)
Artificial Neural Network

Reviews from Early Learners

What you will learn!

  • Reinforcement Learning Basic Theory (Math, Stats, MDP)

  • Artificial Neural Network Concept (New Regression, Classification Analysis, Artificial Neural Network)

  • Reinforcement Learning Algorithms (DQN, REINFORCE, A2C, PPO)

  • Reinforcement learning algorithm tuning (Grid search, Bayesian optimization)

  • Neural Network Tuning (Optimization, Activation function, Preprocessing)

'Reinforcement Learning', a Core Technology for Future Business
We will explain the basic concepts in an easy and detailed manner. 🦾

■ Course Overview

This lecture was created based on the book Reinforcement Learning for Programmers . The author will personally teach the contents that could not be included in the paper . In 17 days, 2 hours a day , you can make reinforcement learning your own technology . From this moment on, reinforcement learning will not be a difficult and incomprehensible wall, but will be an excellent tool that you can freely use to increase your value .

The examples used in the lecture can be downloaded from the site https://github.com/multicore-it/rl .

■ Revised version of the lecture has been released.

The revised edition of 『Reinforcement Learning for Programmers』 has finally been released for those who hesitated to study reinforcement learning because of the mathematical theory and complex code. Through reinforcement learning, you will develop practical development skills that can create intelligent systems that can make judgments and adapt on their own in unpredictable situations. 🔗Shortcut

  • Added more friendly and intuitive explanations.
  • Added state-of-the-art practice tools (Stable Baselines3) and techniques (Optuna).
  • We implemented a wealth of practical example projects (asset allocation strategy, branch rotation).

Why Reinforcement Learning?

Reinforcement learning is based on skill, not capital.

Reinforcement learning does not learn from pre-labeled data, but rather creates data by itself while running the agent, so there is less burden on data work and relatively less computing power is required . It is a field that can be disqualified because it depends a lot on a deep understanding of reinforcement learning algorithms and programming skills to solve problems.

Reinforcement learning is a key technology for future business innovation.

Reinforcement learning is an AI technology suitable for environments with limited capital, such as Korea . Many problems that arise in business environments can be solved with programming skills and reinforcement learning algorithms , and more advanced services and products can be created based on these characteristics .

Course Features

Learning Contents

In the section on basic concepts of reinforcement learning, we first explain the statistical and mathematical theories required for reinforcement learning, and then explain in detail the process from the MDP to the DQN algorithm .

In the section on artificial neural networks, rather than focusing on artificial neural networks, the process leading to artificial neural networks is explained step by step, starting from linear regression . Since it explains from the basics so that even people with no concept of artificial intelligence can understand , anyone with just a little bit of programming knowledge can easily understand .

In the value-based reinforcement learning section, the DQN algorithm is explained code-centrically . Among the various reinforcement learning algorithms, value-based reinforcement learning is relatively easy to understand, so it is introduced first .

In the policy-based reinforcement learning section , REINFORCE, A2C, and PPO algorithms are explained through code and guided through their direct execution . Policy-based algorithms are more difficult to understand than value-based algorithms, but they show relatively stable performance, so a lot of time is spent explaining them .

Finally, we explain reinforcement learning tuning . It covers everything from the detailed theory of artificial neural networks, which is essential for tuning , to Bayesian optimization techniques, which help efficiently tune algorithm parameters .

■ Program error measures

Please refer to the latest news "Program Error Action Guide (December 10, 2022)"

Recommended for
these people

Who is this course right for?

  • Improve your work with AI

  • Someone who wants to create an intelligent software bot to help me

  • Person wanting to create innovative products using AI technology

Need to know before starting?

  • Programming experience (Java, C, etc.) and a little Python syntax

Hello
This is

772

Learners

46

Reviews

112

Answers

4.7

Rating

4

Courses

멀티코어는 프로그래머이자 인공지능 전문가입니다. 프로그래머로서 다양한 분야에서 활동했으며 현재는 기업에서 데이터분석과 강화학습을 활용한 비즈니스 환경 개선 업무를 담당하고 있습니다. 인공지능이 학위를 받은 소수의 전문가만을 위한 영역이 아니라 프로그래머도 충분히 도전할 수 있음을 후배들에게 보여주기 위해 부단히 노력하고 있습니다. "프로그래머를 위한 강화학습"을 집필했습니다.

 

  • 집필 및 자격사항

  1. 개발자 답게 코드로 익히는 강화학습 (2025) / 프리렉

  2. 딥페이크 모델 분석을 통한 딥페이크 이미지 분류 개선에 대한 고찰 (2024) / 한국융합보안학회

  3. 비트코인 선물 자동매매시스템 집필 (2022) / 프리렉

  4. 프로그래머를 위한 강화학습 집필 (2021) / 프리렉

  5. 멀티플 DOM 트리를 활용한 브라우저 퍼징기법 연구(2017) / 연세대학교

     

  6. 정보시스템 수석감리원 자격증 취득(2015) / 정보시스템감리협회

     

  7. 컴퓨터시스템응용기술사 (2013) / 한국산업인력공단

  • 기업 및 개인 강의 문의 : multicore.it@gmail.com

Curriculum

All

35 lectures ∙ (6hr 48min)

Course Materials:

Lecture resources
Published: 
Last updated: 

Reviews

All

31 reviews

4.5

31 reviews

  • nanamjk8391님의 프로필 이미지
    nanamjk8391

    Reviews 3

    Average Rating 5.0

    5

    6% enrolled

    Tôi quan tâm đến trí tuệ nhân tạo nên đã mua một cuốn sách và nghe giảng. Các video và bài viết khác giải thích MDP một cách khó hiểu, khó hiểu. Mỗi lần đi làm, tôi cố gắng đọc sách và hiểu chúng, nghe đi nghe lại các bài giảng. Dần dần, MDP khó khăn đã lộ rõ. Nếu bạn muốn học học tăng cường, tôi khuyên bạn nên đọc, nghe sách và bài giảng cùng nhau.

    • multicoreit
      Instructor

      Xin chào Baguette. Trước hết tôi xin cảm ơn bạn đã tham gia khóa học. Như Baguette đã nói, MDP là điểm mà nhiều người lần đầu tiên nghiên cứu học tăng cường đã bỏ cuộc. MDP là cửa ngõ đầu tiên để hiểu về học tập tăng cường. Trong nhiều cuốn sách và bài giảng trực tuyến khác, MDP được giải thích trước tiên và sau đó là thuật toán học tăng cường toàn diện được giải thích. Tuy nhiên, không dễ để những người thiếu kiến ​​thức nền tảng về trí tuệ nhân tạo có thể hiểu được MDP. Vì vậy, trong bài giảng này, chúng tôi sẽ giải thích từng bước về khái niệm xác suất. Chúng tôi đã cố gắng tổ chức bài giảng một cách dễ dàng nhất có thể, nhưng nếu có điều gì bạn không hiểu, vui lòng để lại tin nhắn trong phần Hỏi đáp. Chúng tôi sẽ trả lời bạn một cách chân thành. Cảm ơn

  • qudansdl3115님의 프로필 이미지
    qudansdl3115

    Reviews 1

    Average Rating 5.0

    5

    14% enrolled

    Tôi đã bỏ cuộc sau khi đọc một số cuốn sách về học tăng cường. Thật tuyệt khi có thể nghe điều này một cách nhất quán.

    • multicoreit
      Instructor

      Xin chào, PyoungMoon. Cảm ơn bạn đã tham gia khóa học. Khóa học này được tạo ra cho nhiều người quan tâm đến việc học tăng cường nhưng đã bỏ cuộc vì quá khó. Học tăng cường là lĩnh vực khó khăn nhất trong trí tuệ nhân tạo. Bạn phải có kiến ​​thức cơ bản về toán học và mạng lưới thần kinh nhân tạo, đồng thời MDP, nền tảng của việc học tăng cường, cũng có rất nhiều nội dung chưa quen thuộc. Bài giảng này được giải thích từ lý thuyết cơ bản nên ngay cả những người không có kiến ​​thức nền tảng về toán học và trí tuệ nhân tạo cũng có thể hiểu hết được. Nếu bạn lắng nghe cẩn thận ngay từ đầu và lặp lại những phần bạn không hiểu nhiều lần, bạn sẽ có thể tự mình thực hiện việc học củng cố. Nếu có điều gì không hiểu, vui lòng để lại tin nhắn trong phần Hỏi & Đáp bất cứ lúc nào. Cảm ơn

  • multicoreit님의 프로필 이미지
    multicoreit

    Reviews 2

    Average Rating 5.0

    5

    31% enrolled

    • ewiz2117942님의 프로필 이미지
      ewiz2117942

      Reviews 1

      Average Rating 5.0

      5

      100% enrolled

      • hyesuyeom1618님의 프로필 이미지
        hyesuyeom1618

        Reviews 1

        Average Rating 4.0

        4

        17% enrolled

        $26.40

        multicoreit's other courses

        Check out other courses by the instructor!

        Similar courses

        Explore other courses in the same field!