Reinforcement Learning for Programmers (Author's Direct Lecture)
The easiest and most detailed lecture on reinforcement learning, the core technology for business innovation!!!
We will put reinforcement learning in your hands within 17 days, dedicating 2 hours a day (2 lectures).
From now on, reinforcement learning will not be a difficult problem to understand, but a great tool for you.
'Reinforcement Learning', a Core Technology for Future Business We will explain the basic concepts in an easy and detailed manner. 🦾
■ Course Overview
This lecture was created based on the book “ Reinforcement Learning for Programmers.” The author will personally teach the contents that could not be included in the paper .In 17 days, 2 hours a day , you can make reinforcement learning your own technology . From this moment on, reinforcement learning will not be a difficult and incomprehensible wall, but will be an excellent tool that you can freely use to increase your value .
■ Revisedversion of the lecture has been released.
The revised edition of 『Reinforcement Learning for Programmers』 has finally been released for those who hesitated to study reinforcement learning because of the mathematical theory and complex code. Through reinforcement learning, you will develop practical development skills that can create intelligent systems that can make judgments and adapt on their own in unpredictable situations. 🔗Shortcut
Added more friendly and intuitive explanations.
Added state-of-the-art practice tools (Stable Baselines3) and techniques (Optuna).
We implemented a wealth of practical example projects (asset allocation strategy, branch rotation).
■ Why Reinforcement Learning?
Reinforcement learning is based on skill, not capital.
Reinforcement learning does not learn from pre-labeled data, but rather creates data by itself while running the agent, so there is less burden on data work and relatively less computing power is required . It is a field that can be disqualified because it depends a lot on a deep understanding of reinforcement learning algorithms and programming skills to solve problems.
Reinforcement learning is a key technology for future business innovation.
Reinforcement learning is an AI technology suitable for environments with limited capital, such as Korea . Many problems that arise in business environments can be solved with programming skills and reinforcement learning algorithms , and more advanced services and products can be created based on these characteristics .
■Course Features
■Learning Contents
In the section on basic concepts of reinforcement learning,we first explain the statistical and mathematical theories required for reinforcement learning, and then explain in detail the process from the MDP to the DQN algorithm .
In the section on artificial neural networks, rather than focusing on artificial neural networks, the process leading to artificial neural networks is explained step by step, starting from linear regression . Since it explains from the basics so that even people with no concept of artificial intelligence can understand , anyone with just a little bit of programming knowledge can easily understand.
In the value-based reinforcement learning section, the DQNalgorithm is explained code-centrically. Among the various reinforcement learning algorithms, value-based reinforcement learning is relatively easy to understand, so it is introduced first .
In the policy-based reinforcement learning section , REINFORCE, A2C, and PPOalgorithms are explained through code and guided through their direct execution . Policy-based algorithms are more difficult to understand than value-based algorithms, but they show relatively stable performance, so a lot of time is spent explaining them .
Finally, we explain reinforcement learning tuning. It covers everything from the detailed theory of artificial neural networks, which is essential for tuning , to Bayesian optimization techniques, which help efficiently tune algorithm parameters .
■ Program error measures
Please refer to the latest news "Program Error Action Guide (December 10, 2022)"
Recommended for these people
Who is this course right for?
Improve your work with AI
Someone who wants to create an intelligent software bot to help me
Person wanting to create innovative products using AI technology
Need to know before starting?
Programming experience (Java, C, etc.) and a little Python syntax
Hello This is
772
Learners
46
Reviews
112
Answers
4.7
Rating
4
Courses
멀티코어는 프로그래머이자 인공지능 전문가입니다. 프로그래머로서 다양한 분야에서 활동했으며 현재는 기업에서 데이터분석과 강화학습을 활용한 비즈니스 환경 개선 업무를 담당하고 있습니다. 인공지능이 학위를 받은 소수의 전문가만을 위한 영역이 아니라 프로그래머도 충분히 도전할 수 있음을 후배들에게 보여주기 위해 부단히 노력하고 있습니다. "프로그래머를 위한 강화학습"을 집필했습니다.
집필 및 자격사항
개발자 답게 코드로 익히는 강화학습 (2025) / 프리렉
딥페이크 모델 분석을 통한 딥페이크 이미지 분류 개선에 대한 고찰 (2024) / 한국융합보안학회
Tôi quan tâm đến trí tuệ nhân tạo nên đã mua một cuốn sách và nghe giảng. Các video và bài viết khác giải thích MDP một cách khó hiểu, khó hiểu. Mỗi lần đi làm, tôi cố gắng đọc sách và hiểu chúng, nghe đi nghe lại các bài giảng. Dần dần, MDP khó khăn đã lộ rõ.
Nếu bạn muốn học học tăng cường, tôi khuyên bạn nên đọc, nghe sách và bài giảng cùng nhau.
Xin chào Baguette.
Trước hết tôi xin cảm ơn bạn đã tham gia khóa học.
Như Baguette đã nói, MDP là điểm mà nhiều người lần đầu tiên nghiên cứu học tăng cường đã bỏ cuộc. MDP là cửa ngõ đầu tiên để hiểu về học tập tăng cường. Trong nhiều cuốn sách và bài giảng trực tuyến khác, MDP được giải thích trước tiên và sau đó là thuật toán học tăng cường toàn diện được giải thích. Tuy nhiên, không dễ để những người thiếu kiến thức nền tảng về trí tuệ nhân tạo có thể hiểu được MDP. Vì vậy, trong bài giảng này, chúng tôi sẽ giải thích từng bước về khái niệm xác suất. Chúng tôi đã cố gắng tổ chức bài giảng một cách dễ dàng nhất có thể, nhưng nếu có điều gì bạn không hiểu, vui lòng để lại tin nhắn trong phần Hỏi đáp. Chúng tôi sẽ trả lời bạn một cách chân thành.
Cảm ơn
Xin chào, PyoungMoon.
Cảm ơn bạn đã tham gia khóa học.
Khóa học này được tạo ra cho nhiều người quan tâm đến việc học tăng cường nhưng đã bỏ cuộc vì quá khó. Học tăng cường là lĩnh vực khó khăn nhất trong trí tuệ nhân tạo. Bạn phải có kiến thức cơ bản về toán học và mạng lưới thần kinh nhân tạo, đồng thời MDP, nền tảng của việc học tăng cường, cũng có rất nhiều nội dung chưa quen thuộc. Bài giảng này được giải thích từ lý thuyết cơ bản nên ngay cả những người không có kiến thức nền tảng về toán học và trí tuệ nhân tạo cũng có thể hiểu hết được. Nếu bạn lắng nghe cẩn thận ngay từ đầu và lặp lại những phần bạn không hiểu nhiều lần, bạn sẽ có thể tự mình thực hiện việc học củng cố.
Nếu có điều gì không hiểu, vui lòng để lại tin nhắn trong phần Hỏi & Đáp bất cứ lúc nào.
Cảm ơn