본 강의는 “프로그래머를 위한 강화학습”도서를 중심으로 만들어졌습니다. 지면에 모두 담을 수 없었던 내용을 저자가 직접 강의해 드립니다. 하루에 2시간씩 17일이면 강화학습을 나만의 기술로 만들 수 있습니다. 지금 이 순간부터 강화학습은 어렵고 이해할 수 없는 넘사벽이 아닌 자유롭게 활용해서 나의 가치를 높여주는 아주 훌륭한 도구가 될 것입니다.
수학 이론과 복잡한 코드 때문에 강화학습 공부를 망설였던 분들을 위한 『프로그래머를 위한 강화학습』 개정판이 드디어 나왔습니다. 강화학습을 통해 예측 불가능한 상황에서 스스로 판단하고 적응하는 지능형 시스템을 만들 수 있는 실전형 개발 능력을 키웁니다. 🔗바로가기
더욱 친절하고 직관적인 설명을 추가했습니다.
최신 실무 도구(Stable Baselines3)와 기법(Optuna)을 추가했습니다.
풍부한 실무 예제 프로젝트(자산배분전략, 지점순환근무)를 구현했습니다.
■ 왜 강화학습인가?
강화학습은 자본이 아닌 실력 중심
강화학습은 미리 라벨링된 데이터를 학습하는 것이 아니라 에이전트를 실행하면서 데이터를 스스로 만들어 내기 때문에 데이터 작업에 대한 부담이 적고, 컴퓨팅 파워가 상대적으로 적게 듭니다. 강화학습 알고리즘에 대한 깊은 이해와 문제를 해결하기 위한 프로그래밍 실력에 많은 것이 달려있기 때문에 실격으로 승부할 수 있는 분야입니다.
강화학습은 미래 비즈니스 혁신의 핵심 기술
강화학습은 대한민국과 같이 자본력이 부족한 환경에서 적합한 인공지능 기술입니다. 비즈니스 환경에서 발생하는 많은 문제들을 프로그래밍 실력과 강화학습 알고리즘으로 해결할 수 있고, 이러한 특성을 기반으로 보다 향상된 서비스와 제품을 만들어 낼 수 있기 때문입니다.
■ 강의 특징
■ 학습 내용
강화학습 기초개념 부분에서는 강화학습에 필요한 통계 및 수학 이론을 먼저 설명한 다음, MDP에서 DQN 알고리즘에 이르는 과정을 자세하게 설명합니다.
인공신경망 부분에서는 인공신경망에 대해 중점적으로 설명하기 보다는 인공신경망으로 이르는 과정을 선형회귀부터 차근차근 설명합니다. 인공지능에 대한 개념이 전혀 없는 사람도 이해할 수 있도록 기초부터 설명하기 때문에 프로그래밍에 대한 약간의 지식만 있으면 어느 누구도 쉽게 이해할 수 있습니다.
가치기반 강화학습 부분에서는DQN 알고리즘을 코드 중심으로 설명합니다. 다양한 강화학습 알고리즘 중 가치기반 강화학습이 상대적으로 이해하기 쉽기 때문에 먼저 소개합니다.
정책기반 강화학습 부분에서는REINFORCE, A2C, PPO 알고리즘을 코드를 중심으로 설명하고 직접 실행할 수 있도록 안내합니다. 정책기반 알고리즘은 가치기반 알고리즘 보다 이해가 어렵지만 비교적 안정적인 성능을 보여주기 때문에 많은 시간을 할애해서 설명하고 있습니다.
마지막으로 강화학습 튜닝을 설명합니다. 튜닝에 필수적인 인공신경망 세부 이론부터 시작해서 알고리즘 파라미터 튜닝을 효율적으로 돕는 베이지안 최적화 기법까지 구체적으로 다루고 있습니다.
■ 프로그램 오류조치
새소식 "프로그램 오류 조치 안내(2022년 12월 10일)" 참고하세요
이런 분들께 추천드려요
학습 대상은 누구일까요?
인공지능으로 업무를 개선하고 싶으신 분
나를 도와줄 지능화된 소프트웨어 봇을 만들고 싶으신 분
인공지능 기술을 활용해서 혁신적 제품을 만들고자 하는 분
선수 지식, 필요할까요?
프로그래밍(Java, C 등) 경험과 약간의 파이썬 문법
안녕하세요 입니다.
851
명
수강생
49
개
수강평
112
개
답변
4.7
점
강의 평점
4
개
강의
멀티코어는 프로그래머이자 인공지능 전문가입니다. 프로그래머로서 다양한 분야에서 활동했으며 현재는 기업에서 데이터분석과 강화학습을 활용한 비즈니스 환경 개선 업무를 담당하고 있습니다. 인공지능이 학위를 받은 소수의 전문가만을 위한 영역이 아니라 프로그래머도 충분히 도전할 수 있음을 후배들에게 보여주기 위해 부단히 노력하고 있습니다. "프로그래머를 위한 강화학습"을 집필했습니다.
집필 및 자격사항
개발자 답게 코드로 익히는 강화학습 (2025) / 프리렉
딥페이크 모델 분석을 통한 딥페이크 이미지 분류 개선에 대한 고찰 (2024) / 한국융합보안학회
I was interested in artificial intelligence, so I bought a book and listened to the lecture. In other videos or articles, MDP was explained in a difficult way, so it was hard to understand. I tried to understand it by reading the book every time I commuted to work, and listened to the lecture repeatedly. That difficult MDP gradually came into view..
For those who want to study reinforcement learning, I strongly recommend reading the book and listening to the lecture together.
Hello, Baguette.
First, I would like to thank you for taking the course.
As Baguette said, the point at which many people who are studying reinforcement learning for the first time give up is MDP. MDP is the first gateway to understanding reinforcement learning. Many other books and online lectures explain MDP first and then explain the full-fledged reinforcement learning algorithm. However, it is not easy for those who lack background knowledge in artificial intelligence to understand MDP. That is why this lecture explains the concept of probability step by step. I tried to organize the lecture as easily as possible, but if there is anything you do not understand, please leave a comment in Q&A. I will sincerely answer.
Thank you.
Hello PyoungMoon
Thank you for taking the course.
This course was created for many people who are interested in reinforcement learning but gave up because it was too difficult. Reinforcement learning is the most difficult field in the field of artificial intelligence. You need to know basic mathematics and artificial neural networks, and MDP, which is the basis of reinforcement learning, also has a lot of unfamiliar content. This course explains the basic theory, so even people without background knowledge in mathematics and artificial intelligence can understand it sufficiently. If you listen carefully from the beginning and listen to the parts you don't understand a few times, you can fully make reinforcement learning your own.
If there is anything you don't understand, please leave a comment in Q&A at any time.
Thank you.