Thumbnail
인공지능 딥러닝 · 머신러닝

쏙쏙 이해되는 강화학습 핵심이론 대시보드

(3.5)
2개의 수강평 ∙  73명의 수강생

55,000원

지식공유자: Chris Song
총 12개 수업 (5시간 2분)
수강기한: 
무제한
수료증: 발급
난이도: 
입문
-
초급
-
중급이상
지식공유자 답변: 미제공
폴더에 추가 공유

초급자를 위해 준비한
[데이터 분석, 딥러닝 · 머신러닝] 강의입니다.

이 강의를 통해 강화학습의 기본 이론을 익히실 수 있습니다.

✍️
이런 걸
배워요!
강화학습 기초 이론
Tensorflow 2.0 강화학습 프로그래밍

당신이 지금, 강화학습을 배워야 하는 이유 😆

강화학습이란 쉽게 말해 컴퓨터 프로그램이 주어진 상황에서 어떠한 행동을 취할지 학습하는 것을 의미합니다. 즉 어려운 의사결정 문제를 쉽게 해결할 수 있는 일종의 머신러닝이라고 이해하면 좋을 것 같아요. 강화학습은 인공지능이 의사결정을 하는 데 있어 가장 필수적인 내용 중 하나로, 스스로 기계가 상호작용을 통해 최적의 결론을 낼 수 있는 프로그램을 설계할 수 있게 될 것입니다. 

하지만 어렵다. 어렵다. 너무 어렵다 😱

강화학습을 공부하고 싶은 우리의 바람과 다르게, 강화학습을 혼자 공부하는 것은 너무 어렵습니다. 가장 큰 두 가지 이유를 꼽아보면요.

  • 대표적인 강화학습 공식이 담고 있는 원리를 이해하기 어렵다.
  • TD vs MC, Value-based vs Policy-based 등 한 알고리즘에 다양한 개념들이 섞여있다.

기본기만 탄탄해도, 학습 속도에 부스터가 생길 거에요 🔥

강화학습을 공부하신다면 최신 논문과 현란한 데모들을 꿈꾸실 수 있지만, 좀 더 먼 미래를 위해서는 강화학습의 기본기를 충실히 익힐 필요가 있습니다. 이 강의를 통해 여러분은 강화학습의 기초 개념을 심도 있게 배우고 다음과 같은 모습으로 거듭나실 수 있을 것입니다.

 이 강의를 들은 후 당신의 모습!

  • 강화학습의 문제 정의를 명확하게 이해할 수 있게 됩니다.
  • MDP, 다이나믹 프로그래밍에 대해 이해할 수 있게 됩니다.
  • 시간차 학습, 몬테카를로 방법 등 강화학습의 핵심 기술에 대해 차근차근 알아갈 수 있습니다.
  • 강화학습의 논문을 보면 수식이 이해되기 시작합니다.

제 강의만의 특별한 점 😗

  • 강화학습의 각 핵심 개념만 골라서!
    멀티 암드 밴디트, 마르코프 갸결정 과정부터 동적 프로그래밍, 몬테카를로 방법 등
    강화학습에 필요한 핵심 개념만 정리해 기초부터 제대로 알려드립니다.

  • 특정 문제에서 어떤 강화학습 기법을 사용해야 하는지 이해할 수 있음!
    이론을 아는 것에서 끝나지 않습니다. 실제 실습 과정을 저와 함께 경험해 보면서
    특정 상황에서 어떻게 대처해야 하는지 직관적으로 이해할 수 있을 것입니다.

  • 다양한 실습을 통한 개념 체화! 
    기초 이론을 배운 후 바로 실습으로 적용하는 과정을 통해 배운 내용을 바로
    내 것으로 만들 수 있도록 도와드립니다.

이 강의에서 배우는 내용 😝

강화학습 기초

강화학습의 기초 이론과 프레임워크에 대해 알아보고, 인공지능의 보상 체계와 관련된 기초 개념인 멀티 암드 밴디트와 마르코프 상태, 보상, 상태 전이 등에 대해 알아봅니다.

동적 프로그래밍

앞서 배운 마르코프 결정 프로세스의 내용을 기반으로 동적 프로그래밍의 정의와 활용 방법에 대해 알려드립니다.

몬테카를로 방법

계산하려고 하는 값이 복잡한 경우 사용하는 몬테카를로 방법의 기초 개념에 대해 알아봅니다.

시간차 학습

실제 학습의 경험으로부터 직접 배우는 형태의 시간차 학습의 기초 개념을 알아보고, 몬테카를로 방법과 직접 비교하며 어떤 상황에서 활용할 수 있을지 알아봅니다.

모델 기반 강화학습

머신러닝에서의 모델의 개념을 알아보고, 표와 모델에 기반한 강화학습 이론을 알아보고 직접 실습해 봅니다.

정책 기반 강화학습

가치함수를 토대로 행동을 결정하지 않고, 상태에 따라 바로 행동을 선택하는 정책 기반 강화학습에 대해 알아봅니다.

저는 이런 사람입니다 😝


제 경력은 다음과 같아요.

현) Riiid VP of AIOps
현) Google Developer Expert for ML
전) 네이버 AI Research Engineer
전) 카카오 Data Engineer

강의 수강 전, 궁금한 점을 미리 확인하세요! 😝

Q. 비전공자, 입문자도 들을 수 있는 강의인가요?

네 그렇습니다. 기초 개념을 다루기 때문에 전공자가 아닌 분들도 명확하게 이해할 수 있도록 차근차근 알려드릴 예정입니다.

Q. 왜 강화학습을 배워야 하나요?

저는 인공지능의 미래가 강화학습에 달려 있다고 믿습니다. 특히 AI Production과 강화학습을 커리어의 두 키워드로 삼았을 만큼 강화학습에 대한 확신이 있습니다.

Q. 강화학습을 배우면 뭐가 좋은가요?

인공지능이 주어진 상황에서 의사결정을 내리는 방법에 대한 이론적 토대를 쌓을 수 있게 됩니다.

Q. 강의를 듣기 전, 준비해야 할 것이 있나요?

Python의 기초를 조금 익혀두시면 강의 수강에 도움이 될 겁니다.

Q. 수업 내용을 어느 수준까지 다루나요?

기초 이론과 간단한 실습까지 다루게 될 것입니다.

혹시, 이 강의도 들어보셨나요? ✨

 Chris Song 지식공유자의 머신러닝 강의

이런 분들께 추천드려요!

🎓
학습 대상은
누구일까요?
강화학습의 기본기를 익히고 싶은 분들
알파고의 원리를 이해하고 싶은 분들
머신러닝 대학원에 진학 예정인 분들
머신러닝으로 커리어를 전향하고자 하는 분들
📚
선수 지식,
필요할까요?
파이썬 기초

안녕하세요
Chris Song 입니다.
Chris Song의 썸네일

(현) 뤼이드 VP of AIOps

(현) Google Developer Expert for Machine Learning

(전) Naver - AI Research Engineer

(전) Kakao - Data Engineer

커리큘럼 총 12 개 ˙ 5시간 2분의 수업
이 강의는 영상이 제공됩니다. 미리보기를 통해 콘텐츠를 확인해보세요.
섹션 0. 강화학습 기초
강화학습 소개 미리보기 21:28
멀티 암드 밴디트 18:57
마르코프 결정 과정 32:33
섹션 1. 동적 프로그래밍
동적 프로그래밍 12:53
동적 프로그래밍 실습 26:58
섹션 2. 몬테카를로 방법
몬테카를로 방법 26:32
몬테카를로 방법 실습 27:49
섹션 3. 시간차 학습
시간차 학습 30:10
시간차 학습 실습 23:22
섹션 4. 모델 기반 강화학습(Model-based & Model-free RL)
표에 기반한 방법을 이용한 계획 및 학습 26:58
모델 기반 강화학습 Dyna-Q 실습 17:46
섹션 5. 정책 기반 강화학습
정책 경사도 방법 37:24
강의 게시일 : 2021년 05월 24일 (마지막 업데이트일 : 2021년 05월 24일)
수강평 총 2개
수강생분들이 직접 작성하신 수강평입니다.
VIEW 추천 순 최신 순 높은 평점 순 낮은 평점 순 평점 순 높은 평점 순 낮은 평점 순
송태영 thumbnail
3
강의 자체는 무난한데...왜 얼굴 배치를 왼쪽으로 했는지 모르겠어요. 슬라이드 아래쪽을 가려서 너무 보기 불편합니다.
2021-11-05
seonwhee thumbnail
4
커리큘럼이 입문자에게 딱 적당한 것 같습니다. 강좌가 너무 많지도 않고, 부족하지도 않은 것 같고, 이 강의의 후속으로 중급 수준 강의도 개설되었으면 좋겠습니다
2022-10-06