강화학습 기초 이론

강화학습 기초 이론

(2개의 수강평)

816명의 수강생
무료
지식공유자 · 팡요랩
10회 수업 · 총 12시간 57분 수업
평생 무제한 시청
수료증 미발급 강의
수강 난이도 '중급'
팡요랩의 다른 강의
연관 로드맵
아직 다른 강의가 없어요 ㅠㅠ
연관 로드맵이 없어요 ㅠㅠ

이런 걸 배울 수 있어요

  • 강화학습 논문 읽기

강화학습 기초 이론

Policy, Reward, MDP, Monte-Carlo, Temporal Difference 등... 강화학습 관련 논문이나 프로젝트에서 흔히 접하게 되는 개념이지만, 각 용어의 정확한 정의를 가장 기초부터 차근차근 설명해주는 강의 자료는 많지 않은 것 같습니다. 이를 단단하게 이해하지 못하고 논문이나 프로젝트에 뛰어 들면 방향키를 잃은 배 처럼 갈 곳을 잃은 채 망망대해를 떠돌게 될 것 입니다.

그 기초를 풍부한 설명과 직관적 이해를 겸비하여 가장 잘 설명해주는 자료가 딥마인드의 D.Silver 교수님의 유튜브 강의라고 생각합니다. 하지만 해당 강의는 영어로 진행되고, 초심자가 듣기에 다소 어려운 면이 있어서, 본 강의는 같은 내용을 보다 알기 쉽게 우리말로 풀어서 재전달하는 것을 목적으로 하는 강의입니다. D.Silver의 강의가 10강으로 구성된 것 처럼 저희의 강의 또한 10강으로 이루어질 예정입니다.

 도움이 되는 분들

  • 강화학습의 이론, 기초 개념을 탄탄히 다지고 싶은 분
  • 딥러닝이 강화학습에 어떻게 적용 되는지 배우고 싶으신 분

 알파고 논문 리뷰

강화학습을 배우면 어떤 일을 할 수 있는 지 궁금하신 분들은 저희 팡요랩의 알파고 논문 리뷰 영상을 먼저 봐주세요.
알파고 논문 리뷰: https://www.youtube.com/watch?v=SRVx2DFu_tY&list=PLpRS2w0xWHTfnWmr95LtIu4v4HbVxqTlM
알파고 제로 논문 리뷰: https://youtu.be/CgOGKChwWrw

 강화 학습이란?

기계학습 (Machine Learning) 분야 중의 하나인 강화학습(Reinforcement Learning)
머신러닝은 크게 지도학습,비지도학습, 강화학습 분야로 나눌 수 있다. 현재의 상태를 인식하여, 선택 가능한 행동들 중 보상을 최대화하는 행동 혹은 행동 순서를 선택하는 방법이다.

지식공유자 소개

노승은
서울대학교 - 컴퓨터공학, 경제학 전공 (2010-2015)
서울대학교 융합과학기술대학원 - 딥러닝의 하이퍼파라미터 최적화 관련 연구 (2015-2017)
엔씨소프트 AI Research - 강화학습팀 인공지능 연구원 (2017-)

전민영
서울대학교 - 컴퓨터공학, 시각디자인 전공 (2011-2017)
게임베리 - 개발자 (2014)
링글 - 개발자 (2015)
매드업 - 개발자 (2016-2017)
네이버 - Papago팀 프론트엔드 개발 (2018-)

수강 대상

  • 강화학습을 처음 접하는 사람

선수 지식

  • 미분

공개 일자

2018년 9월 18일 (마지막 업데이트 일자 : 2018년 11월 26일)

수강 후기

5.0
2개의 수강평
권성욱 2달 전
강화학습 이론을 쉽게 접할 수 있었습니다.
Sungick Kim 10달 전
재미있어요. pan-(k)-yo lab 화이팅하세요. 많은 도움이 되었습니다. D. Silver 강의를 더 재미있게 강의하네요.^^ 훌륭한 미래 CS 학자가 될 인재들이네요.
지식공유자 되기
많은 사람들에게 배움의 기회를 주고,
경제적 보상을 받아보세요.
지식공유참여
기업 교육을 위한 인프런
“인프런 비즈니스” 를 통해 모든 팀원이 인프런의 강의들을
자유롭게 학습하는 환경을 제공하세요.
인프런 비즈니스