R로 쉽게 배우는 강화학습

R로 쉽게 배우는 강화학습

(0개의 수강평)

11명의 수강생
55,000원
지식공유자 · 코코
20회 수업· 총 4시간 31분수업
평생 무제한 시청
수료증 발급 강의
수강 난이도 활용

이런 걸 배울 수 있어요

  • 강화학습이론
  • Q-learning부터 Deep Reinforcement Learning까지
  • Exploration을 위한 여러 강화학습 기법들

🙆🏻‍♀ Q-learning과 Deep Q-learning을 넘어서 RND까지🙆🏻‍♂

🗒 강의소개

알파고로 시작된 강화학습의 붐, 강화학습은 알파고가 나오기 오래전부터 존재했던 알고리즘이라는 사실 알고 계셨나요?

강화학습은 일반적으로 공부를 하기에 진입장벽이 높은 분야로 알려져 있습니다. 알파고가 나오면서부터 많은 사람들이 관심을 가지기 시작했지만, 내용이 쉽지 않아 공부하기가 어렵습니다. 강화학습을 공부하고 싶었지만 어려워서 시작도 못하신 분을 위해 중요한 부분만 골라 요약해서 알려드립니다. Q-learning부터 DQN 그리고 DQN을 넘어서 강화학습의 주된 문제인 sparse reward problem과 이를 해결 하기 위한 여러 아이디어들을 소개합니다. 짧은 시간안에 강화학습을 전체적으로 공부할 수 있는 좋은 강의가 될 것 입니다. 

🌈 강화학습이 대체 무엇인지.

강화학습이 대체 무엇인지, 강화학습엔 어떠한 요소가 있고 어떻게 학습이 진행이 되는지 예를들어 차근차근 설명합니다.

🌈 손으로 직접 풀어보는 Q-learning

말로만 설명해서는 이해가 잘 되지 않아요. 손으로 직접 Q-learing을 풀어보면서 강화학습에 대한 개념을 제대로 이해해 봅시다.


🌈 Deep Reinforcemen learning의 기본이 되는 DQN

Deep reinforcement learning의 기본이는 Deep Q-network (DQN)부터 PerDQN을 포함한 여러 DQN변형들, actorcritic, Self-Imitation learing 까지 중요한 내용을 핵심적으로 요약합니다.

🌈 강화학습의 주된 문제인 Sparse reward problem

강화 학습의 주된 문제인 sparse reward problem에 대해서 이야기 하고 이를 해결하기 위한 여러 기법들에 대해 이야기합니다.

우리는 주로 'curiosity' 또는 'prediction error'에 대해서 이야기 하고 이들을 활용한 여러 알고리즘에 대해 소개합니다.

(SIL,  Random Network Distillation 등)

🌈 R로 직접 구현해보는 DQN/ActorCritic/SIL/RND

직접 코드로 구현해보지 않으면 절반만 알고 있는 거겠죠 ? 가장 중요한 모델들에 대해 R로 직접 강화학습 알고리즘을 짜보고 결과를 같이 확인해 봅니다.

그리고 Exploration 을 위한 RND가 정말 효과가 있는지도 함께 확인해 보시죠.

🙋🏻‍♂️ 강의 관련 예상 질문

Q. 선수 지식이 있나요?
A. 머신러닝, NN에 대한 기본적인 개념이 있으신게 좋습니다.

Q. Python으로 실습을 하지는 않나요?
A. 현재는 R로 실습 코드를 구현해서 강의를 업로드 했고, 추후에 python으로 실습하는 코드를 업로드 할 예정입니다.(타 강의로 여는게 아니라 본 강의에 추가적으로 업로드할 예정입니다)

수강 대상

  • 강화학습 쉽게 배우고 싶으신분
  • 짧은 시간안에 전체적인 강화학습을 배우고 싶으신분

선수 지식

  • R프로그래밍 중급 실력
  • Neural network에 대한 기본적인 이해
  • 머신러닝에 대한 기본적인 지식

지식공유자 소개

학부에서는 통계학을 전공하고 현재는 산업공학(인공지능)을 공부하고 있는 박사과정생입니다.

수상

ㆍ 제6회 빅콘테스트 게임유저이탈 알고리즘 개발 / 엔씨소프트상(2018)

ㆍ 제5회 빅콘테스트 대출 연체자 예측 알고리즘개발 / 한국정보통신진흥협회장상(2017)

ㆍ 2016 날씨 빅데이터 콘테스트/ 기상산업 진흥원장상(2016) 

ㆍ 제4회 빅콘테스트 보험사기 예측 알고리즘 개발 / 본선진출(2016)

ㆍ 제3회 빅콘테스트 야구 경기 예측 알고리즘 개발 / 미래창조과학부 장관상(2015)

* blog : https://bluediary8.tistory.com

주로 연구하는 분야는 데이터 사이언스, 강화학습, 딥러닝 입니다.

크롤링과 텍스트마이닝은 현재는 취미로 하고있습니다 :) 

크롤링을 이용해서 인기있는 커뮤니티 글만 수집해서 보여주는 마롱이라는 앱을 개발하였고

전국의 맛집리스트와 블로그를 수집해서 맛집 추천 앱도 만들었었죠 :) (시원하게 말아먹..)

지금은 인공지능을 연구하는 박사과정생입니다.

 

교육과정

모두 펼치기 20 강의 4시간 31분
섹션 0. 오리엔테이션
1 강의 07 : 40
섹션 1. 강화학습의 개념이해하기
3 강의 56 : 41
강화학습이란?
17 : 49
Q-learning의 개념
11 : 55
손으로 직접 풀어보는 Q-learning
26 : 57
섹션 2. Deep Reinforcement Learning
10 강의 144 : 57
Q-learning과 Neural network의 만남 (Q-network)
17 : 00
Deep Q-network (DQN)
08 : 30
Deep Q-network (DQN) 실습 - 함수 소개 및 Environment소개
16 : 24
Deep Q-network (DQN) 실습 - 강화학습진행
23 : 51
DQN의 변형들 (PerDQN, NoisyNET, RainbowDQN)
16 : 48
PerDQN 실습
06 : 04
Policy based Reinforcement Learning (actor critic networK)
09 : 25
Actor-Critic Network 실습
20 : 51
Self-imitation Learning
06 : 17
Self-imitation Learning 실습
19 : 47
섹션 3. Exploration을 위한 알고리즘들
4 강의 47 : 42
강화학습의 주된 문제 - Sparse Reward problem이란
13 : 43
HDQN, Curiosity 를 이용한 강화학습
11 : 46
Exploration의 끝판왕 Random Network Distillation (RND)
11 : 21
Self-imitation Learning + RND 실습
10 : 52
섹션 4. 수업 되돌아보기
1 강의 14 : 49
Review
14 : 49
섹션 5. 강의자료
1 강의
강의자료 + 코드

공개 일자

2020년 1월 31일 (마지막 업데이트 일자 : 2020년 1월 31일)

수강 후기

아직 평가를 충분히 받지 못한 강의 입니다.
모두에게 도움이 되는 수강평의 주인공이 되어주세요!😄️️

지식공유자 되기
많은 사람들에게 배움의 기회를 주고,
경제적 보상을 받아보세요.
지식공유참여
기업 교육을 위한 인프런
“인프런 비즈니스” 를 통해 모든 팀원이 인프런의 강의들을
자유롭게 학습하는 환경을 제공하세요.
인프런 비즈니스