홍콩과기대 김성훈 교수님의 “모두를 위한 딥러닝” 강좌 두번째 시즌으로 ‘강화학습’ 에 대해 학습해 봅니다.

1. 강좌 소개

Reinforcement Learning(강화학습) 강좌는 홍콩과학기술대학교의 김성훈 교수님의 ‘모두를 위한 딥러닝’ 시리즈의 두번째 강좌입니다. 앞선 강좌로  기본적인 머신러닝과 딥러닝 강좌 가 있습니다.

일주일에 한강좌씩 천천이 업데이트 예정입니다.

알파고와 이세돌의 경기를 보면서 이제 머신 러닝이 인간이 잘 한다고 여겨진 직관과 의사 결정능력에서도 충분한 데이타가 있으면 어느정도 또는 우리보다 더 잘할수도 있다는 생각을 많이 하게 되었습니다. Andrew Ng 교수님이 말씀하신것 처럼 이런 시대에 머신 러닝을 잘 이해하고 잘 다룰수 있다면 그야말로 “Super Power”를 가지게 되는 것이 아닌가 생각합니다.

더 많은 분들이 머신 러닝과 딥러닝에 대해 더 이해하고 본인들의 문제를 이 멋진 도구를 이용해서 풀수 있게 하기위해 비디오 강의를 준비하였습니다. 더 나아가 이론에만 그치지 않고 최근 구글이 공개한 머신러닝을 위한 오픈소스인 TensorFlow를 이용해서 이론을 구현해 볼수 있도록 하였습니다.

이 머신러닝, 딥러닝 강좌는 수학이나 컴퓨터 공학적인 지식이 없이도 쉽게 볼수 있도록 만들려고 노력하였습니다.

2. 도움되는 분들

  • 인공지능에 대해 관심이 있는 누구나
  • 머닝러신, 딥러닝의 개념을 이해하고 싶으신분
  • 머닝러신의 직접 구현해보고 싶으신 분
  • 앞선 기본적인 머신러닝과 딥러닝 강좌 를 학습하신 분
  • 강화학습에 대해 관심이 있는 분

3. 참고자료

이 비디오는 저도 인터넷등을 통해 공부하면서 만든것이며 아래 자료를 많이 사용하였습니다.

4. 지식공유자 소개

김성훈

Hong Kong University of Science and Technology 에서 컴퓨터 공학쪽으로 연구를 하고 있습니다.
비디오나 강의에 대한 의견이 있으시면 아래로 이메일을 보내 주시면 됩니다.
hunkim+ml@gmail.com

강좌 평가

5

8 개의 수강평
  • 5 점8
  • 4 점0
  • 3 점0
  • 2 점0
  • 1 점0
  1. 최윤정의 프로필 사진

    감사합니다.

    5

    policy gradient 강의가 없네요…ㅜ.ㅜ

  2. Yeon Su Jeon의 프로필 사진

    질 좋은 강의 정말 감사합니다!

    5

    ebs 인가 홍콩소개하는 프로그램에 출연하신거 같은데 ㅎㅎ 강의 정말 감사합니다

  3. 공영훈의 프로필 사진

    최고의 강의 입니다!

    5

    김성훈 교수님 감사합니다!

  4. Cho Wonjae의 프로필 사진

    좋은 강의 진심으로 감사드립니다.

    5

    바쁘신 시간을 쪼개서 멋진 강의를 만들어 주셔서 진심으로 감사드립니다.

  5. 권형달의 프로필 사진

    넘 쉽게 잘 가르쳐 주셔서 감사합니다~!

    5

    하루 반 만에 reinforcement learning이 무엇인지 알 수 있게 되었습니다.
    어려운 수식을 쉽게 설명해주셔서 정말 감사드립니다.

    최고의 강의입니다!

  6. 오록규의 프로필 사진

    쉽게 가르쳐 주셔서 좋습니다

    5

    이런 강좌를 제공 해 주셔서 감사합니다~

  7. SangJo Han의 프로필 사진

    베스트!

    5

    이렇게 좋은 강의를 무료 공개해 주셔서 감사합니다. 잘 듣고 개념 이해하고 갑니다!

  8. 이원우의 프로필 사진

    새로운 레전드의 시작!!

    5

    모두에게 딥러닝을 가르쳐 버리시더니 RL까지 가르치려고 하시다니 무시무시합니다!
    여러분 조심하세요!
    이거 궁금하다고 실수로 강의를 봐버리면 RL을 배워버리고 맙니다!!

강좌 교육과정

Lecture 1. 수업의 개요
수업의 개요 미리보기 00:13:00
Lecture 2. OpenAI GYM 게임해보기
이론 – OpenAI GYM 게임해보기 미리보기 00:10:00
실습 – OpenAI GYM 게임해보기 미리보기 00:09:00
Lecture 3: Dummy Q-learning (table)
이론 – Dummy Q-learning (table) 미리보기 00:21:00
실습 – Dummy Q-learning (table) 미리보기 00:13:00
Lecture 4: Q-learning exploit&exploration and discounted reward
이론 – Q-learning exploit&exploration and discounted reward 미리보기 00:17:00
실습 – Q-learning exploit&exploration and discounted reward 미리보기 00:07:00
Lecture 5: Q-learning in non-deterministic world
이론 – Q-learning in non-deterministic world 미리보기 00:14:00
실습 – Q-learning in non-deterministic world 미리보기 00:09:00
실습 – Q-learning (Table) Demo by Jae Hyun Lee 미리보기 00:01:00
Lecture 6: Q-Network
이론 – Q-Network 00:16:00
실습 1 – Q Network for Frozen Lake 00:18:00
실습 2 – Q Network for Cart Pole 00:21:00
Lecture 7: DQN
이론 – DQN 미리보기 00:17:00
실습 – DQN 1 (NIPS 2013) 미리보기 00:19:00
실습 – DQN 2 (Nature 2015) 미리보기 00:16:00
실습 – DQN Cart Pole Demo 미리보기 00:01:00
실습 – DQN Simple Pacman Demo (여러분은 최고 몇점까지 갈수 있나요?) 미리보기 00:01:00

인프런은 성장기회의 평등 을 추구합니다.

경제적, 시간적 제약없는 양질을 교육으로 누구나에게 성장 기회를 균등하게 주는것. 그것이 우리의 목표입니다.

지식공유참여 고객센터
top
(주)인프랩 | 대표자:이형주 | TEL:070-4202-1180 | E-MAIL: course@inflearn.com | 사업자번호:499-81-00612
주소:성남시 분당구 삼평동 대왕판교로 645번길 12 경기창조경제혁신센터 8층 R10 | 개인정보보호책임자:이형주
통신판매업:2017-서울강남-01544 | ©INFLAB. ALL RIGHTS RESERVED