만들면서 배우는 인공지능(강화학습 편)

만들면서 배우는 인공지능(강화학습 편)

(3개의 수강평)

34명의 수강생
55,000원
지식공유자 · Kwang
16회 수업 · 총 58분 수업
평생 무제한 시청
수료증 발급 강좌
수강 난이도 '입문'

만들면서 배우는 인공지능 (강화학습 편)

이세돌과 대국했던 딥만이드의 알파고는 강화학습이란 머신러닝 테크닉으로 훈련됐습니다. 강화학습은 머신을 훈련할 때 가장 좋은 대안으로 평가됩니다. 본 강좌는 강화학습을 수학 없이 설명합니다. 개념을 쉽고 분명하게 배울 수 있습니다. 뿐만 아니라. 언어 중 제일 접근하기 쉬운 파이썬으로 작성해 놓은 RLkit 를 직접 코딩하면서 실제 틱택톡 게임을 구현하고 실행할 수 있습니다.

강화학습이란?

기계학습(머신러닝)의 한 영역으로, 어떤 환경 안에서 정의된 에이전트가 현재의 상태를 인식하여, 선택 가능한 행동들 중 보상을 최대화하는 행동 혹은 순서를 선택하는 방법이다.

이런걸 만들어 봅니다.

 도움이 되는 분들

  • 파이썬 기초를 배우고 다음 단계를 배우려는 분
  • 인공지능에 관심 있으나 수학으로 힘들어 하는 분

지식공유자 소개

최광성

대학원 때 부터 프로그래밍에 빠저 살았습니다. 졸업 후 실험실에 남아 반도체 공장 예측 시뮬레이션 소프트웨어 개발에 참여했습니다. 주력 언어는 C++과 CUDA입니다. CCG라는 스타트업에서  CTO를 맡았습니다. SIMPLE이라는 GPU용 인터프리터 언어를 개발했습니다. https://github.com/cks3443/simple

지식공유자 소개

Kwang

두아이의 아빠입니다.

수학과 과학을 좋아합니다.

C++, cuda 많이 했었습니다.

한때 C/C++ 만이 최고의 프로그래밍 언어라 생각했습니다. 지금은 용도에 맞는 언어를 쓰는게 가장 좋은거라 생각합니다. 특별히 PYTHON을 잘하고 싶은 욕심이 있습니다.

교육과정

모두 펼치기 16 강의 58분
섹션 0. 강좌소개
1 강의 03 : 00
섹션 1. 강화학습 이론
7 강의 17 : 00
환경
02 : 00
스테이트, 에이전트, 리워드
02 : 00
마르코프 결정 과정 1
02 : 00
마르코프 결정 과정 2
03 : 00
리워드 결정 방법
03 : 00
강화학습 방법
04 : 00
학습된 머신이 플레이하는 방법
01 : 00
섹션 2. 개발환경설치
1 강의 06 : 00
섹션 3. RLkit 소개
4 강의 15 : 00
RLkit 동작 이해 1
02 : 00
RLkit 동작 이해 2
03 : 00
강화학습 훈련 방법 1
03 : 00
강화학습 훈련 방법 2
07 : 00
섹션 4. 강화학습 구현
1 강의 12 : 00
ML 클래스의 learn 함수 구현
12 : 00
섹션 5. 실습하기
1 강의 04 : 00
틱택톡 게임 실행하기
04 : 00
섹션 6. 맺는 말
1 강의 01 : 00
앞으로 과제
01 : 00

공개 일자

2018년 2월 12일 (마지막 업데이트 일자 : 2018년 8월 22일)

수강 후기

4.3
3개의 수강평
souling92 10달 전
강화학습에 대해 전공자, 비전공자 모두 부담없이 들을 수 있는 강의 흥미로운 강의 잘 들었습니다. 강화학습에 대해 전공자, 비전공자 모두 부담없이 들을 수 있는 강의라고 생각합니다. 다만, "스테이트, 에이전트, 리워드"편은 다시 녹화하시는 게 나을 것 같습니다. 말씀이 너무 딱딱 끊어져서 초반부터 집중하기가 어려웠습니다. 그 이후에는 굉장히 자연스러웠습니다. "GPU 프로그래밍 언어 CUDA(쿠다) 기초"도 들어보도록 하겠습니다. 좋은 강의 올려주셔서 감사합니다.
이동근 29일 전
감사합니다