Thumbnail
데이터 사이언스 인공지능
프로그래머를 위한 강화학습(저자 직강)
37명이 수강하고 있어요.

66,000원

지식공유자 : 멀티코어
총 35개 수업˙총 6시간 42분
평생 무제한 수강
수료증 발급 강의
입문 초급 대상 중급이상
내 목록 추가 40 공유
초급자를 위해 준비한
[인공지능, 데이터 사이언스] 강의입니다.

비즈니스 혁신의 핵심 기술 강화학습에 관한 가장 쉽고 상세한 강의!!! 하루 2시간(2개 강의) 17일 안에 강화학습을 당신의 손안에 넣어드립니다. 지금 이 시간부터 강화학습은 이해하기 어려운 문제가 아닌 당신을 위한 훌륭한 도구가 됩니다.

✍️
이런 걸
배워요!
강화학습 기초 이론(수학, 통계, MDP)
인공신경망 개념(신형회귀, 분류분석, 인공신경망)
강화학습 알고리즘(DQN, REINFORCE, A2C, PPO)
강화학습 알고리즘 튜닝(그리드서치, 베이지안 최적화)
인공신경망 튜닝(최적화, 활성화함수, 전처리)

미래 비즈니스의 핵심 기술 '강화학습'
기본 개념부터 쉽고 자세하게 알려드립니다. 🦾

■ 과정 개요

본 강의는 프로그래머를 위한 강화학습 도서를 중심으로 만들어졌습니다. 지면에 모두 담을 수 없었던 내용을 저자가 직접 강의해 드립니다. 하루에 2시간씩 17이면 강화학습을 나만의 기술로 만들 수 있습니다. 지금 이 순간부터 강화학습은 어렵고 이해할 수 없는 넘사벽이 아닌 자유롭게 활용해서 나의 가치를 높여주는 아주 훌륭한 도구가 될 것입니다.

강의에 사용된 예제는 https://github.com/multicore-it/rl 사이트에서 다운로드 받을 수 있습니다.

blankblankblankblankblankblank

왜 강화학습인가?

강화학습은 자본이 아닌 실력 중심

강화학습은 미리 라벨링된 데이터를 학습하는 것이 아니라 에이전트를 실행하면서 데이터를 스스로 만들어 내기 때문에 데이터 작업에 대한 부담이 적고, 컴퓨팅 파워가 상대적으로 적게 듭니다. 강화학습 알고리즘에 대한 깊은 이해와 문제를 해결하기 위한 프로그래밍 실력에 많은 것이 달려있기 때문에 실격으로 승부할 수 있는 분야입니다.

강화학습은 미래 비즈니스 혁신의 핵심 기술

강화학습은 대한민국과 같이 자본력이 부족한 환경에서 적합한 인공지능 기술입니다. 비즈니스 환경에서 발생하는 많은 문제들을 프로그래밍 실력과 강화학습 알고리즘으로 해결할 수 있고, 이러한 특성을 기반으로 보다 향상된 서비스와 제품을 만들어 낼 수 있기 때문입니다.

강의 특징

학습 내용

강화학습 기초개념 부분에서는 강화학습에 필요한 통계 및 수학 이론을 먼저 설명한 다음, MDP에서 DQN 알고리즘에 이르는 과정을 자세하게 설명합니다.

인공신경망 부분에서는 인공신경망에 대해 중점적으로 설명하기 보다는 인공신경망으로 이르는 과정을 선형회귀부터 차근차근 설명합니다. 인공지능에 대한 개념이 전혀 없는 사람도 이해할 수 있도록 기초부터 설명하기 때문에 프로그래밍에 대한 약간의 지식만 있으면 어느 누구도 쉽게 이해할 수 있습니다.

가치기반 강화학습 부분에서는 DQN 알고리즘을 코드 중심으로 설명합니다. 다양한 강화학습 알고리즘 중 가치기반 강화학습이 상대적으로 이해하기 쉽기 때문에 먼저 소개합니다.

정책기반 강화학습 부분에서는 REINFORCE, A2C, PPO 알고리즘을 코드를 중심으로 설명하고 직접 실행할 수 있도록 안내합니다. 정책기반 알고리즘은 가치기반 알고리즘 보다 이해가 어렵지만 비교적 안정적인 성능을 보여주기 때문에 많은 시간을 할애해서 설명하고 있습니다.

마지막으로 강화학습 튜닝을 설명합니다. 튜닝에 필수적인 인공신경망 세부 이론부터 시작해서 알고리즘 파라미터 튜닝을 효율적으로 돕는 베이지안 최적화 기법까지 구체적으로 다루고 있습니다.

지식공유자가 알려주는
강의 수강 꿀팁!
🎓
이런 분들께
추천드려요!
인공지능으로 업무를 개선하고 싶으신 분
나를 도와줄 지능화된 소프트웨어 봇을 만들고 싶으신 분
인공지능 기술을 활용해서 혁신적 제품을 만들고자 하는 분
📚
선수 지식,
필요한가요?
프로그래밍(Java, C 등) 경험과 약간의 파이썬 문법

안녕하세요
멀티코어 입니다.
멀티코어의 썸네일

멀티코어(multicore7419@gmail.com)는 프로그래머이자 인공지능 전문가입니다. 프로그래머로서 다양한 분야에서 활동했으며 현재는 기업에서 데이터분석과 강화학습을 활용한 비즈니스 환경 개선 업무를 담당하고 있습니다. 인공지능이 학위를 받은 소수의 전문가만을 위한 영역이 아니라 프로그래머도 충분히 도전할 수 있음을 후배들에게 보여주기 위해 부단히 노력하고 있습니다. "프로그래머를 위한 강화학습"을 집필했습니다.

커리큘럼 총 35 개 ˙ 6시간 42분의 수업
이 강의는 영상, 수업 노트, 첨부 파일이 제공됩니다. 미리보기를 통해 콘텐츠를 확인해보세요.
섹션 0. 강의소개
섹션 2. 강화학습 기본 알고리즘
마르코프 결정과정(MDP) 22:07
다이나믹 프로그래밍(Dynamic Programming) 13:17
몬테카를로 방법(Monte-Carlo Method) 06:21
TD(Temporal Difference Learning)와 SARSA 04:25
Q러닝(Q-Learning) 12:13
섹션 3. 인공지능 개념
인공지능 기본개념 미리보기 11:43
개발환경설치 10:38
텐서플로우(Tensorflow) 12:35
섹션 4. 함수 근사법
미분(Differentiation)과 편미분(Partial Differentiation) 05:59
경사하강법(Gradient Decent) 07:31
함수근사법(Function Approximation) 11:09
섹션 5. DQN 알고리즘
DQN 알고리즘 기본개념 11:14
DQN 알고리즘 프로그래밍 28:58
DQN 알고리즘 결과분석 05:53
섹션 6. REINFORCE 알고리즘
REINFORCE 알고리즘 이해하기 15:21
REINFORCE 알고리즘 프로그래밍 24:52
REINFORCE 알고리즘 결과분석 04:59
섹션 7. A2C 알고리즘
A2C 알고리즘 이해하기 13:38
A2C 알고리즘 프로그래밍 07:18
A2C 알고리즘 결과분석 03:42
섹션 8. PPO 알고리즘
PPO 알고리즘 이해하기 17:49
PPO 알고리즘 프로그래밍 15:32
PPO 알고리즘 결과분석 05:06
섹션 9. 인공신경망 튜닝
인공신경망 튜닝 I 20:07
인공신경망 튜닝 II 13:12
튜닝결과 적용 05:02
섹션 10. 강화학습 알고리즘 튜닝
그리드서치 최적화 11:38
베이지안 최적화 기본개념 05:47
베이지안 최적화 패키지 소개 05:13
베이지안 최적화 패키지 활용 05:48
섹션 11. 과정 마무리
강화학습 실력 업그레이드 10:30
강의 게시일 : 2021년 03월 31일 (마지막 업데이트일 : 2021년 03월 31일)
수강평
수강생분들이 직접 작성하신 수강평입니다. 수강평을 작성 시 300잎이 적립됩니다.
아직 평가를 충분히 받지 못한 강의 입니다.
모두에게 도움이 되는 수강평의 주인공이 되어주세요!😄️️

66,000원

내 목록 추가 40 공유
지식공유자 : 멀티코어
총 35개 수업˙총 6시간 42분
평생 무제한 수강
수료증 발급 강의
입문 초급 대상 중급이상
지식공유자 되기
많은 사람들에게 배움의 기회를 주고,
경제적 보상을 받아보세요.
지식공유참여
기업 교육을 위한 인프런
“인프런 비즈니스” 를 통해 모든 팀원이 인프런의 강의를
자유롭게 학습하는 환경을 제공하세요.
인프런 비즈니스