
머신러닝 기초부터 탄탄히 정복하기
코코
이론과 실전은 다릅니다. 머신러닝의 기본 개념을 파악하고, 꼭 알아야 할 여러 모델들의 핵심 개념과 이론을 소개합니다. 그리고, 다양한 데이터를 다루어 보면서 실전에 도움되는 여러 기법들과 노하우를 공유합니다.
Basic
머신러닝
Q-learningからDeep Q-learningについて学び、強化学習をRで具現してみる時間があります。 Deep Q-network を超えて Self-imitation learning と Random Netowrk Distillation までの全体的な強化学習内容を扱います。
強化学習理論
Q-learningからDeep Reinforcement Learningまで
Explorationのためのいくつかの強化学習技術
🙆🏻♀ Q-learningとDeep Q-learningを超えてRNDまで🙆🏻♂
アルファゴで始まった強化学習のブーム、強化学習はアルファゴが出る以前から存在していたアルゴリズムであることを知っていましたか?
強化学習は、一般的に勉強するのに進入障壁が高い分野として知られています。アルファゴが出てきてから多くの人が興味を持ち始めていましたが、内容が簡単ではなく、勉強するのが難しいです。強化学習を勉強したかったのですが、難しくて始まらなかった方のために重要な部分だけを選んでまとめてお知らせします。 Q-learning から DQN そして DQN を超えて強化学習の主な問題である sparse reward problem と、これを解決するためのいくつかのアイデアを紹介します。短時間で強化学習を全体的に勉強できる良い講義になります。
強化学習がいったい何なのか、強化学習にはどのような要素があり、どのように学習が進行するのかを例に次々と説明します。
言葉だけ説明しては理解できません。手で直接Q-learingを解きながら強化学習の概念をしっかり理解してみましょう。
Deep reinforcement learningの基本これは、Deep Q-network(DQN)からPerDQNを含む多くのDQN変形、actorcritic、Self-Imitation learingまで重要な内容を中心にまとめています。
強化学習の主な問題である sparse reward problem について話し、これを解決するためのいくつかの技法について話します。
私たちは主に「curiosity」または「prediction error」について話し、それらを活用したいくつかのアルゴリズムについて紹介します。
(SIL、Random Network Distillationなど)
直接コードで実装してみないと半分だけ知っているのでしょう?最も重要なモデルについては、Rで直接強化学習アルゴリズムを組み込み、結果を一緒に確認してみてください。
そしてExplorationのためのRNDが本当に効果があるかどうかを一緒に確認してみましょう。
Q. 選手の知識はありますか?
A. 機械学習、NNに関する基本的な概念があることをお勧めします。
Q. Pythonで練習しませんか?
A. 現在はRで実習コードを実装して講義をアップロードし、今後はpythonで実習するコードをアップロードする予定です。
学習対象は
誰でしょう?
強化学習簡単に学びたい人
短時間で全体的な強化学習を学びたい人
前提知識、
必要でしょうか?
Rプログラミング中級スキル
Neural ネットワークの基本的な理解
機械学習の基本的な知識
8,279
受講生
500
受講レビュー
136
回答
4.4
講座評価
20
講座
학부에서는 통계학을 전공하고 산업공학(인공지능) 박사를 받고 여전히 공부중인 백수입니다.
수상
ㆍ 제6회 빅콘테스트 게임유저이탈 알고리즘 개발 / 엔씨소프트상(2018)
ㆍ 제5회 빅콘테스트 대출 연체자 예측 알고리즘개발 / 한국정보통신진흥협회장상(2017)
ㆍ 2016 날씨 빅데이터 콘테스트/ 기상산업 진흥원장상(2016)
ㆍ 제4회 빅콘테스트 보험사기 예측 알고리즘 개발 / 본선진출(2016)
ㆍ 제3회 빅콘테스트 야구 경기 예측 알고리즘 개발 / 미래창조과학부 장관상(2015)
* blog : https://bluediary8.tistory.com
주로 연구하는 분야는 데이터 사이언스, 강화학습, 딥러닝 입니다.
크롤링과 텍스트마이닝은 현재는 취미로 하고있습니다 :)
크롤링을 이용해서 인기있는 커뮤니티 글만 수집해서 보여주는 마롱이라는 앱을 개발하였고
전국의 맛집리스트와 블로그를 수집해서 맛집 추천 앱도 만들었었죠 :) (시원하게 말아먹..)
지금은 인공지능을 연구하는 박사과정생입니다.
全体
20件 ∙ (4時間 31分)
講座資料(こうぎしりょう):
全体
3件
¥6,526
知識共有者の他の講座を見てみましょう!
同じ分野の他の講座を見てみましょう!