강화학습 올인원: 기초, 최신 알고리즘, 실무 활용까지
멀티코어
스스로 판단하고 적응하는 AI, 이제 직접 만들 수 있습니다. 복잡한 이론 대신 직관적인 설명과 코드로 강화학습의 핵심을 배우고, 금융, 산업 프로젝트를 통해 '실전형 개발자'로 성장하세요.
중급이상
Python, 인공신경망, 강화학습
ビジネスイノベーションの核心技術、強化学習に関する最も簡単で詳細な講義!!! 1日2時間(2つの講義)、17日以内に強化学習をあなたの手の中に収めます。今この瞬間から、強化学習は理解しがたい問題ではなく、あなたのための素晴らしいツールになります。
強化学習 基礎理論(数学, 統計, MDP)
人工神経網 概念(新型回帰、分類分析、人工神経網)
強化学習アルゴリズム(DQN, REINFORCE, A2C, PPO)
強化学習アルゴリズムチューニング(グリッドサーチ, ベイズ最適化)
ニューラルネットワーク チューニング (最適化、活性化関数、前処理)
将来のビジネスの中核技術「強化学習」
基本概念から簡単かつ詳細にお知らせします。 🦾
講義で使用された例は、https: //github.com/multicore-it/rlサイトからダウンロードできます。
数学理論と複雑なコードのために強化学習の勉強を躊躇した方々のための『プログラマーのための強化学習』改訂版がいよいよ出てきました。強化学習を通じて、予測不可能な状況で自ら判断し、適応するインテリジェントシステムを作ることができる実戦型開発能力を育てます。 🔗ショートカット
強化学習は資本ではなく実力中心
強化学習は、事前にラベル付けされたデータを学習するのではなく、エージェントを実行しながらデータを自分で作成するため、データ操作に対する負担が少なく、コンピューティングパワーが比較的少なくなります。強化学習アルゴリズムの深い理解と問題を解決するためのプログラミングの実力に多くのことがかかっているため、失格で勝負できる分野です。
強化学習は、将来のビジネス革新の重要な技術です
強化学習は、大韓民国のように資本力が不足している環境で適切な人工知能技術です。これは、ビジネス環境で発生する多くの問題をプログラミングスキルと強化学習アルゴリズムで解決し、これらの特性に基づいてより高度なサービスと製品を作成できるためです。
強化学習基礎概念のセクションでは、強化学習に必要な統計と数学理論を最初に説明し、次にMDPからDQNアルゴリズムまでのプロセスについて詳しく説明します。
人工ニューラルネットワークの部分では、人工ニューラルネットワークについて重点的に説明するのではなく、人工ニューラルネットワークに至る過程を線形回帰からじっくり説明します。人工知能の概念がまったくない人も理解できるように基礎から説明するので、プログラミングに関する少しの知識だけがあれば、誰でも簡単に理解できます。
価値ベースの強化学習セクションでは、 DQNアルゴリズムをコード中心に説明します。さまざまな強化学習アルゴリズムのうち、価値ベースの強化学習が比較的理解しやすいため、まず紹介します。
ポリシーベースの強化学習セクションでは、REINFORCE、A2C、PPOアルゴリズムをコードを中心に説明し、直接実行できるように案内します。ポリシーベースのアルゴリズムは、価値ベースのアルゴリズムよりも理解が困難ですが、比較的安定したパフォーマンスを示すため、多くの時間を費やして説明しています。
最後に、強化学習チューニングについて説明します。チューニングに不可欠な人工ニューラルネットワークの詳細理論から始めて、アルゴリズムパラメータのチューニングを効率的に支援するベイジアン最適化技術まで具体的に取り上げています。
ニュース「プログラムエラーアクションガイド(2022年12月10日)」をご覧ください
学習対象は
誰でしょう?
人工知能で業務を改善したい方
私を助けてくれる知能化されたソフトウェアボットを作りたい方
AI技術を活用して革新的なプロダクトを作りたい方
前提知識、
必要でしょうか?
プログラミング(Java, C など) 経験と少しのPython文法
750
受講生
43
受講レビュー
111
回答
4.7
講座評価
4
講座
멀티코어는 프로그래머이자 인공지능 전문가입니다. 프로그래머로서 다양한 분야에서 활동했으며 현재는 기업에서 데이터분석과 강화학습을 활용한 비즈니스 환경 개선 업무를 담당하고 있습니다. 인공지능이 학위를 받은 소수의 전문가만을 위한 영역이 아니라 프로그래머도 충분히 도전할 수 있음을 후배들에게 보여주기 위해 부단히 노력하고 있습니다. "프로그래머를 위한 강화학습"을 집필했습니다.
집필 및 자격사항
개발자 답게 코드로 익히는 강화학습 (2025) / 프리렉
딥페이크 모델 분석을 통한 딥페이크 이미지 분류 개선에 대한 고찰 (2024) / 한국융합보안학회
비트코인 선물 자동매매시스템 집필 (2022) / 프리렉
프로그래머를 위한 강화학습 집필 (2021) / 프리렉
멀티플 DOM 트리를 활용한 브라우저 퍼징기법 연구(2017) / 연세대학교
정보시스템 수석감리원 자격증 취득(2015) / 정보시스템감리협회
컴퓨터시스템응용기술사 (2013) / 한국산업인력공단
기업 및 개인 강의 문의 : multicore.it@gmail.com
全体
35件 ∙ (6時間 48分)
講座資料(こうぎしりょう):
全体
31件
4.5
31件の受講レビュー
受講レビュー 3
∙
平均評価 5.0
5
인공지능에 관심이 있어 책을 사고 강의를 듣게 되었습니다. 다른 동영상이나 글에서는 MDP를 어렵게 설명해서 이해하기가 힘들었습니다. 출퇴근 할 때마다 책을 보고 이해하려고 했고, 강의를 반복해서 들었습니다. 그 어렵다던 MDP가 조금씩 눈에 들어오더군요.. 강화학습을 공부하시고 싶은 분들은 책하고 강의를 같이 보고 듣기를 강추합니다.
안녕하세요 바게트님. 먼저 강의를 수강해 주셔서 감사의 말씀드리겠습니다. 바게트님 말씀처럼 강화학습을 처음 공부하시는 분들이 많이 포기하는 시점이 MDP입니다. MDP는 강화학습을 이해하기 위한 첫 관문입니다. 다른 많은 서적과 온라인강의에서 MDP를 먼저 설명하고 본격적인 강화학습 알고리즘을 설명합니다. 하지만, 인공지능에 대한 배경지식이 부족한 분들은 MDP를 이해하가 쉽지 않습니다. 그래서 본 강의에서는 확률에 대한 개념부터 차근차근 설명하고 있습니다. 가능하면 쉽게 강의를 구성하고자 노력했지만, 혹시나 이해가 가지 않는 부분이 있다면 Q&A에 글을 남겨주세요. 성실히 답변드리겠습니다. 감사합니다.
受講レビュー 1
∙
平均評価 5.0
5
강화학습 책을 여러권 보다가 포기 했는데. 이건 꾸준히 들을수 있어서 좋네요
안녕하세요 PyoungMoon님 강의를 수강해 주셔서 감사합니다. 본 강의는 강화학습에 관심이 많지만 너무 어려워서 포기한 많은 분들을 위해 만들어졌습니다. 강화학습은 인공지능 분야에서 가장 난이도가 높은 분야입니다. 기본적으로 수학과 인공신경망을 알고있어야 하고 강화학습에 근간을 이루는 MDP 또한 생소한 내용이 많습니다. 본 강의는 기초적인 이론부터 설명하기 때문에 수학과 인공지능에 대한 배경 지식이 없는 분들도 충분히 이해할 수 있습니다. 처음부터 차근차근 들으시고 이해가 안가는 부분은 몇번 반복해서 들으신다면 강화학습을 충분히 내 것으로 만들 수 있습니다. 혹시 이해가 안가는 부분이 있으시면 언제라도 Q&A에 글을 남겨주세요. 감사합니다.
受講レビュー 2
∙
平均評価 5.0
受講レビュー 1
∙
平均評価 5.0
受講レビュー 1
∙
平均評価 4.0
期間限定セール、あと7日日で終了
¥24,750
25%
¥4,062
知識共有者の他の講座を見てみましょう!
同じ分野の他の講座を見てみましょう!