강화학습 올인원: 기초, 최신 알고리즘, 실무 활용까지
멀티코어
스스로 판단하고 적응하는 AI, 이제 직접 만들 수 있습니다. 복잡한 이론 대신 직관적인 설명과 코드로 강화학습의 핵심을 배우고, 금융, 산업 프로젝트를 통해 '실전형 개발자'로 성장하세요.
중급이상
Python, 인공신경망, 강화학습
Khóa học dễ nhất và chi tiết nhất về Học tăng cường - Công nghệ cốt lõi cho Đổi mới Kinh doanh!!! Mỗi ngày 2 tiếng (2 bài giảng), trong 17 ngày, chúng tôi sẽ giúp bạn nắm vững Học tăng cường. Kể từ giờ phút này, Học tăng cường không còn là vấn đề khó hiểu mà sẽ trở thành công cụ tuyệt vời dành cho bạn.
Lý thuyết cơ bản về Học tăng cường (Toán học, Thống kê, MDP)
Khái niệm mạng nơ-ron nhân tạo (Hồi quy thần kinh, Phân tích phân loại, Mạng nơ-ron nhân tạo)
Thuật toán học tăng cường (DQN, REINFORCE, A2C, PPO)
Tinh chỉnh thuật toán học tăng cường (Tìm kiếm lưới, Tối ưu hóa Bayesian)
Tinh chỉnh mạng nơ-ron (tối ưu hóa, hàm kích hoạt, tiền xử lý)
'Học tăng cường', công nghệ cốt lõi cho doanh nghiệp tương lai
Chúng tôi sẽ giải thích các khái niệm cơ bản một cách dễ hiểu và chi tiết. 🦾
Các ví dụ được sử dụng trong bài giảng có thể được tải xuống từ trang web https://github.com/multicore-it/rl .
Phiên bản sửa đổi của 『Học tăng cường cho lập trình viên』 cuối cùng đã được phát hành cho những ai còn ngần ngại học học tăng cường vì lý thuyết toán học và mã phức tạp. Thông qua học tăng cường, bạn sẽ phát triển các kỹ năng phát triển thực tế có thể tạo ra các hệ thống thông minh có thể đưa ra phán đoán và tự thích ứng trong các tình huống không thể đoán trước. 🔗Phím tắt
Học tăng cường dựa trên kỹ năng chứ không phải vốn.
Học tăng cường không học từ dữ liệu được gắn nhãn trước mà tự tạo dữ liệu trong khi chạy tác nhân, do đó, gánh nặng về dữ liệu ít hơn và yêu cầu ít năng lực tính toán hơn . Đây là một lĩnh vực có thể bị loại vì nó phụ thuộc rất nhiều vào sự hiểu biết sâu sắc về các thuật toán học tăng cường và kỹ năng lập trình để giải quyết vấn đề.
Học tăng cường là công nghệ quan trọng cho sự đổi mới kinh doanh trong tương lai.
Học tăng cường là công nghệ AI phù hợp với môi trường có vốn hạn chế như Hàn Quốc . Nhiều vấn đề phát sinh trong môi trường kinh doanh có thể được giải quyết bằng kỹ năng lập trình và thuật toán học tăng cường , và các dịch vụ và sản phẩm tiên tiến hơn có thể được tạo ra dựa trên các đặc điểm này .
Trong phần về các khái niệm cơ bản của học tăng cường, trước tiên chúng tôi giải thích các lý thuyết thống kê và toán học cần thiết cho học tăng cường, sau đó giải thích chi tiết quá trình từ thuật toán MDP đến thuật toán DQN .
Trong phần về mạng nơ-ron nhân tạo, thay vì tập trung vào mạng nơ-ron nhân tạo, quá trình dẫn đến mạng nơ-ron nhân tạo được giải thích từng bước, bắt đầu từ hồi quy tuyến tính . Vì nó giải thích từ những điều cơ bản để ngay cả những người không có khái niệm về trí tuệ nhân tạo cũng có thể hiểu được , bất kỳ ai chỉ có một chút kiến thức về lập trình cũng có thể dễ dàng hiểu được .
Trong phần học tăng cường dựa trên giá trị , thuật toán DQN được giải thích theo hướng tập trung vào mã . Trong số các thuật toán học tăng cường khác nhau, học tăng cường dựa trên giá trị tương đối dễ hiểu, vì vậy nó được giới thiệu đầu tiên .
Trong phần học tăng cường dựa trên chính sách , các thuật toán REINFORCE, A2C và PPO được giải thích thông qua mã và được hướng dẫn thực hiện trực tiếp . Các thuật toán dựa trên chính sách khó hiểu hơn các thuật toán dựa trên giá trị, nhưng chúng cho thấy hiệu suất tương đối ổn định, do đó cần dành nhiều thời gian để giải thích chúng .
Cuối cùng, chúng tôi giải thích về điều chỉnh học tăng cường . Nó bao gồm mọi thứ từ lý thuyết chi tiết về mạng nơ-ron nhân tạo, điều cần thiết để điều chỉnh , đến các kỹ thuật tối ưu hóa Bayesian, giúp điều chỉnh hiệu quả các tham số thuật toán .
Vui lòng tham khảo tin tức mới nhất "Hướng dẫn hành động lỗi chương trình (ngày 10 tháng 12 năm 2022)"
Khóa học này dành cho ai?
인공지능으로 업무를 개선하고 싶은 분
Người muốn tạo bot phần mềm thông minh giúp tôi
Người muốn tạo ra sản phẩm đổi mới bằng công nghệ AI
Cần biết trước khi bắt đầu?
Kinh nghiệm lập trình (Java, C, v.v.) và một ít cú pháp Python
750
Học viên
43
Đánh giá
111
Trả lời
4.7
Xếp hạng
4
Các khóa học
멀티코어는 프로그래머이자 인공지능 전문가입니다. 프로그래머로서 다양한 분야에서 활동했으며 현재는 기업에서 데이터분석과 강화학습을 활용한 비즈니스 환경 개선 업무를 담당하고 있습니다. 인공지능이 학위를 받은 소수의 전문가만을 위한 영역이 아니라 프로그래머도 충분히 도전할 수 있음을 후배들에게 보여주기 위해 부단히 노력하고 있습니다. "프로그래머를 위한 강화학습"을 집필했습니다.
집필 및 자격사항
개발자 답게 코드로 익히는 강화학습 (2025) / 프리렉
딥페이크 모델 분석을 통한 딥페이크 이미지 분류 개선에 대한 고찰 (2024) / 한국융합보안학회
비트코인 선물 자동매매시스템 집필 (2022) / 프리렉
프로그래머를 위한 강화학습 집필 (2021) / 프리렉
멀티플 DOM 트리를 활용한 브라우저 퍼징기법 연구(2017) / 연세대학교
정보시스템 수석감리원 자격증 취득(2015) / 정보시스템감리협회
컴퓨터시스템응용기술사 (2013) / 한국산업인력공단
기업 및 개인 강의 문의 : multicore.it@gmail.com
Tất cả
35 bài giảng ∙ (6giờ 48phút)
Tài liệu khóa học:
Tất cả
31 đánh giá
4.5
31 đánh giá
Đánh giá 3
∙
Đánh giá trung bình 5.0
5
인공지능에 관심이 있어 책을 사고 강의를 듣게 되었습니다. 다른 동영상이나 글에서는 MDP를 어렵게 설명해서 이해하기가 힘들었습니다. 출퇴근 할 때마다 책을 보고 이해하려고 했고, 강의를 반복해서 들었습니다. 그 어렵다던 MDP가 조금씩 눈에 들어오더군요.. 강화학습을 공부하시고 싶은 분들은 책하고 강의를 같이 보고 듣기를 강추합니다.
안녕하세요 바게트님. 먼저 강의를 수강해 주셔서 감사의 말씀드리겠습니다. 바게트님 말씀처럼 강화학습을 처음 공부하시는 분들이 많이 포기하는 시점이 MDP입니다. MDP는 강화학습을 이해하기 위한 첫 관문입니다. 다른 많은 서적과 온라인강의에서 MDP를 먼저 설명하고 본격적인 강화학습 알고리즘을 설명합니다. 하지만, 인공지능에 대한 배경지식이 부족한 분들은 MDP를 이해하가 쉽지 않습니다. 그래서 본 강의에서는 확률에 대한 개념부터 차근차근 설명하고 있습니다. 가능하면 쉽게 강의를 구성하고자 노력했지만, 혹시나 이해가 가지 않는 부분이 있다면 Q&A에 글을 남겨주세요. 성실히 답변드리겠습니다. 감사합니다.
Đánh giá 1
∙
Đánh giá trung bình 5.0
5
강화학습 책을 여러권 보다가 포기 했는데. 이건 꾸준히 들을수 있어서 좋네요
안녕하세요 PyoungMoon님 강의를 수강해 주셔서 감사합니다. 본 강의는 강화학습에 관심이 많지만 너무 어려워서 포기한 많은 분들을 위해 만들어졌습니다. 강화학습은 인공지능 분야에서 가장 난이도가 높은 분야입니다. 기본적으로 수학과 인공신경망을 알고있어야 하고 강화학습에 근간을 이루는 MDP 또한 생소한 내용이 많습니다. 본 강의는 기초적인 이론부터 설명하기 때문에 수학과 인공지능에 대한 배경 지식이 없는 분들도 충분히 이해할 수 있습니다. 처음부터 차근차근 들으시고 이해가 안가는 부분은 몇번 반복해서 들으신다면 강화학습을 충분히 내 것으로 만들 수 있습니다. 혹시 이해가 안가는 부분이 있으시면 언제라도 Q&A에 글을 남겨주세요. 감사합니다.
Đánh giá 2
∙
Đánh giá trung bình 5.0
Đánh giá 1
∙
Đánh giá trung bình 5.0
Đánh giá 1
∙
Đánh giá trung bình 4.0
Ưu đãi có thời hạn
24.750 ₫
25%
717.352 ₫
Hãy khám phá các khóa học khác của giảng viên!
Khám phá các khóa học khác trong cùng lĩnh vực!