inflearn logo
inflearn logo

Phát triển Trí tuệ Nhân tạo của Yoon Jae-sung AI Phần 2: Làm chủ từ A đến Z các thuật toán Machine Learning thực tế

"Hơn cả phân tích dữ liệu, từ thiết kế đến tối ưu hóa mô hình dự báo (Tổng cộng 29 bài giảng)" Bạn đã hoàn tất việc phân tích dữ liệu nhưng lại cảm thấy bế tắc khi bắt tay vào xây dựng mô hình? Vượt xa việc chỉ đơn thuần gọi các thư viện, chúng tôi sẽ giúp bạn nắm vững nguyên lý hoạt động của từng thuật toán và chiến lược kiểm chứng mô hình tối ưu nhất.

6 học viên đang tham gia khóa học này

Độ khó Cơ bản

Thời gian Không giới hạn

xgboost
xgboost
catboost
catboost
AI
AI
xgboost
xgboost
catboost
catboost
AI
AI

Bạn sẽ nhận được điều này sau khi học.

  • - Tầm nhìn sắc bén để đánh giá khách quan hiệu suất của các mô hình hồi quy và phân loại

  • - Khả năng lựa chọn thuật toán tối ưu (KNN, SVM, Tree, v.v.) phù hợp với đặc tính của dữ liệu

  • - Kỹ năng xây dựng mô hình, sử dụng thành thạo các mô hình ensemble hiệu suất cao

  • - Khả năng thiết kế quy trình (pipeline) học máy giúp kết hợp các bước tiền xử lý phức tạp thành một.

  • - Kỹ thuật tìm kiếm thông tin chi tiết (insight) mới bằng cách giảm chiều dữ liệu hoặc nhóm chúng lại.

Giới thiệu bài giảng


: "Hơn cả phân tích dữ liệu, từ thiết kế đến tối ưu hóa mô hình dự đoán (Tổng cộng 29 bài giảng)"

 

Bạn đã hoàn thành việc phân tích dữ liệu nhưng lại cảm thấy bế tắc khi bắt tay vào xây dựng mô hình? Không chỉ dừng lại ở việc gọi các thư viện đơn thuần, chúng tôi sẽ giúp bạn làm chủ hoàn toàn nguyên lý hoạt động của từng thuật toán và chiến lược kiểm chứng mô hình tối ưu nhất.

Từ các mô hình tuyến tính đến các thuật toán Ensemble mới nhất (LGBM, XGBoost, CatBoost), chúng ta sẽ chinh phục một cách hệ thống những thuật toán mạnh mẽ nhất trong thực tế công việc. Bây giờ, hãy bước vào thế giới mô hình hóa trí tuệ nhân tạo, nơi dự đoán tương lai dựa trên dữ liệu đã được phân tích.

 

 

Điểm cốt lõi chỉ có tại bài giảng này

* Tìm hiểu sâu về thuật toán: Học hơn 10 loại thuật toán từ KNN cơ bản đến các mô hình Boosting mới nhất

* Kiểm chứng hiệu suất triệt để: Không chỉ là học tập đơn thuần, mà là sự hiểu biết sâu sắc về hiệu suất tổng quát hóa và chiến lược kiểm chứng (CV)

* Kỹ thuật đặc trưng (Feature Engineering): Truyền đạt các chiến lược tiền xử lý và trích xuất đặc trưng cốt lõi quyết định hiệu suất của mô hình

* Tinh chỉnh siêu tham số: Các kỹ thuật tinh chỉnh để tìm ra mô hình tối ưu như GridSearch, RandomSearch, v.v.

* Chinh phục học không giám sát: Rút ra thông tin chi tiết từ dữ liệu không có nhãn như phân cụm, giảm chiều dữ liệu

 

 



 

📱 Xem trước lộ trình học tập & dự án


✒ Phần 1. Nhập môn và chuẩn bị học Machine Learning (Bài 1 ~ Bài 5)

Vẽ ra lộ trình bài giảng và bức tranh toàn cảnh về Machine Learning. Sau khi cài đặt các thư viện, bạn sẽ trực tiếp chạy một mô hình đơn giản để nhanh chóng nắm bắt luồng quy trình tổng thể.

Nội dung học chính: Tổng quan về Machine Learning, Thiết lập môi trường phát triển, Trải nghiệm Machine Learning mẫu


✒Phần 2. Cơ bản về mô hình hóa, Tiền xử lý dữ liệu (Bài 6 ~ Bài 8)

Chúng tôi sẽ diễn giải lại những nội dung đã học ở giai đoạn phân tích dữ liệu dưới góc nhìn của học máy (machine learning). Đồng thời, tiến hành huấn luyện tập trung vào việc xử lý dữ liệu sao cho phù hợp nhất để mô hình có thể học tập hiệu quả.

Kỹ thuật cốt lõi: Kỹ thuật đặc trưng (Feature Engineering), Xử lý dữ liệu phân loại, Chuẩn hóa dữ liệu (Scaling)

 

✒ Section 3. Chiến lược Đánh giá và Kiểm chứng (Bài 9 ~ Bài 14)

Đây là quá trình trả lời cho câu hỏi: "Mô hình của tôi có thực sự là một mô hình tốt không?". Bạn sẽ được học các chiến lược của những chuyên gia để ngăn ngừa hiện tượng quá khớp (overfitting) và nâng cao khả năng tổng quát hóa của mô hình.

Nội dung học chính: Chia dữ liệu, chỉ số đánh giá hồi quy/phân loại, tinh chỉnh siêu tham số (hyperparameter tuning), trích xuất đặc trưng cốt lõi


✒ Section 4. Chinh phục thuật toán học có giám sát (Bài 15 ~ Bài 25)

Tinh hoa của học máy, chúng ta sẽ đi sâu vào tìm hiểu từng thuật toán đa dạng. Không chỉ dừng lại ở lý thuyết đơn thuần, bạn sẽ được học về ưu nhược điểm cũng như thời điểm sử dụng của từng thuật toán.

Các mô hình cốt lõi: Mô hình tuyến tính, SVM, Cây quyết định, Random Forest

Mô hình nâng cao: LGBM, XGBoost, CatBoost (Chinh phục hoàn hảo 3 mô hình Boosting lớn)


✒ Phần 5. Học không giám sát và Hiệu quả hóa (Bài 26 ~ Bài 29)

Bạn sẽ được học về học không giám sát để tìm ra cấu trúc ẩn của dữ liệu và cách xây dựng pipeline để tự động hóa toàn bộ quy trình.

Nội dung học chính: Giảm chiều dữ liệu (PCA), Phân cụm (Clustering), Đường ống học máy (Pipeline)


 

✒ Giới thiệu người chia sẻ kiến thức

Yoon Jae-seong (Giảng viên chính về Phân tích dữ liệu tại Like Lion)


Kinh nghiệm phát triển
• Phát triển và ra mắt nội dung di động "Island Adventure" của SKT
• Phát triển và ra mắt nội dung di động "Quiz Soccer" của KT
• Ra mắt "Mobile Real Estate Agent" của SK
• Phát triển ứng dụng iPhone "Hanjatong"
• Phát triển ứng dụng iPhone "Health Training"
• Phát triển nội dung "Tales of Commons" của Namco Nhật Bản cho KT/SK
• Phát triển các mini game của KT (Yageum Yageum Land Grab, Aladdin's Magic Lamp, Mystery Block Detective Group, BUZZ and BUZZ)

Kinh nghiệm giảng dạy
Tôi là giảng viên kỳ cựu với 19 năm kinh nghiệm giảng dạy và phát triển cho các nhân viên đang làm việc tại các doanh nghiệp nổi tiếng trong nước và những người chưa có việc làm như: Samsung Multi Campus, Viện Thúc đẩy Công nghiệp Thông tin Busan, Viện Thúc đẩy Công nghiệp Văn hóa Thông tin Jeonju, Viện Thúc đẩy Công nghiệp Thông tin Incheon, Viện Thúc đẩy Phát thanh Truyền hình Hàn Quốc, SK C&C, T Academy, Viện Thúc đẩy Công nghiệp Robot Hàn Quốc, ETRI Daejeon, Samsung Electronics, Trung tâm Đào tạo NICA, Trung tâm Năng suất Hàn Quốc, Hanwha S&C, LG Electronics, v.v.

Lĩnh vực giảng dạy
Tôi giảng dạy trong các lĩnh vực như Java, Android, Framework, Cơ sở dữ liệu, UML, iPhone, Xử lý và Phân tích Big Data, Python, Internet vạn vật (IoT), Phân tích dữ liệu sử dụng R/Python, Deep Learning, Machine Learning AI, Spark. Tôi xây dựng bài giảng bằng cách lồng ghép những kinh nghiệm đa dạng để giải thích một cách dễ hiểu nhất, đồng thời tạo ra các ví dụ để học viên có thể áp dụng vào thực hành. Vì đây không phải là lớp học trực tiếp nên nếu có điều gì chưa rõ, vui lòng sử dụng phần Hỏi & Đáp. Tôi chắc chắn sẽ giải đáp giúp bạn.

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • - Những người muốn bắt đầu con đường mô hình hóa AI thực thụ: Dành cho những ai đã nắm vững kiến thức cơ bản về phân tích dữ liệu (Numpy, Pandas) nhưng vẫn còn lúng túng trong việc làm thế nào để xây dựng mô hình trí tuệ nhân tạo dự đoán tương lai từ những kiến thức đó.

  • - Những người cần 'tiêu chuẩn lựa chọn' thuật toán: Đây là khóa học thiết yếu dành cho các nhà khoa học dữ liệu tương lai, những người muốn so sánh rõ ràng ưu nhược điểm của từng mô hình và biết nên sử dụng mô hình nào trong tình huống nào giữa vô số thuật toán học máy.

  • - Những ai muốn chinh phục các mô hình Ensemble mới nhất: Rất khuyến khích cho những ai muốn vượt qua Random Forest để nắm vững cách ứng dụng thực tế của LGBM, XGBoost và CatBoost – những công cụ bắt buộc phải có trong công việc thực tế và các cuộc thi dữ liệu (như Kaggle).

  • - Những người muốn đẩy hiệu suất của mô hình đến giới hạn: Phù hợp với những ai không chỉ dừng lại ở việc triển khai đơn thuần mà cần các kỹ thuật trung cấp để tối đa hóa 'khả năng tổng quát hóa' của mô hình thông qua tinh chỉnh siêu tham số (hyperparameter tuning) và chiến lược kiểm chứng (CV).

  • - Dành cho những ai muốn tự động hóa quy trình làm việc của machine learning: Đề xuất cho các nhà phát triển và nhà phân tích đang làm việc muốn trang bị khả năng xây dựng đường ống (Pipeline) kết nối các quy trình phức tạp từ tiền xử lý dữ liệu đến đánh giá mô hình thành một thể thống nhất.

Cần biết trước khi bắt đầu?

  • Bạn cần có kiến thức cơ bản về cú pháp Python và các thư viện phân tích dữ liệu (Numpy, Pandas).

  • Nếu bạn chưa quen với việc xử lý dữ liệu, chúng tôi khuyên bạn nên tham gia khóa học [Tiền đề bắt buộc] Master phân tích dữ liệu Python trước.

Xin chào
Đây là softcampus

15,926

Học viên

821

Đánh giá

591

Trả lời

4.7

Xếp hạng

42

Các khóa học

Soft Campus là trung tâm đào tạo hỗ trợ bán các bài giảng và nội dung trực tuyến cũng như ngoại tuyến.

Mọi thắc mắc về việc mua các bài giảng và nội dung đa dạng cũng như lĩnh vực liên quan đến AI, vui lòng liên hệ qua raputa@nate.com hoặc số điện thoại 02-553-0824.

Cảm ơn bạn.

Thêm

Chương trình giảng dạy

Tất cả

31 bài giảng ∙ (13giờ 19phút)

Tài liệu khóa học:

Tài liệu bài giảng
Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Chưa có đủ đánh giá.
Hãy trở thành tác giả của một đánh giá giúp mọi người!

Khóa học khác của softcampus

Hãy khám phá các khóa học khác của giảng viên!

Khóa học tương tự

Khám phá các khóa học khác trong cùng lĩnh vực!

Ưu đãi có thời hạn

3.534 ₫

48%

1.152.176 ₫