inflearn logo

Phát triển Trí tuệ nhân tạo Phần 3 Dự án Học máy thực tế

: "Hơn cả phân tích dữ liệu, hoàn thiện mô hình dự đoán với 5 dự án thực tế (Tổng cộng 45 bài giảng)" Bạn đã hoàn thành việc phân tích dữ liệu nhưng lại cảm thấy bế tắc khi bắt tay vào xây dựng mô hình? Vượt xa việc chỉ gọi các thư viện đơn thuần, khóa học này sẽ giúp bạn làm chủ hoàn toàn nguyên lý hoạt động của từng thuật toán và chiến lược kiểm chứng mô hình tối ưu, từ dự đoán sống sót trên tàu Titanic đến phân loại tin nhắn rác. Từ các mô hình tuyến tính đến các thuật toán Ensemble mới nhất và cả kiến thức cơ bản về xử lý ngôn ngữ tự nhiên (NLP), bạn sẽ chinh phục một cách hệ thống các dự án có sức mạnh lớn nhất trong thực tế công việc. Giờ đây, hãy bước vào thế giới mô hình hóa trí tuệ nhân tạo, nơi dự đoán tương lai dựa trên dữ liệu đã được phân tích.

2 học viên đang tham gia khóa học này

Độ khó Cơ bản

Thời gian Không giới hạn

Machine Learning(ML)
Machine Learning(ML)
NLP
NLP
Algorithm
Algorithm
AI
AI
Machine Learning(ML)
Machine Learning(ML)
NLP
NLP
Algorithm
Algorithm
AI
AI

Bạn sẽ nhận được điều này sau khi học.

  • - Khả năng trích xuất thông tin chi tiết (insight) từ dữ liệu thô thông qua khám phá dữ liệu (EDA)

  • - Khả năng lựa chọn thuật toán tối ưu phù hợp với các loại bài toán như hồi quy, phân loại, phân cụm.

  • - Kỹ năng giải quyết mất cân bằng dữ liệu thực tế bằng cách sử dụng các kỹ thuật oversampling như SMOTE.

  • - Kỹ năng cơ bản về NLP trong việc làm sạch dữ liệu văn bản và kết hợp vào mô hình trí tuệ nhân tạo

  • - Hiểu toàn bộ quy trình của pipeline học máy, từ làm sạch dữ liệu đến dự báo.

Giới thiệu khóa học


: "Hơn cả phân tích dữ liệu, hoàn thiện mô hình dự đoán với 5 dự án thực tế (Tổng cộng 45 bài giảng)“

Bạn đã hoàn thành việc phân tích dữ liệu nhưng vẫn cảm thấy bối rối khi bắt tay vào xây dựng mô hình? Không chỉ dừng lại ở việc gọi các thư viện đơn thuần, chúng tôi sẽ giúp bạn nắm vững từ nguyên lý hoạt động của từng thuật toán đến chiến lược kiểm chứng mô hình tối ưu, thông qua các dự án thực tế từ dự đoán sống sót trên tàu Titanic đến phân loại tin nhắn rác.

Từ các mô hình tuyến tính đến các thuật toán Ensemble mới nhất, và cả kiến thức cơ bản về xử lý ngôn ngữ tự nhiên (NLP), bạn sẽ chinh phục một cách hệ thống các dự án có sức mạnh thực chiến lớn nhất trong công việc thực tế. Giờ đây, hãy bước vào thế giới mô hình hóa trí tuệ nhân tạo để dự đoán tương lai dựa trên dữ liệu đã được phân tích.

 

Điểm cốt lõi chỉ có tại khóa học này

* 5 dự án thực tế lớn: Học tập từng bước sử dụng dữ liệu Titanic, cho thuê xe đạp, y tế, xu hướng tiêu dùng và thư rác

* Chinh phục dữ liệu mất cân bằng: Học chiến lược 'Oversampling (SMOTE)', một thách thức trong thực tế, thông qua dữ liệu bệnh nhân phẫu thuật

* Kỹ thuật đặc trưng (Feature Engineering): Truyền đạt chiến lược trích xuất đặc trưng cốt lõi và làm sạch dữ liệu quyết định hiệu suất của mô hình

* Thực hành học không giám sát: Tìm cụm tối ưu (K) và phân khúc khách hàng bằng cách sử dụng dữ liệu nhân khẩu học

* Nhập môn Xử lý ngôn ngữ tự nhiên (NLP): Kỹ thuật token hóa, vector hóa dữ liệu văn bản và áp dụng vào mô hình học máy



📱 Xem trước chương trình học & dự án


✒ Phần 1. Tổng quan dự án và Thiết lập môi trường phát triển : Bài 1 ~ Bài 4

Vẽ ra bức tranh toàn cảnh về lộ trình khóa học và các dự án học máy. Sau khi cài đặt các thư viện, chúng ta sẽ thiết lập môi trường Python tối ưu để thực hành.

Học tập chính: Giới thiệu khóa học và dự án, thiết lập môi trường phát triển, cài đặt các thư viện cần thiết


✒Phần 2. [Dự án 1] Phân loại (Classification) - Dự đoán người sống sót trên tàu Titanic (Bài 5 ~ Bài 16)

Thông qua bộ dữ liệu nổi tiếng nhất, chúng ta sẽ đi sâu vào toàn bộ quy trình học máy từ EDA đến dự đoán. Bạn sẽ nắm vững tầm quan trọng của việc làm sạch dữ liệu và phân tích tương quan.

Kỹ thuật cốt lõi: EDA và trực quan hóa, làm sạch/biến đổi dữ liệu, phân tích tương quan, lựa chọn đặc trưng (feature selection) và huấn luyện/dự đoán mô hình

 

✒ Phần 3. [Dự án 2] Hồi quy (Regression) - Dự đoán nhu cầu thuê xe đạp (Bài 17 ~ Bài 27)

Học mô hình hồi quy để dự đoán các giá trị số liên tục. Bạn sẽ học cách phân tích dữ liệu có đặc tính chuỗi thời gian và cách để nâng cao hiệu suất của mô hình.

Nội dung học chính: EDA chuyên sâu, chiến lược biến đổi dữ liệu, huấn luyện mô hình hồi quy và tối ưu hóa dự báo đa giai đoạn


✒ Phần 4. [Dự án 3] Xử lý dữ liệu mất cân bằng - Phân tích dữ liệu bệnh nhân phẫu thuật (Bài 28 ~ Bài 33)

Học kỹ thuật giải quyết vấn đề mất cân bằng dữ liệu của bệnh nhân phẫu thuật bằng phương pháp Oversampling để có thể dự đoán một cách bình thường.

Kỹ thuật cốt lõi: Oversampling (Lấy mẫu dư), Đánh giá mô hình


✒ Section 5. [Dự án 4] Học không giám sát (Clustering) - Phân khúc khách hàng (Bài 34 ~ Bài 38)

Thông qua dữ liệu xu hướng tiêu dùng của khách hàng, bạn sẽ học về phân cụm (clustering) để chia nhóm trong trạng thái không có đáp án sẵn (nhãn).

Công nghệ cốt lõi: Phân cụm (Clustering), Tìm số lượng K tối ưu (Phương pháp Elbow, v.v.)


✒ Section 6. [Dự án 5] Xử lý ngôn ngữ tự nhiên (NLP) - Phân loại tin nhắn rác (Bài 39 ~ Bài 45)

Học cách xử lý văn bản là dữ liệu phi cấu trúc. Thông qua toàn bộ quy trình xử lý ngôn ngữ tự nhiên, văn bản sẽ được chuyển đổi thành dữ liệu số mà mô hình học máy có thể hiểu được.

Nội dung học chính: Tokenization, loại bỏ nhiễu, xử lý từ dừng (stop words), trích xuất gốc từ (stemming/lemmatization), vector hóa đặc trưng và phân loại ML



✒ Giới thiệu người chia sẻ kiến thức

Yoon Jae-seong (Giảng viên chính về Phân tích dữ liệu tại Like Lion)


Kinh nghiệm phát triển 
• Phát triển và ra mắt nội dung di động "Island Adventure" của SKT 
• Phát triển và ra mắt nội dung di động "Quiz Soccer" của KT 
• Ra mắt "Mobile Real Estate Agent" của SK 
• Phát triển ứng dụng iPhone "Hanjatong" 
• Phát triển ứng dụng iPhone "Health Training" 
• Phát triển nội dung "Tales of Commons" của Namco Nhật Bản cho KT/SK 
• Phát triển các mini game của KT (Yageum Yageum Land Grab, Aladdin's Magic Lamp, Mystery Block Detective Group, BUZZ and BUZZ)

Kinh nghiệm giảng dạy
Tôi là giảng viên kỳ cựu với 19 năm kinh nghiệm giảng dạy và phát triển cho các nhân viên đang làm việc tại các doanh nghiệp nổi tiếng trong nước và những người chưa có việc làm như: Samsung Multi Campus, Viện Thúc đẩy Công nghiệp Thông tin Busan, Viện Thúc đẩy Công nghiệp Văn hóa Thông tin Jeonju, Viện Thúc đẩy Công nghiệp Thông tin Incheon, Viện Thúc đẩy Phát thanh Truyền hình Hàn Quốc, SK C&C, T Academy, Viện Thúc đẩy Công nghiệp Robot Hàn Quốc, Daejeon ETRI, Samsung Electronics, Trung tâm Đào tạo NICA, Trung tâm Năng suất Hàn Quốc, Hanwha S&C, LG Electronics, v.v.

Lĩnh vực giảng dạy
Tôi giảng dạy về các lĩnh vực như Java, Android, Framework, Cơ sở dữ liệu, UML, iPhone, Xử lý và phân tích dữ liệu lớn, Python, Internet vạn vật (IoT), Phân tích dữ liệu sử dụng R/Python, Deep Learning, Machine Learning AI, Spark. Tôi xây dựng bài giảng bằng cách lồng ghép các kinh nghiệm đa dạng để giải thích một cách dễ hiểu nhất, đồng thời tạo ra các ví dụ để học viên có thể áp dụng vào thực hành. Vì đây không phải là lớp học trực tiếp, vui lòng sử dụng phần Hỏi & Đáp nếu có điều gì chưa rõ. Tôi nhất định sẽ giải đáp cho bạn.

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • - Những người muốn bước vào con đường mô hình hóa AI một cách nghiêm túc: Dành cho những ai đã hoàn thành kiến thức cơ bản về phân tích dữ liệu nhưng tò mò về cách xây dựng mô hình dự đoán bằng cách sử dụng dữ liệu thực tế.

  • - Những người đang khao khát các kỹ thuật tiền xử lý thực tế: Đây là nội dung thiết yếu dành cho các nhà khoa học dữ liệu tương lai, những người cần các kỹ thuật trực tiếp thay đổi hiệu suất mô hình, từ xử lý giá trị thiếu (missing value), lựa chọn đặc trưng (feature selection) cho đến làm sạch dữ liệu văn bản.

  • - Những ai muốn trải nghiệm dữ liệu từ nhiều lĩnh vực khác nhau: Rất khuyến khích cho những ai muốn trải nghiệm dữ liệu trong nhiều lĩnh vực đa dạng như xã hội (Titanic), môi trường (xe đạp), y tế (phẫu thuật), kinh tế (tiêu dùng), viễn thông (spam), v.v.

  • - Những người muốn nâng cao độ tin cậy của mô hình: Phù hợp cho những ai không chỉ dừng lại ở việc triển khai đơn thuần mà còn muốn nắm bắt đồng thời cả 'khả năng giải thích' và 'độ chính xác' của mô hình thông qua phân tích tương quan và lựa chọn đặc trưng (feature selection).

Cần biết trước khi bắt đầu?

  • Bạn cần có kiến thức cơ bản về cú pháp Python, các thư viện phân tích dữ liệu (Numpy, Pandas) và kiến thức cơ bản về học máy (machine learning).

  • Nếu bạn chưa quen với việc xử lý dữ liệu, chúng tôi khuyên bạn nên tham gia khóa học [Tiền đề bắt buộc] Master phân tích dữ liệu Python trước.

Xin chào
Đây là softcampus

15,961

Học viên

821

Đánh giá

592

Trả lời

4.7

Xếp hạng

43

Các khóa học

Soft Campus là trung tâm đào tạo hỗ trợ bán các bài giảng và nội dung trực tuyến cũng như ngoại tuyến.

Mọi thắc mắc về việc mua các bài giảng và nội dung đa dạng cũng như lĩnh vực liên quan đến AI, vui lòng liên hệ qua raputa@nate.com hoặc số điện thoại 02-553-0824.

Cảm ơn bạn.

Thêm

Chương trình giảng dạy

Tất cả

47 bài giảng ∙ (13giờ 2phút)

Tài liệu khóa học:

Tài liệu bài giảng
Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Chưa có đủ đánh giá.
Hãy trở thành tác giả của một đánh giá giúp mọi người!

Khóa học khác của softcampus

Hãy khám phá các khóa học khác của giảng viên!

Khóa học tương tự

Khám phá các khóa học khác trong cùng lĩnh vực!

Ưu đãi có thời hạn

595.618 ₫

48%

1.161.455 ₫