Phân tích dữ liệu Python cho Machine Learning/Deep Learning của Yoon Jae-sung (Ai part1)

* Lộ trình học thực chiến 100%: Không chỉ học ngữ pháp, cấu trúc chương trình tập trung vào thực hành xử lý dữ liệu trực tiếp. * Khóa học tiên quyết để chinh phục Machine Learning: Hệ thống hóa hoàn hảo các kỹ thuật tiền xử lý bắt buộc phải biết trước khi học AI. * Làm chủ công cụ phân tích dữ liệu: Chinh phục các tính năng cốt lõi của Numpy (tính toán số học) và Pandas (kiểm soát dữ liệu). * Rút ra Insight thông qua trực quan hóa: Truyền đạt kỹ năng trực quan hóa dữ liệu bằng Matplotlib và Seaborn. * Củng cố nền tảng thống kê: Học các kỹ thuật phân tích nhóm và thống kê cơ bản để nắm bắt đặc tính của dữ liệu.

3 học viên đang tham gia khóa học này

Độ khó Cơ bản

Thời gian Không giới hạn

Machine Learning(ML)
Machine Learning(ML)
Pandas
Pandas
Numpy
Numpy
Seaborn
Seaborn
Matplotlib
Matplotlib
Machine Learning(ML)
Machine Learning(ML)
Pandas
Pandas
Numpy
Numpy
Seaborn
Seaborn
Matplotlib
Matplotlib

Bạn sẽ nhận được điều này sau khi học.

  • Khóa học này giúp những người học đã nắm vững ngữ pháp Python cơ bản học về 'Cơ sở phân tích dữ liệu', một bước bắt buộc phải trải qua để tiến vào thế giới học máy (machine learning) và học sâu (deep learning).

  • Tìm hiểu các chức năng cốt lõi của Numpy - thư viện phân tích số học và Pandas - thư viện xử lý dữ liệu, đồng thời nắm vững cách trực quan hóa dữ liệu thông qua Matplotlib và Seaborn.

Giới thiệu khóa học


: Mô hình trí tuệ nhân tạo hào nhoáng, nếu bắt đầu mà không có nền tảng thì 100% sẽ bỏ cuộc! Tôi sẽ giúp bạn rèn luyện một cách chắc chắn “khả năng phân tích và tiền xử lý dữ liệu”, vốn chiếm đến 80% thời gian của một dự án Machine Learning.

Đừng vội vàng lao ngay vào Deep Learning khi mới chỉ nắm vững ngữ pháp Python cơ bản. Khóa học này sẽ giúp bạn rèn luyện "năng lực làm chủ dữ liệu" bằng cách sử dụng thành thạo các thư viện khoa học dữ liệu thiết yếu như "Numpy, Pandas, Matplotlib, Seaborn".

Khóa học này không chỉ đơn thuần là liệt kê cách sử dụng các thư viện. Từ xử lý dữ liệu thiếu (missing value) cho đến trực quan hóa, bạn sẽ làm chủ "từ A đến Z về xử lý dữ liệu" – bước bắt buộc phải trải qua trước khi học Machine Learning – thông qua các ví dụ thực tiễn.


Điểm mấu chốt chỉ có tại khóa học này

* Lộ trình 100% thực hành: Không chỉ học ngữ pháp, cấu trúc tập trung vào thực hành xử lý dữ liệu trực tiếp

* Khóa học tiên quyết để chiến thắng Machine Learning: Tổng hợp hoàn hảo các kỹ thuật tiền xử lý nhất định phải biết trước khi học AI

* Làm chủ công cụ phân tích dữ liệu: Chinh phục các tính năng cốt lõi của Numpy (tính toán số học) và Pandas (kiểm soát dữ liệu)

* Rút ra thông tin chi tiết qua trực quan hóa: Truyền đạt kỹ năng trực quan hóa dữ liệu bằng Matplotlib và Seaborn

* Củng cố nền tảng thống kê: Học các kỹ thuật thống kê cơ bản và phân tích nhóm để nắm bắt đặc tính của dữ liệu



 

📱 Xem trước chương trình học & dự án


✒ Phần 1. Chuẩn bị (Thiết lập môi trường): (Bài 1 ~ Bài 3)

Kiểm tra lộ trình toàn bộ khóa học và thiết lập môi trường phát triển tối ưu bằng cách cài đặt các thư viện thiết yếu cho phân tích dữ liệu (Jupyter Notebook, Numpy, Pandas, v.v.).


✒Phần 2. Phép toán số học và Numpy (Bài 4 ~ Bài 6)

Chỉ sử dụng danh sách (list) trong Python là chưa đủ. Bạn sẽ được học những kiến thức cốt lõi của Numpy để xử lý dữ liệu số lớn một cách nhanh chóng và hiệu quả. Việc nắm vững nền tảng về các phép toán ma trận và vector sẽ giúp bạn chuẩn bị cơ sở toán học cho Deep Learning.

Nội dung học tập chính: Tạo mảng (Array) và hiểu cấu trúc, xử lý chiều dữ liệu

Các công nghệ ứng dụng cốt lõi: Numpy Broadcasting, Indexing, Universal Functions

 

✒ Phần 3. [Công cụ phân tích dữ liệu] Cơ bản về Pandas (Bài 7 ~ Bài 8)

Đây là khóa học nhập môn về Pandas - yếu tố quan trọng nhất trong phân tích dữ liệu. Bạn sẽ được tìm hiểu về cấu trúc của Series và DataFrame, những cấu trúc dữ liệu cơ bản nhất, đồng thời chuẩn bị các bước cần thiết để xử lý dữ liệu Excel bằng Python.

Nội dung học tập chính: Hiểu về Series, nắm vững đặc điểm cấu trúc của DataFrame

Kỹ thuật áp dụng cốt lõi: Pandas Data Structures, Basic Attributes


✒ Phần 4. [Phân tích thực tế] Tiền xử lý thực tế & Thống kê (Bài 9 ~ Bài 18)

Đây là phần cốt lõi của phân tích dữ liệu thực tế. Bạn sẽ được huấn luyện chuyên sâu từ cách tạo dữ liệu, cắt và ghép dữ liệu theo ý muốn (Indexing/Slicing), cho đến các kỹ thuật nâng cao như xử lý giá trị thiếu và phân tích thống kê.

Nội dung học tập chính: Indexing/Slicing dữ liệu, Tiền xử lý (Hợp nhất/Biến đổi), Hàm thống kê, Phân tích nhóm, Xử lý giá trị thiếu (NaN)/Giá trị ngoại lệ (Outlier)

Các kỹ thuật ứng dụng cốt lõi: loc/iloc, Merge/Concat, Apply/Map, GroupBy, NaN Handling


✒ Phần 5. [Khám phá Insight] Trực quan hóa dữ liệu (Bài 19 ~ Bài 22)

Thể hiện các mẫu dữ liệu không thể nhìn thấy chỉ qua con số bằng hình ảnh. Từ các biểu đồ cơ bản đến trực quan hóa thống kê, bạn sẽ học cách trình bày dữ liệu một cách thuyết phục nhất.

Nội dung học tập chính: Cấu trúc cơ bản của Matplotlib, các loại biểu đồ đa dạng (Line, Bar, Scatter), trực quan hóa nâng cao

Công nghệ ứng dụng cốt lõi: Matplotlib, Pandas Visualization, Seaborn


 

✒ Giới thiệu người chia sẻ kiến thức

Yoon Jae-seong (Giảng viên chính về Phân tích dữ liệu tại Like Lion)


Kinh nghiệm phát triển
• Phát triển và ra mắt nội dung di động "Island Adventure" của SKT
• Phát triển và ra mắt nội dung di động "Quiz Soccer" của KT
• Ra mắt "Mobile Real Estate Agent" của SK
• Phát triển ứng dụng iPhone "Hanjatong"
• Phát triển ứng dụng iPhone "Health Training"
• Phát triển nội dung "Tales of Commons" của Namco Nhật Bản cho KT/SK
• Phát triển các mini game của KT (Yageum Yageum Land Grab, Aladdin's Magic Lamp, Mystery Block Detective Group, BUZZ and BUZZ)

Kinh nghiệm giảng dạy
Tôi là giảng viên kỳ cựu với 19 năm kinh nghiệm giảng dạy và phát triển cho các nhân viên đang làm việc tại các doanh nghiệp nổi tiếng trong nước và những người chưa có việc làm như: Samsung Multi Campus, Viện Thúc đẩy Công nghiệp Thông tin Busan, Viện Thúc đẩy Công nghiệp Văn hóa Thông tin Jeonju, Viện Thúc đẩy Công nghiệp Thông tin Incheon, Viện Thúc đẩy Phát thanh Truyền hình Hàn Quốc, SK C&C, T Academy, Viện Thúc đẩy Công nghiệp Robot Hàn Quốc, Daejeon ETRI, Samsung Electronics, Trung tâm Đào tạo NICA, Trung tâm Năng suất Hàn Quốc, Hanwha S&C, LG Electronics, v.v.

Lĩnh vực giảng dạy
Tôi giảng dạy trong các lĩnh vực như Java, Android, Framework, Cơ sở dữ liệu, UML, iPhone, Xử lý và Phân tích Big Data, Python, Internet vạn vật (IoT), Phân tích dữ liệu sử dụng R/Python, Deep Learning, Machine Learning AI, Spark. Tôi xây dựng bài giảng bằng cách lồng ghép những kinh nghiệm đa dạng để giải thích một cách dễ hiểu nhất, đồng thời tạo ra các ví dụ để học viên có thể áp dụng vào thực hành. Vì đây không phải là lớp học trực tiếp, nếu có điều gì chưa rõ, vui lòng sử dụng phần Hỏi & Đáp. Tôi chắc chắn sẽ giải đáp cho bạn.

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • Những người đã nắm vững cú pháp Python nhưng vẫn còn e ngại khi bắt đầu học Machine Learning.

  • Những người cảm thấy quá trình tiền xử lý dữ liệu phức tạp và khó khăn

  • Những người muốn hệ thống hóa kiến thức về Numpy và Pandas một cách bài bản.

  • Những người muốn trực quan hóa dữ liệu bằng biểu đồ để sử dụng cho báo cáo hoặc lập mô hình.

Cần biết trước khi bắt đầu?

  • Vì khóa học này sử dụng các thư viện Python nên bạn cần có hiểu biết cơ bản về ngôn ngữ lập trình Python.

  • Bất cứ ai nắm vững các cú pháp Python cơ bản như biến, hàm, danh sách, từ điển, câu lệnh điều khiển (if, for),... đều có thể tham gia khóa học này.

Xin chào
Đây là softcampus

15,857

Học viên

814

Đánh giá

589

Trả lời

4.7

Xếp hạng

41

Các khóa học

Chương trình giảng dạy

Tất cả

24 bài giảng ∙ (10giờ 38phút)

Tài liệu khóa học:

Tài liệu bài giảng
Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Chưa có đủ đánh giá.
Hãy trở thành tác giả của một đánh giá giúp mọi người!

Khóa học khác của softcampus

Hãy khám phá các khóa học khác của giảng viên!

Khóa học tương tự

Khám phá các khóa học khác trong cùng lĩnh vực!

Ưu đãi có thời hạn

11.000 ₫

50%

471.328 ₫