inflearn logo

Cách tư duy phân tích dữ liệu bằng Python ứng dụng ngay vào thực tế (Thực hành EDA)

Nếu bạn có thể vẽ biểu đồ nhưng không thể giải thích được dữ liệu, thì khóa học này là quá trình xây dựng "năng lực đọc và giải thích" dữ liệu. Trong PART3, chúng ta sẽ thực hiện phân tích dữ liệu khám phá (EDA) tập trung vào các trường hợp thực tế. ✔ Kiểm tra phân phối dữ liệu ✔ Phân tích mối quan hệ giữa các biến ✔ Thăm dò giá trị ngoại lệ và giải thích trực quan hóa Bạn sẽ nắm vững cấu trúc phân tích với bộ dữ liệu Titanic và Iris, và thông qua dự án sử dụng dữ liệu phim TMDB 5000, bạn sẽ trực tiếp trải nghiệm toàn bộ quá trình phân tích từ: Sắp xếp dữ liệu → Thiết lập chủ đề phân tích → Giải thích trực quan hóa. Sau khi hoàn thành khóa học này, bạn sẽ trang bị được năng lực phân tích để có thể đọc và giải thích dữ liệu.

9 học viên đang tham gia khóa học này

Độ khó Cơ bản

Thời gian Không giới hạn

Python
Python
Pandas
Pandas
Numpy
Numpy
Seaborn
Seaborn
Matplotlib
Matplotlib
Python
Python
Pandas
Pandas
Numpy
Numpy
Seaborn
Seaborn
Matplotlib
Matplotlib

Bạn sẽ nhận được điều này sau khi học.

  • Khi nhìn thấy dữ liệu mới, tôi có thể tự mình phán đoán nên bắt đầu phân tích từ đâu.

  • Không chỉ dừng lại ở việc vẽ biểu đồ đơn thuần, bạn sẽ có thể giải thích được dữ liệu đó có ý nghĩa gì.

  • Bạn sẽ hiểu được toàn bộ luồng phân tích dữ liệu thành một cấu trúc duy nhất, từ kiểm tra phân phối → so sánh nhóm → phân tích mối quan hệ giữa các biến → nắm bắt cấu trúc tương quan → cho đến giải thích có điều kiện.

  • Thông qua việc thực hành với bộ dữ liệu Titanic và Iris, bạn sẽ nắm vững cấu trúc cơ bản của phân tích EDA một cách hệ thống.

  • Thông qua dự án dữ liệu phim TMDB 5000, bạn có thể trực tiếp thực hiện quy trình phân tích thực tế từ làm sạch dữ liệu → thiết lập chủ đề phân tích → đến diễn giải hình ảnh hóa.

  • Bạn sẽ tự nhiên tiếp thu được tư duy phân tích trong việc đặt câu hỏi và kiểm chứng dựa trên dữ liệu.

  • Không chỉ dừng lại ở việc thực hành đơn thuần, bạn sẽ có được sự tự tin để tự mình đọc và phân tích dữ liệu.

  • Mã nguồn và bộ dữ liệu được sử dụng trong bài giảng được cung cấp dưới dạng tài liệu học tập, giúp bạn có thể thực hiện theo đúng quy trình phân tích để ôn tập và ứng dụng.

  • Cung cấp mẫu mã phân tích EDA và dữ liệu thực hành có thể sao chép và áp dụng ngay vào công việc thực tế.

Phân tích dữ liệu,
sau biểu đồ là gì?


🤷‍♂️ "Tôi có thể vẽ được biểu đồ, nhưng...

thật sự tôi không biết phải giải thích như thế nào nữa.."


Khóa học này (PHẦN 3) đi xa hơn bước vẽ biểu đồ

Đây là khóa học dành cho những ai muốn học quy trình tư duy phân tích để đọc và diễn giải dữ liệu.


Trong phần 3 của tổng số 50 bài giảng trong chương trình đào tạo phân tích dữ liệu,

1) Bạn sẽ được hiểu một cách hệ thống quá trình phân tích dữ liệu khám phá (EDA) thông qua các ví dụ dữ liệu thực tế và
2) trải nghiệm quá trình giải thích kết quả phân tích bằng cách diễn giải phân phối dữ liệu cũng như mối quan hệ và quy luật giữa các biến số.

3) Ngoài ra, thông qua các bộ dữ liệu đa dạng và các dự án nhỏ, bạn sẽ hoàn thành từng bước quy trình phân tích dữ liệu thực tế.

👥 Ai nên tham gia khóa học này?

🙋‍♂️ Tôi gặp khó khăn trong việc giải thích biểu đồ

Dành cho những ai đã biết cách tạo biểu đồ nhưng
vẫn còn cảm thấy mông lung không biết nên đọc ra ý nghĩa gì từ dữ liệu, khóa học này sẽ giải thích quá trình tư duy của Phân tích dữ liệu khám phá (EDA).

🙋‍♀️ Tôi muốn biết EDA là gì

EDA không chỉ đơn thuần là vẽ biểu đồ mà là quá trình thấu hiểu cấu trúc, quy luật của dữ liệu và tìm ra hướng phân tích. Bạn sẽ được học luồng phân tích theo từng bước thông qua các ví dụ dữ liệu thực tế.

🙋 Tôi muốn thử phân tích dữ liệu

Thông qua việc phân tích dữ liệu Titanic, Iris và TMDB 5000, bạn sẽ được trải nghiệm quá trình đọc dữ liệu, đặt câu hỏi và giải thích kết quả phân tích dưới dạng một dự án thực tế.

💡 Sau khi kết thúc khóa học này, bạn sẽ như thế nào?

Bạn sẽ phát triển thành một nhà phân tích có khả năng đặt ra các câu hỏi để phân tích dữ liệu.

  • Thay vì chỉ phân tích dữ liệu được cung cấp, bạn sẽ được học quy trình tư duy phân tích để tự mình đặt ra các câu hỏi phân tích và kiểm chứng chúng thông qua việc khám phá dữ liệu.

Bạn sẽ có thể tự mình thiết kế quy trình Phân tích Dữ liệu Khám phá (EDA).

  • Thông qua quá trình kiểm tra phân phối dữ liệu, phân tích mối quan hệ giữa các biến và khám phá các mô hình, bạn sẽ có được tiêu chuẩn để có thể phán đoán nên bắt đầu phân tích từ đâu khi đối mặt với dữ liệu mới.

Bạn sẽ có khả năng giải thích và phân tích dữ liệu vượt xa cả những biểu đồ.

  • Thông qua các dự án phân tích dữ liệu Titanic, Iris và TMDB 5000, bạn sẽ rèn luyện được khả năng giải thích dữ liệu để phát hiện ra các quy luật của dữ liệu và giải thích kết quả phân tích một cách logic.

🙋‍♂️ Khóa học này có gì đặc biệt?

🎓 Phân tích tập trung vào giải thích dữ liệu vượt xa cả biểu đồ

Khóa học này không chỉ đơn thuần là tạo ra kết quả trực quan hóa, mà tập trung vào quá trình phân tích để đọc hiểu cấu trúc và ý nghĩa của dữ liệu ẩn chứa trong các biểu đồ.

Bằng cách khám phá phân phối dữ liệu, mối quan hệ giữa các biến và các mẫu dữ liệu, bạn sẽ rèn luyện được khả năng tự thiết lập những câu hỏi cần đặt ra từ dữ liệu.

⚙️ Kinh nghiệm phân tích EDA dựa trên dữ liệu thực tế

Thông qua việc phân tích dữ liệu Titanic, Iris và TMDB 5000, bạn sẽ được trải nghiệm quy trình phân tích dữ liệu khám phá (EDA) thông qua các ví dụ thực tế.

Từ khám phá dữ liệu → phát hiện quy luật → thiết lập hướng phân tích → đến giải thích kết quả, toàn bộ quy trình phân tích dữ liệu thực tế sẽ được thực hiện theo từng bước.

📚 Bạn sẽ học được gì?



Phần 1. Cấu trúc cơ bản của EDA

Hiểu được mục đích và vai trò của Phân tích dữ liệu khám phá (EDA), đồng thời tìm hiểu lý do tại sao quá trình khám phá lại quan trọng trong phân tích dữ liệu thông qua các ví dụ thực tế.

Phần 2. Khám phá phân phối và quy luật của dữ liệu

Bạn sẽ được học cách khám phá phân phối và các mẫu của dữ liệu bằng cách sử dụng biểu đồ histogram, biểu đồ hộp (boxplot) và biểu đồ phân tán, đồng thời thiết lập tiêu chuẩn để giải thích dữ liệu.




Phần 3. Phân tích mối quan hệ giữa các biến

Thông qua quá trình khám phá mối quan hệ giữa hai hoặc nhiều biến số để tìm ra các quy luật và ý nghĩa ẩn giấu trong dữ liệu, bạn sẽ hiểu được cần phải đặt ra những câu hỏi nào và tiến hành những phân tích gì trong quá trình EDA.

Phần 4. Dự án phân tích dữ liệu tổng hợp

Thông qua nhiều ví dụ phân tích dữ liệu khác nhau, bạn sẽ được trải nghiệm quy trình phân tích EDA theo từng bước và trực tiếp thực hiện quy trình phân tích dữ liệu thực tế thông qua dự án nhỏ sử dụng dữ liệu phim TMDB 5000.

Khóa học này không chỉ đơn thuần là vẽ thật nhiều biểu đồ, mà là

là quá trình rèn luyện tư duy phân tích để phát hiện và giải mã những câu hỏi có ý nghĩa từ dữ liệu

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • Những người muốn sở hữu "khả năng đọc và diễn giải" dữ liệu thay vì chỉ đơn thuần là "nhìn" chúng

  • Những người có thể vẽ được biểu đồ nhưng lại gặp khó khăn trong việc giải thích ý nghĩa của dữ liệu đó.

  • Những ai cảm thấy bối rối không biết nên bắt đầu phân tích từ đâu khi đối mặt với dữ liệu mới

  • Những người muốn hiểu quy trình EDA (Phân tích dữ liệu khám phá) một cách hệ thống.

  • Những ai muốn trải nghiệm phân tích thực tế bằng cách đặt câu hỏi từ dữ liệu và tìm câu trả lời, thay vì chỉ thực hành đơn thuần.

  • Những người muốn trải nghiệm quy trình phân tích từ đầu đến cuối bằng cách sử dụng dữ liệu thực tế.

  • Những người muốn hoàn thành dự án phân tích dữ liệu để sử dụng làm hồ sơ năng lực (portfolio)

  • Những người muốn xây dựng nền tảng vững chắc về khả năng giải thích dữ liệu trước khi học học máy (machine learning)

Cần biết trước khi bắt đầu?

  • Đây không nhất thiết là bài giảng yêu cầu kiến thức tiên quyết.

  • Tuy nhiên, nếu bạn đã có kinh nghiệm sử dụng Pandas để tải và sắp xếp dữ liệu, hoặc vẽ các biểu đồ đơn giản bằng Matplotlib hoặc Seaborn, bạn sẽ hiểu bài giảng dễ dàng hơn nhiều.

  • Ngay cả khi bạn không có kinh nghiệm phân tích dữ liệu, nội dung vẫn được cấu trúc để bạn có thể dễ dàng theo kịp nếu đã học tập chăm chỉ ở PHẦN 2.

  • Nếu bạn vẫn còn chưa quen với quy trình lựa chọn, làm sạch và trực quan hóa dữ liệu, chúng tôi khuyên bạn nên học PHẦN 2 trước khi tham gia khóa học này.

  • Một khi bạn đã quen với việc sử dụng các công cụ cơ bản, "quy trình tư duy phân tích" được đề cập trong bài giảng này sẽ trở nên dễ hiểu hơn nhiều.

Xin chào
Đây là daniel7

Giáo sư thỉnh giảng Khoa Phần mềm, Đại học Yonsei

 

Nhà phát triển · Chiến lược gia kinh doanh · Tác giả về quy hoạch dịch vụ AI

 

Tôi đã tích lũy được những kinh nghiệm thực tiễn trong lĩnh vực phát triển và kinh doanh suốt 30 năm qua.

Năm 1999, tôi là người đầu tiên tại Hàn Quốc độc lập phát triển webmail và đã có kinh nghiệm thiết kế nền tảng nội dung di động cho Samsung Electronics, tạo ra mức lợi nhuận ròng lên tới 64 tỷ won.

Sau đó, tôi đã tổng quát hóa chiến lược kinh doanh tại 13 quốc gia thuộc Đông Nam Á và Châu Đại Dương, đồng thời đảm nhiệm vị trí Trưởng bộ phận kinh doanh B2B và Trưởng nhóm thúc đẩy kinh doanh mới.

Hiện tại, tôi đang điều hành một doanh nghiệp giải pháp dựa trên trí tuệ nhân tạo, đồng thời ứng dụng AI và phân tích dữ liệu vào các dự án thực tế.

 

Tôi không dạy "ngữ pháp" mà dạy "cấu trúc"

 

Nhiều người nói rằng mình đã học Python nhưng khi thực sự đối mặt với mã nguồn, họ lại gặp khó khăn không biết phải bắt đầu từ đâu.

Không phải vì bạn không biết các quy tắc cú pháp chi tiết, mà là vì bạn chưa có cơ hội để học về cấu trúc tại sao nó lại hoạt động như vậy.

Khóa học của tôi không phải là khóa học để học thuộc lòng mã code.

Đây là quá trình nuôi dưỡng tư duy đọc dữ liệu.

 

Tôi đã đưa những kinh nghiệm này vào bài giảng của mình

 

  • 30 năm kinh nghiệm thực tế trong lĩnh vực phát triển và IT

  • Thiết lập chiến lược kinh doanh cho 13 quốc gia khu vực Đông Nam Á/Châu Đại Dương của Samsung Electronics

  • Đạt 64 tỷ won lợi nhuận ròng từ kinh doanh nội dung di động

  • Đào tạo hơn 2,000 người và thiết kế chương trình giảng dạy thực tế

  • Tác giả cuốn sách hướng dẫn lập kế hoạch dịch vụ AI

     

Tôi không tách rời lý thuyết khỏi thực tế.

Truyền đạt những tiêu chuẩn đã được kiểm chứng tại thực tế.

 

Những gì bạn sẽ nhận được từ khóa học này

 

  • Bạn sẽ có thể giải thích được tại sao mã nguồn lại hoạt động như vậy.

  • Khi nhìn vào dữ liệu, bạn sẽ thấy mình cần phải làm gì đầu tiên.

  • Bạn sẽ có thể tự mình thiết kế quy trình phân tích

Khóa học của tôi không phải là một khóa học kết thúc chỉ sau một lần.

Khóa học này là một chuỗi bài giảng nhằm nuôi dưỡng tư duy dữ liệu.

Thêm

Chương trình giảng dạy

Tất cả

14 bài giảng ∙ (13giờ 50phút)

Tài liệu khóa học:

Tài liệu bài giảng
Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Chưa có đủ đánh giá.
Hãy trở thành tác giả của một đánh giá giúp mọi người!

Khóa học tương tự

Khám phá các khóa học khác trong cùng lĩnh vực!

Ưu đãi có thời hạn, kết thúc sau 01:54:07 ngày

16.170 ₫

70%

1.134.042 ₫