inflearn logo

Phân tích dữ liệu kinh doanh Phần 1 - Python và Thống kê mô tả

"Từ thiết lập môi trường đến dự án kinh doanh thực tế, hành trình khoa học dữ liệu tìm lời giải cho doanh thu bằng dữ liệu (Tổng cộng 39 bài giảng)" Vượt xa mức độ chỉ đơn thuần là học cách sử dụng thư viện, bạn sẽ được học cách xử lý dữ liệu thực tế trong lĩnh vực thương mại điện tử thông qua quy trình khoa học dữ liệu. Bắt đầu từ việc thiết lập môi trường phát triển và kiến thức cơ bản về Numpy/Pandas, đến tiền xử lý dữ liệu, phân tích thống kê, trực quan hóa, và cả phân khúc RFM dựa trên kịch bản kinh doanh cùng kiểm chứng giả thuyết! Chinh phục các năng lực cốt lõi của một nhà khoa học dữ liệu một cách hệ thống thông qua các dự án thực tế.

1 học viên đang tham gia khóa học này

Độ khó Cơ bản

Thời gian Không giới hạn

Python
Python
Data Engineering
Data Engineering
Numpy
Numpy
Pandas
Pandas
Matplotlib
Matplotlib
Python
Python
Data Engineering
Data Engineering
Numpy
Numpy
Pandas
Pandas
Matplotlib
Matplotlib

Bạn sẽ nhận được điều này sau khi học.

  • * Khả năng xây dựng môi trường Python tối ưu và các thư viện thiết yếu để phân tích dữ liệu

  • * Kỹ thuật xử lý và làm sạch dữ liệu kinh doanh quy mô lớn sử dụng Numpy và Pandas

  • * Năng lực phân tích phân khúc RFM và phân tích thống kê để phân tích các chỉ số kinh doanh

  • * Khả năng báo cáo và trực quan hóa dữ liệu ở cấp độ thực tế bằng cách sử dụng Matplotlib và Seaborn

  • * Bí quyết giải quyết vấn đề nhằm rút ra thông tin chi tiết về kinh doanh (business insights) từ dữ liệu thông qua kiểm chứng giả thuyết và phân tích tương quan

Giới thiệu khóa học


Khoa học dữ liệu giờ đây đã vượt xa khỏi một kỹ thuật đơn thuần để trở thành cốt lõi trong việc ra quyết định kinh doanh. Tuy nhiên, nhiều người học thường lầm tưởng rằng mình đã hiểu hết về phân tích dữ liệu chỉ sau khi làm quen với cách sử dụng các thư viện hoặc thực hành vài ví dụ trực quan hóa đơn giản.

Khóa học này sẽ dẫn dắt bạn vào 'thực tế kinh doanh thực thụ'. Trong quá trình trực tiếp xử lý dữ liệu thô chưa qua tinh chế, trăn trở về kỹ thuật đặc trưng (feature engineering), phân loại mô hình hành vi khách hàng thông qua mô hình RFM và tìm ra nguyên nhân cốt lõi của hiệu quả doanh thu thông qua kiểm chứng giả thuyết thống kê, bạn sẽ phát triển vượt xa một lập trình viên đơn thuần để trở thành người ra quyết định dựa trên dữ liệu. Sau khi hoàn thành hành trình tinh gọn gồm 39 bài giảng này, bạn sẽ có được sự tự tin mạnh mẽ để phân tích một cách logic bất kỳ dữ liệu kinh doanh nào được giao.

: "Từ thiết lập môi trường đến dự án kinh doanh thực tế, hành trình khoa học dữ liệu tìm kiếm câu trả lời cho doanh thu bằng dữ liệu (Tổng cộng 39 bài giảng)"

Vượt xa mức độ chỉ đơn thuần là học cách sử dụng thư viện, bạn sẽ được học cách xử lý dữ liệu thực tế trong lĩnh vực thương mại điện tử thông qua quy trình khoa học dữ liệu. Bắt đầu từ việc thiết lập môi trường phát triển và các kiến thức cơ bản về Numpy/Pandas, cho đến tiền xử lý dữ liệu, phân tích thống kê, trực quan hóa, và cả phân đoạn RFM dựa trên kịch bản kinh doanh cùng kiểm chứng giả thuyết!

Chinh phục một cách hệ thống các năng lực cốt lõi của một nhà khoa học dữ liệu thông qua các dự án thực tế.

 

Những điểm cốt lõi chỉ có tại khóa học này

* Phân tích thực tế tập trung vào kinh doanh: Không dừng lại ở các cú pháp cơ bản, bạn sẽ trực tiếp giải quyết các vấn đề cốt lõi trong thực tế ngành thương mại điện tử như phân tích doanh thu, phân khúc khách hàng và chẩn đoán kinh doanh.

* Nền tảng khoa học dữ liệu vững chắc: Từ việc thiết lập môi trường phát triển - bước khởi đầu của phân tích, cho đến việc làm chủ hoàn toàn Numpy và Pandas, những công cụ thiết yếu để xử lý dữ liệu thực tế, từ cơ bản đến nâng cao.

* Quy trình phân tích hệ thống: Không chỉ dừng lại ở việc tính toán số liệu đơn thuần, bạn sẽ được thực hành và nắm vững khung phân tích chuyên nghiệp bao gồm tiền xử lý dữ liệu, kiểm chứng giả thuyết thống kê, phân tích tương quan, v.v.

* Làm chủ tiền xử lý dữ liệu thực tế: Từ xử lý giá trị thiếu và giá trị ngoại lệ đến kỹ thuật đặc trưng (Feature Engineering), bạn sẽ nắm vững kỹ thuật tinh chế dữ liệu thô từ thực tế thành dạng có thể phân tích được.

* Báo cáo thông tin chi tiết kinh doanh: Trực quan hóa kết quả phân tích một cách tinh vi, nắm bắt mối quan hệ nhân quả trong dữ liệu để đưa ra báo cáo thông tin chi tiết cuối cùng có thể ứng dụng vào việc ra quyết định thực tế.

 


📱 Xem trước chương trình học & dự án


✒ Phần 1. Bắt đầu phân tích dữ liệu và thiết lập môi trường (Bài 1 ~ Bài 3)

Trước khi bắt đầu phân tích chính thức, bạn sẽ được tìm hiểu về quy trình của khoa học dữ liệu, đồng thời thiết lập hoàn chỉnh môi trường phát triển Python và các thư viện thiết yếu để xử lý dữ liệu một cách hiệu quả.

Học tập chính: Lộ trình khóa học, thiết lập môi trường phân tích, cài đặt và kiểm tra các thư viện thiết yếu


✒Phần 2. Nền tảng của phân tích dữ liệu, Numpy (Bài 4 ~ Bài 10)

Học cách cấu trúc và cách thao tác với mảng Numpy, nền tảng của mọi phép toán dữ liệu. Nắm vững kỹ thuật nhập xuất tệp và cách sử dụng đại số tuyến tính để xử lý dữ liệu số một cách nhanh chóng.

Kỹ thuật cốt lõi: Tạo và thao tác cơ bản với mảng, indexing/slicing, đại số tuyến tính và tạo số ngẫu nhiên

 

✒ Section 3. Hiểu về cấu trúc dữ liệu Pandas (Bài 11 ~ Bài 14)

Hiểu rõ hoàn toàn cấu trúc Series của Pandas, công cụ cốt lõi trong phân tích dữ liệu có cấu trúc. Xây dựng nền tảng vững chắc từ đơn vị cơ bản nhất mà các nhà khoa học dữ liệu sử dụng để xử lý dữ liệu.

Kỹ năng cốt lõi: Tổng quan về Pandas, hiểu biết từng bước về Series và phương pháp truy cập dữ liệu


✒ Section 4. Làm chủ thao tác với DataFrame (Bài 15 ~ Bài 19)

Trải nghiệm toàn bộ quy trình xử lý DataFrame, một dạng dữ liệu bảng. Từ việc nắm bắt các loại dữ liệu đến kỹ thuật indexing và slicing với các điều kiện phức tạp, bạn sẽ có thể kiểm soát dữ liệu một cách tự do.

Nội dung học chính: Xác định loại dữ liệu, thao tác cơ bản với DataFrame, chiến lược lập chỉ mục (indexing) và cắt dữ liệu (slicing) nâng cao


✒ Phần 5. Làm sạch dữ liệu và Thống kê mô tả (Bài 20 ~ Bài 25)

Làm sạch dữ liệu thô chưa qua xử lý thành trạng thái có thể phân tích được. Học cách xử lý các giá trị thiếu (결측치) và giá trị ngoại lệ (이상치), đồng thời rút ra các đặc trưng của dữ liệu thông qua phân tích thống kê theo từng nhóm.

Kỹ thuật cốt lõi: Quy trình tiền xử lý dữ liệu, phân tích thống kê nhóm, giá trị thiếu và giá trị ngoại lệ

Logic xử lý


✒ Phần 6. Trực quan hóa dữ liệu và Phân tích khám phá (Bài 26 ~ Bài 30)

Trực quan hóa để tìm ra các quy luật và ý nghĩa ẩn giấu trong dữ liệu. Sử dụng Matplotlib và Seaborn để tạo ra các biểu đồ và đồ thị đạt tiêu chuẩn báo cáo thực tế.

Kỹ năng cốt lõi: Kỹ thuật trực quan hóa Matplotlib & Seaborn, ứng dụng trực quan hóa liên kết với Pandas


✒Phần 7. [Project] Kịch bản kinh doanh và Làm sạch dữ liệu (Bài 31 ~ Bài 34)

Chúng tôi bắt đầu dự án dựa trên kịch bản chứa đựng những trăn trở thực tế trong lĩnh vực thương mại điện tử. Bạn sẽ được học toàn bộ quy trình từ khám phá dữ liệu ban đầu đến kỹ thuật đặc trưng (Feature Engineering) ở cấp độ thực tế.

Học tập chính: Thiết lập kịch bản kinh doanh, quy trình làm sạch dữ liệu (Data Cleaning Pipeline), áp dụng kỹ thuật đặc trưng (Feature Engineering)


✒Phần 8.[Dự án] Phân tích doanh thu và Thông tin chi tiết về doanh nghiệp (Bài 35 ~ Bài 39)

Chẩn đoán hiệu quả doanh thu và phân loại khách hàng thông qua dữ liệu. Hoàn thành báo cáo insight cuối cùng cần thiết cho việc ra quyết định thực tế sau khi trải qua phân tích RFM và kiểm chứng giả thuyết.

Nội dung học chính: Phân khúc RFM, phân tích tương quan, kiểm chứng giả thuyết và phương pháp lập báo cáo cuối cùng


✒ Giới thiệu người chia sẻ kiến thức

Yoon Jae-seong (Giảng viên chính về Phân tích dữ liệu tại Like Lion)


Kinh nghiệm phát triển 
• Phát triển và ra mắt nội dung di động SKT "Island Adventure" 
• Phát triển và ra mắt nội dung di động KT "Quiz Soccer" 
• Ra mắt SK "Mobile Real Estate Agent" 
• Phát triển ứng dụng iPhone "Hanjatong" 
• Phát triển ứng dụng iPhone "Health Training" 
• Phát triển nội dung KT/SK Nhật Bản Namco "Tales of Commons" 
• Phát triển KT Mini Game (Yageum Yageum Land Grab, Aladdin's Magic Lamp, Mystery Block Detective Agency, BUZZ and BUZZ)

Kinh nghiệm giảng dạy
Tôi là giảng viên kỳ cựu với 19 năm kinh nghiệm giảng dạy và phát triển cho các nhân viên đang làm việc tại các doanh nghiệp nổi tiếng trong nước và những người chưa có việc làm như Samsung Multi Campus, Viện Thúc đẩy Công nghiệp Thông tin Busan, Viện Thúc đẩy Công nghiệp Văn hóa Thông tin Jeonju, Viện Thúc đẩy Công nghiệp Thông tin Incheon, Viện Thúc đẩy Phát thanh Truyền hình Hàn Quốc, SK C&C, T Academy, Viện Thúc đẩy Công nghiệp Robot Hàn Quốc, Daejeon ETRI, Samsung Electronics, Trung tâm Đào tạo NICA, Trung tâm Năng suất Hàn Quốc, Hanwha S&C, LG Electronics, v.v.

Lĩnh vực giảng dạy
Tôi giảng dạy về các lĩnh vực như Java, Android, Framework, Cơ sở dữ liệu, UML, iPhone, Xử lý và phân tích dữ liệu lớn, Python, Internet vạn vật (IoT), Phân tích dữ liệu sử dụng R/Python, Deep Learning, Machine Learning AI, Spark. Tôi đúc kết những kinh nghiệm đa dạng để giải thích một cách dễ hiểu nhất, đồng thời xây dựng bài giảng với các ví dụ thực tế để học viên có thể áp dụng vào thực hành. Vì đây không phải là lớp học trực tiếp, nếu có điều gì chưa rõ, vui lòng đặt câu hỏi & giải đáp.

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • * Những người muốn học nhanh thông qua các dự án thực tế: Những người muốn trải nghiệm quy trình phân tích tìm ra câu trả lời cho doanh thu bằng cách xử lý dữ liệu kinh doanh thực tế thay vì liệt kê các ngữ pháp nhàm chán.

  • * Những người muốn chinh phục toàn bộ quy trình phân tích dữ liệu: Những người muốn trải nghiệm quy trình full-stack của khoa học dữ liệu, từ việc làm sạch dữ liệu, kỹ thuật đặc trưng (feature engineering) đến kiểm chứng giả thuyết thống kê, thay vì chỉ dừng lại ở việc trực quan hóa đơn thuần.

  • * Những người tò mò về phương pháp phân tích dữ liệu kinh doanh: Những người muốn trực tiếp thực hiện các kỹ thuật cốt lõi được ứng dụng ngay vào việc ra quyết định trong thực tế như phân đoạn RFM, phân tích tương quan, kiểm chứng giả thuyết.

  • * Những người đang tìm việc hoặc muốn chuyển việc cần một bộ hồ sơ năng lực (portfolio) chất lượng cao: Những người muốn sở hữu các sản phẩm báo cáo chuyên sâu và phân tích dữ liệu dựa trên các kịch bản kinh doanh thực tế thay vì chỉ là những ví dụ đơn giản.

Cần biết trước khi bắt đầu?

  • Bạn cần phải quen thuộc với cú pháp cơ bản của Python.

  • Numpy và Pandas, những công cụ cốt lõi của phân tích dữ liệu, sẽ được hướng dẫn từng bước từ cơ bản đến nâng cao trong khóa học này. Vì vậy, ngay cả những người mới bắt đầu chưa có kinh nghiệm phân tích vẫn có thể hoàn toàn theo kịp nếu có hiểu biết cơ bản về lập trình Python.

Xin chào
Đây là softcampus

16,208

Học viên

831

Đánh giá

595

Trả lời

4.7

Xếp hạng

48

Các khóa học

Soft Campus là trung tâm đào tạo hỗ trợ bán các nội dung và bài giảng trực tuyến cũng như trực tiếp.

Mọi thắc mắc về việc mua các bài giảng và nội dung đa dạng cũng như lĩnh vực liên quan đến AI, vui lòng liên hệ qua raputa@nate.com hoặc số điện thoại 02-553-0824.

Cảm ơn bạn.

Thêm

Chương trình giảng dạy

Tất cả

41 bài giảng ∙ (15giờ 54phút)

Tài liệu khóa học:

Tài liệu bài giảng
Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Chưa có đủ đánh giá.
Hãy trở thành tác giả của một đánh giá giúp mọi người!

Khóa học khác của softcampus

Hãy khám phá các khóa học khác của giảng viên!

Khóa học tương tự

Khám phá các khóa học khác trong cùng lĩnh vực!

Ưu đãi có thời hạn

22 ₫

48%

1.165.189 ₫