Phân tích dữ liệu kinh doanh Phần 2 - Thống kê cơ bản

: "Từ thiết lập môi trường đến dự án kinh doanh thực tế, hành trình khoa học dữ liệu tìm lời giải cho doanh thu thương mại điện tử bằng thống kê (Tổng cộng 38 bài giảng)" Vượt xa mức độ chỉ đơn thuần là học cách sử dụng các công cụ phân tích, bạn sẽ được học cách xử lý dữ liệu log phát sinh trong thực tế ngành thương mại điện tử thông qua các quy trình thống kê. Sau khi củng cố vững chắc các lý thuyết cốt lõi từ thiết lập môi trường phát triển đến thống kê mô tả, phân phối xác suất và kiểm định giả thuyết, bạn sẽ tiến tới phân tích so sánh thời gian lưu trú trên ứng dụng và tỷ lệ chuyển đổi mua hàng của người dùng thực tế, cũng như định lượng mức độ đóng góp hiệu quả thông qua phân tích hồi quy tuyến tính đa biến! Thông qua các dự án thực tế, bạn sẽ chinh phục một cách hệ thống 'năng lực ra quyết định dựa trên dữ liệu và tự động hóa phân tích' - yếu tố cốt lõi của một nhà khoa học dữ liệu.

1 học viên đang tham gia khóa học này

Độ khó Cơ bản

Thời gian Không giới hạn

Big Data
Big Data
Python
Python
Data Engineering
Data Engineering
Big Data
Big Data
Python
Python
Data Engineering
Data Engineering

Bạn sẽ nhận được điều này sau khi học.

  • * Khả năng thiết lập môi trường thực hành thống kê và phân tích dữ liệu tối ưu: Khả năng thiết lập vững chắc môi trường phát triển Python và các thư viện thiết yếu để thực hiện phân tích thống kê và khoa học dữ liệu một cách hiệu quả.

  • * Thiết kế dữ liệu và kỹ thuật phát hiện giá trị ngoại lệ tập trung vào lĩnh vực thương mại điện tử: Kỹ thuật định nghĩa đúng quần thể và mẫu phù hợp với mục đích phân tích từ dữ liệu nhật ký (log) thô quy mô lớn, đồng thời phát hiện và xử lý tinh vi các giá trị ngoại lệ (Outlier) bằng các phương pháp thống kê.

  • * Pipeline 'Tự động hóa kiểm định' giúp tối đa hóa hiệu quả phân tích trong thực tế: Bí quyết nâng cao đột phá năng suất làm việc bằng cách tự động hóa quy trình kiểm định dữ liệu sơ bộ bằng Python - bước luôn lặp lại trong mọi giai đoạn trước khi phân tích sau khi thiết lập giả thuyết không và giả thuyết đối lập.

  • * Năng lực kiểm chứng giả thuyết thống kê - nền tảng của thử nghiệm A/B: Năng lực thực tiễn trong việc đính chính những hiểu lầm phổ biến về P-value và giảm thiểu sai số, từ đó kiểm chứng một cách khoa học tính có ý nghĩa của các chỉ số cốt lõi trong thực tế như sự khác biệt về thời gian lưu lại ứng dụng của từng người dùng hay sự khác biệt về tỷ lệ chuyển đổi mua hàng cuối cùng.

  • * Định lượng mức độ đóng góp vào hiệu quả kinh doanh thông qua phân tích hồi quy tuyến tính đa biến: Năng lực khoa học dữ liệu khác biệt, vượt xa phân tích tương quan đơn thuần để suy luận mối quan hệ nhân quả và sử dụng mô hình hồi quy tuyến tính đa biến nhằm định lượng hóa tầm ảnh hưởng của các biến cốt lõi đóng góp vào việc tăng doanh thu bằng những con số tinh vi.

  • * Khả năng đọc hiểu kinh doanh để kết nối kết quả thống kê với việc ra quyết định: Tầm nhìn giúp diễn giải các kết quả phân tích thống kê phức tạp và các ước tính khoảng tin cậy sang ngôn ngữ kinh doanh mà ban lãnh đạo và các bộ phận hợp tác có thể hiểu và hành động ngay lập tức, thay vì chỉ gói gọn trong những công thức mơ hồ.

Giới thiệu bài giảng



: "Từ xây dựng môi trường đến các dự án kinh doanh thực tế, hành trình khoa học dữ liệu tìm kiếm câu trả lời cho doanh thu thương mại điện tử bằng thống kê (Tổng cộng 38 bài giảng)"

Vượt xa mức độ chỉ đơn thuần là học cách sử dụng các công cụ phân tích, bạn sẽ được học cách xử lý dữ liệu log phát sinh trong thực tế kinh doanh thương mại điện tử bằng các quy trình thống kê. Sau khi củng cố vững chắc các lý thuyết cốt lõi từ thiết lập môi trường phát triển đến thống kê mô tả, phân phối xác suất và kiểm định giả thuyết, bạn sẽ tiến tới phân tích so sánh thời gian lưu lại trên ứng dụng và tỷ lệ chuyển đổi mua hàng của người dùng thực tế, cũng như định lượng mức độ đóng góp hiệu quả thông qua phân tích hồi quy tuyến tính đa biến! Chúng ta sẽ chinh phục một cách hệ thống 'năng lực ra quyết định dựa trên dữ liệu và tự động hóa phân tích' - yếu tố cốt lõi của một nhà khoa học dữ liệu - thông qua các dự án thực tế.

 Điểm mấu chốt chỉ có tại khóa học này

* Thống kê mô tả tùy chỉnh cho lĩnh vực Thương mại điện tử: Đây không phải là môn thống kê chỉ đơn thuần là học thuộc lòng công thức. Bắt đầu từ phương pháp xác định quần thể và mẫu thực tế từ dữ liệu log thương mại điện tử, bạn sẽ rèn luyện nhãn quan để phát hiện các giá trị ngoại lệ (Outlier) từ dữ liệu thô (raw data) chưa qua xử lý trong thực tế và giải thích hình thái của dữ liệu dưới góc nhìn kinh doanh.

* Chinh phục hoàn toàn kiểm định giả thuyết, nền tảng của A/B testing: Từ những hiểu lầm và sự thật phổ biến về P-value cho đến sai lầm loại I và loại II, bạn sẽ được củng cố nguyên lý kiểm định giả thuyết từ gốc rễ. Thông qua đó, bạn sẽ làm chủ hoàn toàn các kỹ thuật kiểm định được sử dụng nhiều nhất trong thực tế như kiểm định sự khác biệt về thời gian lưu lại ứng dụng của từng người dùng, kiểm định sự khác biệt về tỷ lệ chuyển đổi mua hàng cuối cùng.

* Thực hành tự động hóa phân tích nhằm tối đa hóa hiệu quả công việc: Để không bị mệt mỏi bởi các quy trình phân tích lặp đi lặp lại, chúng ta sẽ tiến hành thực hành xây dựng pipeline tự động thực hiện quy trình 'kiểm định dữ liệu trước' sau khi thiết lập giả thuyết không và giả thuyết đối lập, giúp nâng cao năng suất thực tế lên một tầm cao mới.

* Định lượng hiệu quả thông qua phân tích hồi quy tuyến tính đa biến: Vượt qua phân tích tương quan để đi sâu vào quan hệ nhân quả. Trang bị năng lực khoa học dữ liệu để định lượng một cách tinh vi các yếu tố cốt lõi đóng góp vào doanh thu và hiệu quả thực tế giữa các biến số kinh doanh đa dạng bằng cách sử dụng mô hình phân tích hồi quy tuyến tính đa biến.

* Nuôi dưỡng khả năng đọc hiểu số liệu thống kê trong kinh doanh: Không chỉ dừng lại ở các kết quả đầu ra của chương trình thống kê hay tính toán con số đơn thuần. Bạn sẽ nắm vững năng lực của một nhà lãnh đạo trong việc ước tính chính xác khoảng tin cậy dựa trên kết quả phân tích, và diễn giải chúng một cách rõ ràng bằng ngôn ngữ kinh doanh mà những người ra quyết định thực tế có thể hiểu được.

 

 


📱 Xem trước chương trình học & dự án


✒ Section 1. Bắt đầu phân tích dữ liệu và thiết lập môi trường (Bài 1 ~ Bài 3)

Trước khi bắt đầu phân tích chính thức, bạn sẽ hiểu được lộ trình tổng thể của khoa học dữ liệu, đồng thời thiết lập hoàn chỉnh môi trường phát triển Python và các thư viện thiết yếu để phân tích thống kê và xử lý dữ liệu hiệu quả.

Nội dung học chính: Lộ trình và tổng quan khóa học, thiết lập môi trường phân tích, cài đặt và kiểm tra hoạt động của các thư viện thiết yếu


✒Phần 2. Lý thuyết thống kê cơ bản và hình thái dữ liệu (Bài 4 ~ Bài 7)

Học về tổng quan về thống kê, vốn là khung sườn của khoa học dữ liệu, cùng với các khái niệm về quần thể và mẫu. Đặc biệt, bạn sẽ học cách định nghĩa một cách tinh vi quần thể và mẫu phù hợp với mục đích phân tích thực tế từ dữ liệu log thương mại điện tử chưa qua xử lý.

Kỹ năng cốt lõi: Tổng quan về thống kê mô tả, mối quan hệ giữa quần thể và mẫu, xác định hình thái dữ liệu số/dữ liệu phân loại, định nghĩa mẫu dựa trên nhật ký thương mại điện tử

 

✒ Section 3.Hiểu về thống kê mô tả và phân phối dữ liệu (Bài 8 ~ Bài 11)

Học về xu hướng tập trung và độ phân tán để tóm tắt các đặc tính của dữ liệu, đồng thời nắm bắt hình dạng phân phối của dữ liệu. Làm chủ logic cốt lõi để phát hiện các giá trị ngoại lệ (Outlier) bằng phương pháp thống kê, vốn là yếu tố làm giảm độ tin cậy của việc phân tích trong vô số dữ liệu có cấu trúc.

Kỹ năng cốt lõi: Trung bình·Trung vị·Yếu vị (Xu hướng tập trung), Phương sai·Độ lệch chuẩn (Độ phân tán), Độ lệch·Độ nhọn (Hình dạng phân phối), Kỹ thuật phát hiện giá trị ngoại lệ


✒ Phần 4.Lý thuyết xác suất và Định lý giới hạn trung tâm (Bài 12 ~ Bài 15)

Thiết lập khái niệm xác suất làm nền tảng cho thống kê suy diễn, đồng thời hiểu rõ sự khác biệt giữa phân phối xác suất rời rạc và phân phối xác suất liên tục. Nắm vững 'Định lý giới hạn trung tâm' - lý thuyết cốt lõi của khoa học dữ liệu quy định sự phân phối của các số liệu thống kê mẫu.

Nội dung học tập chính: Khái niệm cơ bản về xác suất, phân phối xác suất rời rạc/liên tục, cột mốc quan trọng trong phân tích dữ liệu 'Định lý giới hạn trung tâm'


✒ Phần 5. Nguyên lý ước lượng thống kê và kiểm định giả thuyết (Bài 16 ~ Bài 21)

Bạn sẽ học về ước lượng điểm và ước lượng khoảng (tính toán khoảng tin cậy, sai số) để dự đoán quần thể thông qua mẫu. Đồng thời, bạn sẽ nắm bắt ý nghĩa thực sự của P-value - yếu tố dễ bị lạm dụng nhất trong phân tích dữ liệu thực tế, và thiết lập các nguyên lý toán học/kinh doanh của kiểm định giả thuyết nhằm tối thiểu hóa sai lầm loại I và loại II.

Kỹ năng cốt lõi: Tính toán khoảng tin cậy và kích thước mẫu phù hợp, hướng dẫn thiết lập giả thuyết không/giả thuyết đối lập, cách đọc hiểu P-value, sai lầm loại I và sai lầm loại II

Logic xử lý


✒ Phần 6. Thực hành các kỹ thuật kiểm định chính và phân tích tương quan/hồi quy (Bài 22 ~ Bài 28)

Bạn sẽ được học các kỹ thuật kiểm định thống kê cốt lõi (t-test, ANOVA, kiểm định Chi-bình phương, v.v.) được sử dụng tùy theo hình thái và mục đích của dữ liệu, cùng với lý thuyết về phân tích tương quan và phân tích hồi quy tuyến tính để nắm bắt mối quan hệ giữa các biến. Sau đó, bạn sẽ tiến hành thực hành trực tiếp triển khai các nội dung này bằng cách sử dụng các công cụ phân tích dữ liệu của Python.

Kỹ thuật cốt lõi: Các phương pháp kiểm định thống kê chính theo mục đích, thuật toán phân tích tương quan, phân tích hồi quy tuyến tính đơn, thực hành sử dụng công cụ phân tích Python


✒Phần 7. [Dự án] Kịch bản kinh doanh thương mại điện tử và tự động hóa phân tích (Bài 29 ~ Bài 34)

Bắt đầu dự án phân tích dữ liệu thương mại điện tử chứa đựng những trăn trở thực tế trong công việc. Chúng ta sẽ tải và làm sạch dữ liệu log thô dung lượng lớn, đồng thời xây dựng đường ống 'tự động hóa kiểm định dữ liệu trước' để xác minh các giả định cơ bản của dữ liệu trước khi thực hiện phân tích thống kê.

Nội dung học tập chính: Hiểu bối cảnh kinh doanh và tải dữ liệu log, làm sạch dữ liệu dựa trên thống kê mô tả, lấy mẫu xác suất và tính toán kích thước mẫu, lập trình tự động hóa quy trình kiểm định dữ liệu trước


✒Phần 8.[Dự án] Kiểm chứng giả thuyết và định lượng mức độ đóng góp thành quả (Bài 35 ~ Bài 38)

Dựa trên dữ liệu người dùng thực tế đã được tinh chế trước đó, chúng tôi tiến hành kiểm chứng thống kê (A/B test) về 'sự khác biệt trong thời gian lưu lại ứng dụng' và 'sự khác biệt trong tỷ lệ chuyển đổi mua hàng cuối cùng'. Hơn nữa, thông qua phân tích hồi quy tuyến tính đa biến, chúng tôi định lượng một cách tinh vi các biến cốt lõi đóng góp vào doanh thu và hiệu quả thực tế, đồng thời ước tính khoảng tin cậy trong kinh doanh.

Nội dung học chính: Kiểm định sự khác biệt về thời gian lưu lại ứng dụng của từng người dùng, kiểm định sự khác biệt về tỷ lệ chuyển đổi mua hàng cuối cùng, đọc hiểu giá trị P-value và khoảng tin cậy dưới góc độ kinh doanh, tính toán mức độ đóng góp vào hiệu quả dựa trên mô hình hồi quy tuyến tính đa biến


✒ Giới thiệu người chia sẻ kiến thức

Yoon Jae-seong (Giảng viên chính về Phân tích dữ liệu tại Like Lion)


Kinh nghiệm phát triển 
• Phát triển và ra mắt nội dung di động SKT "Island Adventure" 
• Phát triển và ra mắt nội dung di động KT "Quiz Soccer" 
• Ra mắt SK "Mobile Real Estate Agent" 
• Phát triển ứng dụng iPhone "Hanjatong" 
• Phát triển ứng dụng iPhone "Health Training" 
• Phát triển nội dung KT/SK Namco Nhật Bản "Tales of Commons" 
• Phát triển các mini game KT (Yageum Yageum Land Grab, Aladdin's Magic Lamp, Mystery Block Detective Group, BUZZ and BUZZ)

Kinh nghiệm giảng dạy
Tôi là giảng viên kỳ cựu với 19 năm kinh nghiệm giảng dạy và phát triển cho các nhân viên đang làm việc tại các doanh nghiệp nổi tiếng trong nước và những người chưa có việc làm như: Samsung Multicampus, Viện Thúc đẩy Công nghiệp Thông tin Busan, Viện Thúc đẩy Công nghiệp Văn hóa Thông tin Jeonju, Viện Thúc đẩy Công nghiệp Thông tin Incheon, Viện Thúc đẩy Phát thanh Truyền hình Hàn Quốc, SK C&C, T Academy, Viện Thúc đẩy Công nghiệp Robot Hàn Quốc, Daejeon ETRI, Samsung Electronics, Trung tâm Đào tạo NICA, Trung tâm Năng suất Hàn Quốc, Hanwha S&C, LG Electronics, v.v.

Lĩnh vực giảng dạy
Tôi giảng dạy trong các lĩnh vực như Java, Android, Framework, Cơ sở dữ liệu, UML, iPhone, Xử lý và phân tích dữ liệu lớn, Python, Internet vạn vật (IoT), Phân tích dữ liệu sử dụng R/Python, Deep Learning, Machine Learning AI, Spark. Tôi xây dựng bài giảng bằng cách lồng ghép các kinh nghiệm đa dạng để giải thích một cách dễ hiểu nhất, đồng thời tạo ra các ví dụ để học viên có thể áp dụng vào thực hành. Vì đây không phải là lớp học trực tiếp, nên nếu có điều gì chưa rõ, hãy đặt câu hỏi & giải đáp.

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • - Những người chuẩn bị trở thành nhà khoa học dữ liệu (Data Scientist) cần một hồ sơ năng lực (portfolio) thống kê thực chiến khác biệt: Những người muốn thoát khỏi các ví dụ quá quen thuộc như dự đoán người sống sót trên tàu Titanic hay phân loại hoa Iris, để hoàn thiện một portfolio thống kê suy luận cấp độ cao, từ việc thiết lập giả thuyết dựa trên dữ liệu log thương mại điện tử thực tế, lấy mẫu xác suất, kiểm định A/B test cho đến mô hình hóa hồi quy.

  • - Những người học chuyên ngành hoặc tự học đang khao khát 'khả năng đọc hiểu dữ liệu thực tế' hơn là các chứng minh toán học: Những ai muốn học cách áp dụng các lý thuyết phức tạp như thống kê mô tả, phân phối xác suất, kiểm định giả thuyết, P-value vốn chỉ mới tiếp cận qua sách vở vào dữ liệu người dùng thương mại điện tử thực tế, và muốn nuôi dưỡng nhãn quan để diễn giải kết quả thống kê một cách tinh tế sang ngôn ngữ kinh doanh.

  • - Nhà phân tích dữ liệu thực tế muốn tối đa hóa năng suất của các công việc phân tích lặp đi lặp lại: Những người đã mệt mỏi với quá trình làm sạch dữ liệu và kiểm định thống kê sơ bộ lặp lại mỗi khi thiết lập giả thuyết, và muốn nâng cao hiệu quả công việc bằng cách xây dựng đường ống (pipeline) 'tự động hóa quy trình kiểm định dữ liệu sơ bộ' bằng Python.

  • - Những người quan tâm đến lĩnh vực thương mại điện tử và thử nghiệm A/B chuyên sâu: Những người muốn kiểm chứng về mặt thống kê các chỉ số cốt lõi trong thực tế kinh doanh thương mại điện tử, vượt ra ngoài các dữ liệu có cấu trúc thông thường, chẳng hạn như kiểm chứng sự khác biệt về thời gian lưu lại ứng dụng của từng người dùng, kiểm chứng sự khác biệt về tỷ lệ chuyển đổi mua hàng cuối cùng, v.v. và muốn tìm ra câu trả lời cho doanh thu dựa trên cơ sở khoa học.

  • - Nhà tiếp thị và người lập kế hoạch dịch vụ muốn kết hợp năng lực phân tích dữ liệu vào việc ra quyết định thực tế: Những người làm chuyên môn muốn vượt qua việc tổng hợp số liệu đơn thuần hay phân tích tương quan mơ hồ, thông qua phân tích hồi quy tuyến tính đa biến để định lượng một cách tinh vi các biến số cốt lõi đóng góp vào doanh thu và hiệu quả thực tế, từ đó tạo ra cơ sở logic mạnh mẽ để thuyết phục ban lãnh đạo.

Cần biết trước khi bắt đầu?

  • Bạn cần có sự hiểu biết về các cú pháp cơ bản của Python (biến, câu lệnh điều kiện, vòng lặp, hàm, v.v.).

  • Khóa học này không dành cho những người hoàn toàn mới bắt đầu học Python, mà được tối ưu hóa cho những ai đã từng tiếp cận qua cú pháp cơ bản và muốn học cách áp dụng chúng vào phân tích dữ liệu thực tế và thống kê.

  • Cách sử dụng thực tế các thư viện cốt lõi cần thiết cho phân tích thống kê (Numpy, Pandas, Scipy, v.v.) sẽ được hướng dẫn từng bước thông qua các bài thực hành trong khóa học (bài 27~28 và phần dự án), vì vậy bạn không cần phải có kinh nghiệm thực hiện dự án phân tích dữ liệu thực tế vẫn có thể theo học được.

  • Thay vì tập trung vào các chứng minh toán học của những công thức thống kê phức tạp và nhàm chán, khóa học này tập trung vào quy trình thực tế để xử lý dữ liệu kinh doanh thương mại điện tử và đọc hiểu chính xác các kết quả thống kê, vì vậy chỉ cần có đam mê là bạn hoàn toàn có thể hoàn thành khóa học.

Xin chào
Đây là softcampus

16,238

Học viên

833

Đánh giá

595

Trả lời

4.7

Xếp hạng

49

Các khóa học

Soft Campus là trung tâm đào tạo hỗ trợ bán các nội dung và bài giảng trực tuyến cũng như trực tiếp.

Mọi thắc mắc về việc mua các bài giảng và nội dung đa dạng cũng như lĩnh vực liên quan đến AI, vui lòng liên hệ qua raputa@nate.com hoặc số điện thoại 02-553-0824.

Cảm ơn bạn.

Thêm

Chương trình giảng dạy

Tất cả

38 bài giảng ∙ (15giờ 56phút)

Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Chưa có đủ đánh giá.
Hãy trở thành tác giả của một đánh giá giúp mọi người!

Khóa học khác của softcampus

Hãy khám phá các khóa học khác của giảng viên!

Khóa học tương tự

Khám phá các khóa học khác trong cùng lĩnh vực!

Ưu đãi có thời hạn

38.500 ₫

50%

1.611.228 ₫