Chinh phục phân tích và trực quan hóa dữ liệu chỉ với hai trang tài liệu

Khi sử dụng Pandas để phân tích dữ liệu, tiền xử lý, học máy (machine learning) và học sâu (deep learning), chúng ta thường có xu hướng chỉ tập trung vào những chức năng hay dùng nhất. Có một bản Pandas Cheat Sheet đã tổng hợp lại tất cả những nội dung cốt lõi này. Đối với những ai cảm thấy mệt mỏi khi phải học Pandas qua những cuốn sách dày cộp, tài liệu này sẽ hướng dẫn bạn về Python Pandas chỉ trong vỏn vẹn hai trang giấy. Hãy cùng tìm hiểu các chức năng chính của Pandas thông qua bản cheat sheet được cung cấp từ chính hướng dẫn chính thức của Pandas.

(4.8) 171 đánh giá

2,580 học viên

Độ khó Cơ bản

Thời gian Không giới hạn

Python
Python
Pandas
Pandas
Python
Python
Pandas
Pandas

Đánh giá từ những học viên đầu tiên

4.8

5.0

티보그

89% đã tham gia

Tôi muốn biến phương pháp phân tích của người hướng dẫn thành của riêng tôi. Cảm ơn

5.0

세바스찬 주니어 3세

89% đã tham gia

Là người mới bắt đầu, tôi nghĩ đây là một khóa học tuyệt vời để bạn làm quen với các khái niệm tổng thể về Pandas và tìm hiểu chi tiết cách sử dụng nó trong phân tích thực tế. Tôi đã tham gia một số bài giảng liên quan đến Pandas, nhưng tôi nghĩ đây là bài duy nhất giải thích rõ ràng từng chi tiết. Sau khi xem xét lại, tôi dự định áp dụng nó vào dữ liệu công việc thực tế và phân tích nó. Cảm ơn bạn rất nhiều vì đã tạo ra một khóa học tuyệt vời!!

5.0

pooh9431

37% đã tham gia

Đó là một giáo trình hay. Ngay cả một người mới bắt đầu như tôi cũng có thể nhìn thấy nguyên tắc hoạt động và kết quả, và hơn hết, tôi rất thích phần hỏi đáp. Nếu tôi không biết điều gì, anh ấy trả lời ngay câu hỏi như thể tôi đang hỏi giáo viên, và bước sóng giọng nói của giáo viên tốt đến mức tôi có thể tập trung tốt.

Bạn sẽ nhận được điều này sau khi học.

  • Các tính năng cốt lõi từ Pandas Cheat Sheet

  • Phân tích dữ liệu bằng Python

  • Tiền xử lý dữ liệu cho Machine Learning và Deep Learning

  • Trực quan hóa dữ liệu

  • Thu thập dữ liệu (crawling), tiền xử lý, phân tích và trực quan hóa trang web COVID-19 của thành phố Seoul bằng Pandas.

Phân tích dữ liệu với Python Pandas, nắm trọn cốt lõi trong một lần!

Chỉ với hai trang tài liệu,
bạn có thể giải quyết
việc phân tích dữ liệu Pandas sao?

Có một thư viện có thể sử dụng các chức năng tương tự như Excel trong Python là Pandas.

Xử lý dữ liệu quy mô lớn mà
Excel không thể gánh vác nổi cũng đều OK.

Pandas là thư viện phân tích dữ liệu bằng Python dùng để phân tích và tiền xử lý dữ liệu.

Khi thực hiện phân tích, tiền xử lý hoặc trực quan hóa dữ liệu bằng Python Pandas, chúng ta thường chủ yếu sử dụng các chức năng chính. Và có một bản Cheat Sheet tóm tắt chính xác những chức năng cốt lõi này chỉ trong vỏn vẹn hai trang.

Tuy nhiên, nếu bạn tự mình xem tờ bí kíp (cheat sheet) chỉ tóm tắt những nội dung cốt lõi này, bạn có thể cảm thấy mông lung không biết nên thực hành nội dung nào và như thế nào. Trong khóa học này, chúng tôi sẽ trích lọc và giải thích những nội dung trọng tâm của cheat sheet, sau đó hướng dẫn bạn cách sử dụng Pandas để thay thế cho Matplotlib phức tạp một cách dễ dàng. Bạn đã sẵn sàng cùng thử sức chưa?


Ai nên học khóa học này?

Những người muốn thực hiện
tiền xử lý cần thiết cho
phân tích dữ liệu và
ML/DL

Những người đã từng
bối rối khi không thể
mở được tệp dữ liệu
dung lượng lớn bằng Excel

Những người đang sử dụng Excel để
phân tích dữ liệu nhưng
cảm thấy mệt mỏi vì
các công thức phức tạp

Những người đã thực hiện nhiều
công thức khác nhau trong Excel
nhưng tốc độ chậm
nên đã phải làm thêm giờ

📣 Hãy kiểm tra kiến thức tiên quyết!

  • Bạn cần có kiến thức nền tảng về Python, Jupyter Notebook, Anaconda và khái niệm hàng/cột trong Excel.

Tập trung vào tài liệu chính thức 
một cách dễ dàng, nhanh chóng và chính xác.

Một là, sử dụng docstring trong
Jupyter Notebook

Bạn không cần phải ghi nhớ quá nhiều phương thức. Vì các tính năng được sử dụng thường đã được quy định sẵn. Trong khóa học này, tôi sẽ hướng dẫn bạn cách thực hành bằng cách tra cứu tài liệu chính thức ngay trên Jupyter Notebook để bạn có thể tự học thông qua phần trợ giúp và tài liệu hướng dẫn.

Thứ hai, cách để trực quan hóa dữ liệu Pandas
giỏi gấp 2 lần!

Bạn có biết loại biểu đồ nào là phù hợp cho từng loại dữ liệu không? Trong khóa học này, chúng ta sẽ tìm hiểu về sự khác biệt và cách sử dụng của biểu đồ cột, bảng phân phối tần suất, biểu đồ histogram và phân phối chuẩn. Ngoài ra, khóa học cũng hướng dẫn cách sử dụng các tùy chọn và phương pháp trực quan hóa dữ liệu đa dạng trong Python thông qua tài liệu chính thức của Pandas.

Bonus, cho đến cả trực quan hóa dữ liệu Series và DataFrame!

파이썬 판다스 시각화 예제

파이썬 판다스 시각화 예제
파이썬 판다스 시각화 예제
파이썬 판다스 시각화 예제

Cập nhật bổ sung! 
Dự án phân tích dữ liệu
phù hợp hoàn hảo với thực tế.

Chúng tôi sẽ phân tích trang web tình hình dịch bệnh COVID-19 của Seoul bằng Pandas, từ thu thập dữ liệu (crawling) đến tiền xử lý, phân tích và trực quan hóa. Bạn có thể phân tích những nội dung đã học chỉ qua hai trang tài liệu bằng một dự án tương tự như trong công việc thực tế. (Phần 13)

Một là, trực tiếp phân tích các dữ liệu thường gặp trong cuộc sống hàng ngày thông qua tin tức.

  • Quận nào có số ca nhiễm mới cao nhất?
  • Bệnh viện nào đã điều trị cho nhiều bệnh nhân nhất?
  • Liệu có bệnh viện nào thường xuyên tiếp nhận bệnh nhân chuyển đến theo từng quận không?
  • Quận nào có số ca nhiễm nhập cảnh từ nước ngoài cao nhất?
  • Để tiền xử lý văn bản nhằm phân loại nhiều quốc gia thành các khu vực như Châu Âu, Nam Mỹ, v.v., chúng ta nên làm thế nào?
  • Số ca nhiễm nhập cảnh từ nước ngoài có sự khác biệt như thế nào theo từng tháng?

Thứ hai, hiểu và thực hành các phương pháp tiền xử lý dữ liệu thông qua Pandas.

  • Làm thế nào để lấy được năm, tháng, ngày, thứ và tuần từ dữ liệu ngày tháng dạng văn bản?
  • Làm thế nào để tính số ca nhiễm tích lũy từ dữ liệu tình hình ca nhiễm?
  • Sự khác biệt giữa groupby, crosstab, pivot và pivot_table là gì, và sử dụng chức năng nào thì phù hợp?

Thứ ba, hiểu cấu trúc dữ liệu của DataFrame và Series, sau đó xử lý chúng thành biểu mẫu phù hợp để phân tích.

  • Để vẽ biểu đồ bằng hàm plot của Pandas, hình dạng của DataFrame cần được tạo như thế nào?
  • Nếu bạn muốn thể hiện các giá trị bằng các màu sắc khác nhau tùy theo giá trị phân loại trên biểu đồ, bạn cần phải thay đổi khung dữ liệu (dataframe) như thế nào?
  • Có những cách nào để chuyển đổi một Series thành một DataFrame?

Ví dụ về phân tích & trực quan hóa Python,
hãy tự mình kiểm tra trong bài giảng!


Nếu bạn tò mò về
người chia sẻ kiến thức đã tạo ra bài giảng này? 👩‍💻

Phỏng vấn Người chia sẻ kiến thức Park Jo-eun X Inflearn

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • Những người muốn thực hiện tiền xử lý dữ liệu cần thiết cho phân tích dữ liệu, học máy (machine learning) và học sâu (deep learning) bằng Python.

  • Những ai từng bối rối khi không thể mở được tệp dữ liệu dung lượng lớn bằng Excel do lỗi không tải được tệp.

  • Những ai đang cảm thấy mệt mỏi với các công thức phức tạp trong Excel

  • Những người đã từng phải làm thêm giờ vì tốc độ xử lý chậm dù đã thiết lập nhiều công thức đa dạng trong Excel.

Cần biết trước khi bắt đầu?

  • Python

  • Jupyter Notebook

  • Anaconda

  • Khái niệm hàng và cột trong Excel

Xin chào
Đây là todaycode

19,904

Học viên

870

Đánh giá

1,348

Trả lời

4.8

Xếp hạng

7

Các khóa học

Thêm

Chương trình giảng dạy

Tất cả

63 bài giảng ∙ (11giờ 10phút)

Tài liệu khóa học:

Tài liệu bài giảng
Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Tất cả

171 đánh giá

4.8

171 đánh giá

  • flyhigh님의 프로필 이미지
    flyhigh

    Đánh giá 1

    Đánh giá trung bình 5.0

    5

    37% đã tham gia

    Đó là một giáo trình hay. Ngay cả một người mới bắt đầu như tôi cũng có thể nhìn thấy nguyên tắc hoạt động và kết quả, và hơn hết, tôi rất thích phần hỏi đáp. Nếu tôi không biết điều gì, anh ấy trả lời ngay câu hỏi như thể tôi đang hỏi giáo viên, và bước sóng giọng nói của giáo viên tốt đến mức tôi có thể tập trung tốt.

    • eypark1465님의 프로필 이미지
      eypark1465

      Đánh giá 1

      Đánh giá trung bình 5.0

      5

      89% đã tham gia

      Tôi muốn biến phương pháp phân tích của người hướng dẫn thành của riêng tôi. Cảm ơn

      • Bạn có tham lam không?

    • wonseok님의 프로필 이미지
      wonseok

      Đánh giá 15

      Đánh giá trung bình 4.7

      5

      89% đã tham gia

      Là người mới bắt đầu, tôi nghĩ đây là một khóa học tuyệt vời để bạn làm quen với các khái niệm tổng thể về Pandas và tìm hiểu chi tiết cách sử dụng nó trong phân tích thực tế. Tôi đã tham gia một số bài giảng liên quan đến Pandas, nhưng tôi nghĩ đây là bài duy nhất giải thích rõ ràng từng chi tiết. Sau khi xem xét lại, tôi dự định áp dụng nó vào dữ liệu công việc thực tế và phân tích nó. Cảm ơn bạn rất nhiều vì đã tạo ra một khóa học tuyệt vời!!

      • easonjung1977님의 프로필 이미지
        easonjung1977

        Đánh giá 1

        Đánh giá trung bình 4.0

        4

        100% đã tham gia

        Nhìn chung, đó là một khóa học tốt. Tôi đã tự mình nghiên cứu Pandas và đăng ký tham gia khóa học này với mục đích học và ứng dụng Pandas nhiều lần. Khóa học Pandas Cheat Sheet thực sự không tốt lắm. Nếu bạn là người mới làm quen với Pandas, mới làm quen với Python hoặc rất cơ bản thì điều này sẽ không giúp ích nhiều. Đối với một video trên YouTube thì không sao, nhưng đối với một bài giảng trả phí thì hơi thất vọng. Bài giảng Phân tích Corona của Thành phố Seoul rất hay. Đó là một phần rất hữu ích đối với tôi, người đã nghiên cứu những điều cơ bản về Pandas, vì tôi có thể thực hành áp dụng Pandas để xử lý dữ liệu nhằm đạt được hình thức và kết quả mong muốn. Và những lời khuyên trong quá trình thực hiện rất hữu ích. Tab Shift hay sau hàm? Bạn có thể thấy chuỗi dấu chấm bằng cách sử dụng... Có lẽ đây là một mẹo hay... Tóm tắt một dòng: Không được khuyến khích cho những người mới làm quen với Pandas, nhưng rất khuyến khích cho những người có một số kiến ​​thức về Pandas.

        • jsm93580833님의 프로필 이미지
          jsm93580833

          Đánh giá 1

          Đánh giá trung bình 2.0

          2

          48% đã tham gia

          Tôi rất ngạc nhiên khi thấy chỉ có những bài viết được đánh giá tốt hơn tôi mong đợi. Cá nhân tôi không thích bài giảng vì nó tiếp tục mơ hồ do thiếu phần giải thích về code. Điều mơ hồ là mặc dù giảng viên là chuyên gia về Pandas nhưng không có cảm giác xáo trộn dữ liệu. Bằng cách gọi ra một bảng cheat rất đơn giản, Giải thích nó chi tiết hơn và chỉ ra cách nó được áp dụng hoặc nó được sử dụng thực sự như thế nào. Thay vì giải thích thêm tại sao mã này hoạt động như thế này, tôi sẽ giải thích nó sau một thời gian ngắn. Bảng cheat chỉ giải thích bấy nhiêu đó và kết thúc. Không có lời giải thích bổ sung nào cho những thứ được coi là thiết yếu. Mặc dù biết rõ nội dung bài giảng ở đây nhưng tôi vẫn cố gắng xem lại nó một cách nghiêm túc. Nhưng khi bạn nghĩ về nó từ góc độ của người mới bắt đầu, chức năng đó chính xác là gì?? Nó có được sử dụng nhiều không? Thật đáng để suy nghĩ Điều đó khiến tôi bực bội không chỉ một hoặc hai lần mà trong suốt bài giảng. Đây là loại bài giảng mà bạn chỉ cần lấy mã và giải thích đại khái.

          • todaycode
            Giảng viên

            Xin chào. Tôi xin lỗi vì không thể giúp gì nhiều cho bạn vì bạn đã biết mọi thứ ở đây rồi. Đối với những người mới làm quen với Pandas, khóa học này tập trung vào các chức năng học tập bằng cách sử dụng hai bảng ghi chú thay vì một cuốn sách dày, vì vậy tôi không nghĩ bạn sẽ có cảm giác như đang chạm vào dữ liệu. Lý do tôi tạo khóa học này là vì tôi đã giới thiệu một bảng cheat cho người mới bắt đầu và tôi nhận được nhiều nhận xét nói rằng họ không biết cách đọc bảng này. Như bạn đã nhận xét, trọng tâm chủ yếu là ở khía cạnh chức năng. Quá trình phân tích dữ liệu thực tế đã được đề cập trong các khóa học khác nên không được đề cập trong khóa học này. Vì vậy, tôi nghĩ bạn có thể cảm thấy thiếu thông tin về điều gì là quan trọng và điều gì được sử dụng chủ yếu. Chúng tôi đang có kế hoạch cải tiến một số nội dung của khóa học này để phù hợp với phiên bản Pandas đã cập nhật và ý kiến ​​của bạn sẽ được phản ánh trong bản cải tiến.

          • todaycode
            Giảng viên

            Phân tích dữ liệu Corona của Thành phố Seoul đã được thêm vào bài giảng. Chúng tôi đã bổ sung những phần mà chúng tôi cho rằng còn thiếu trong phản hồi mà bạn để lại. Chúng tôi truy xuất dữ liệu được công bố thực tế và phân tích sự khác biệt giữa các phương pháp tương tự và lý do phương pháp đó được sử dụng. Chúng tôi sẽ tiếp tục cập nhật khóa học này trong thời gian tới.

        Khóa học khác của todaycode

        Hãy khám phá các khóa học khác của giảng viên!

        Khóa học tương tự

        Khám phá các khóa học khác trong cùng lĩnh vực!