단 두 trang tài liệu để phân tích và trực quan hóa dữ liệu
Pandas được sử dụng để phân tích dữ liệu, xử lý trước dữ liệu, máy học và học sâu, vì vậy bạn sẽ thường sử dụng các chức năng chính.
Có một Pandas Cheat Sheet tập hợp và sắp xếp những nội dung cốt lõi này. Nếu bạn đã mệt mỏi khi học Pandas từ một cuốn sách dày, thì chỉ với hai trang tài liệu, chúng tôi sẽ giới thiệu Python Pandas cho bạn. Hãy làm quen với các chức năng cốt lõi của Pandas bằng cách sử dụng cheat sheet được cung cấp trong hướng dẫn chính thức của Pandas.
Các tính năng chính được đề cập trong Pandas Cheat Sheet
Phân tích dữ liệu Python
Tiền xử lý dữ liệu cho máy học và học sâu
thực hiện trực quan hóa dữ liệu
Pandas trích xuất, xử lý trước, phân tích và trực quan hóa trang web COVID-19 của thành phố Seoul
Phân tích dữ liệu Python Pandas, tất cả những điều cần thiết cùng một lúc!
Chỉ trong hai tài liệu Phân tích dữ liệu Pandas Bạn có thể giải được không?
Có một thư viện có tên là Pandas cho phép bạn sử dụng các hàm giống như Excel trong Python.
Excel không thể xử lý được Xử lý dữ liệu quy mô lớn cũng được.
Pandas dùng để phân tích và xử lý dữ liệu. Đây là thư viện phân tích dữ liệu Python.
Khi phân tích dữ liệu, xử lý trước hoặc trực quan hóa bằng Python Pandas, bạn sẽ chủ yếu sử dụng các hàm mà bạn thường dùng nhất. Và đây là Bảng hướng dẫn tóm tắt những tính năng cốt lõi này chỉ trong hai trang.
Tuy nhiên, nếu bạn cố gắng tự tìm tài liệu chỉ chứa nội dung cốt lõi, bạn có thể cảm thấy bối rối không biết phải thực hành nội dung nào. Trong bài giảng này, chúng tôi sẽ chỉ trích xuất nội dung cốt lõi của tài liệu hướng dẫn và giải thích cách sử dụng Matplotlib phức tạp với Pandas một cách dễ dàng. Bạn có muốn thử cùng không?
Ai sẽ được hưởng lợi khi học điều này?
phân tích dữ liệu, Yêu cầu đối với ML/DL Tôi muốn thực hiện tiền xử lý Những người làm điều đó
Khối lượng dữ liệu lớn Mở nó bằng Excel Tệp tin không mở được Những người đã bối rối
Sử dụng Excel thực hiện phân tích dữ liệu Trong các công thức phức tạp Người mệt mỏi
Khác nhau trong Excel Tôi đã thực hiện công thức nhưng Nó chậm quá Những người phải làm thêm giờ
📣 Kiểm tra kiến thức chơi game của bạn!
Cần có kiến thức tiên quyết về Python và Jupyter Notebooks, Anaconda và các khái niệm về hàng/cột trong Excel .
Tập trung vào các tài liệu chính thức Dễ dàng, nhanh chóng và chính xác.
Một, trong sổ ghi chép Jupyter Sử dụng docstring
Bạn không cần phải ghi nhớ nhiều phương pháp. Bởi vì các chức năng được sử dụng là cố định. Trong bài giảng này, chúng tôi sẽ chỉ cho bạn cách thực hành bằng cách duyệt tài liệu chính thức trong Jupyter Notebooks để bạn có thể tự học bằng cách xem phần trợ giúp và tài liệu.
2. Hình ảnh hóa dữ liệu Pandas Làm thế nào để làm được điều đó hai lần nữa!
Bạn có biết biểu đồ nào phù hợp với dữ liệu nào không? Trong bài giảng này, chúng ta cũng sẽ xem xét sự khác biệt và cách sử dụng biểu đồ thanh, bảng phân phối tần suất, biểu đồ histogram và phân phối chuẩn. Ngoài ra, tài liệu chính thức của Pandas còn giải thích nhiều phương pháp trực quan hóa Python và cách sử dụng các tùy chọn.
Phần thưởng, hãy trực quan hóa dữ liệu Series và DataFrame!
Cập nhật thêm! Hoàn hảo cho mục đích sử dụng thực tế Dự án phân tích dữ liệu.
Chúng tôi sẽ phân tích trang web về tình hình bùng phát dịch COVID-19 tại thành phố Seoul bằng Pandas, từ thu thập dữ liệu đến xử lý trước, phân tích và trực quan hóa. Bạn có thể phân tích những gì đã học được chỉ trong hai tài liệu thành một dự án tương tự như công việc thực tế của bạn . (Mục 13)
Đầu tiên, chúng ta trực tiếp phân tích dữ liệu mà chúng ta thường gặp trong cuộc sống hàng ngày thông qua tin tức.
Quận nào có nhiều ca bệnh được xác nhận nhất?
Bệnh viện nào điều trị nhiều ca bệnh được xác nhận nhất?
Có bệnh viện nào mà mọi người thường xuyên được chuyển đến theo quận không?
Quận nào có nhiều ca bệnh được xác nhận từ nước ngoài nhất?
Làm thế nào tôi có thể xử lý trước văn bản từ nhiều quốc gia, chẳng hạn như Châu Âu, Nam Mỹ, v.v.?
Sẽ có sự khác biệt bao nhiêu về số ca được xác nhận đến từ nước ngoài theo từng tháng?
Thứ hai, hiểu và thực hành các phương pháp xử lý dữ liệu trước bằng Pandas.
Làm thế nào để lấy được năm, tháng, ngày, ngày trong tuần và số tuần từ một ngày trong văn bản?
Làm thế nào chúng ta có thể tính toán số ca bệnh được xác nhận tích lũy bằng cách sử dụng dữ liệu trạng thái ca bệnh được xác nhận?
Sự khác biệt giữa groupby, crosstab, pivot và pivot_table là gì và hàm nào phù hợp để sử dụng?
3. Hiểu cấu trúc dữ liệu của khung dữ liệu và chuỗi dữ liệu và xử lý chúng thành dạng phù hợp để phân tích.
Tôi nên tạo khung dữ liệu để vẽ đồ thị bằng Pandas như thế nào?
Tôi có thể thay đổi khung dữ liệu của mình như thế nào nếu tôi muốn hiển thị các giá trị theo nhiều màu khác nhau dựa trên các giá trị phân loại của chúng trong biểu đồ?
Có cách nào để chuyển đổi một chuỗi thành một khung dữ liệu không?
Ví dụ về phân tích và hình ảnh hóa Python, Hãy tự mình kiểm tra trong lớp nhé!
Đã tạo khóa học này Bạn có tò mò về người chia sẻ kiến thức không? 👩💻
Người chia sẻ kiến thức Park Jo-eun X Phỏng vấn Inflearn
Khuyến nghị cho những người này
Khóa học này dành cho ai?
Bất kỳ ai muốn thực hiện xử lý trước cần thiết cho phân tích dữ liệu, học máy và học sâu bằng Python
Bất kỳ ai cũng từng bối rối khi mở một lượng lớn dữ liệu trong Excel và tệp không tải được
Bạn có thấy chán những công thức phức tạp trong Excel không?
Những người đã triển khai nhiều công thức khác nhau trong Excel nhưng phải làm thêm giờ vì tốc độ chậm
Là người mới bắt đầu, tôi nghĩ đây là một khóa học tuyệt vời để bạn làm quen với các khái niệm tổng thể về Pandas và tìm hiểu chi tiết cách sử dụng nó trong phân tích thực tế. Tôi đã tham gia một số bài giảng liên quan đến Pandas, nhưng tôi nghĩ đây là bài duy nhất giải thích rõ ràng từng chi tiết. Sau khi xem xét lại, tôi dự định áp dụng nó vào dữ liệu công việc thực tế và phân tích nó. Cảm ơn bạn rất nhiều vì đã tạo ra một khóa học tuyệt vời!!
Nhìn chung, đó là một khóa học tốt. Tôi đã tự mình nghiên cứu Pandas và đăng ký tham gia khóa học này với mục đích học và ứng dụng Pandas nhiều lần.
Khóa học Pandas Cheat Sheet thực sự không tốt lắm. Nếu bạn là người mới làm quen với Pandas, mới làm quen với Python hoặc rất cơ bản thì điều này sẽ không giúp ích nhiều. Đối với một video trên YouTube thì không sao, nhưng đối với một bài giảng trả phí thì hơi thất vọng.
Bài giảng Phân tích Corona của Thành phố Seoul rất hay. Đó là một phần rất hữu ích đối với tôi, người đã nghiên cứu những điều cơ bản về Pandas, vì tôi có thể thực hành áp dụng Pandas để xử lý dữ liệu nhằm đạt được hình thức và kết quả mong muốn.
Và những lời khuyên trong quá trình thực hiện rất hữu ích. Tab Shift hay sau hàm? Bạn có thể thấy chuỗi dấu chấm bằng cách sử dụng... Có lẽ đây là một mẹo hay...
Tóm tắt một dòng: Không được khuyến khích cho những người mới làm quen với Pandas, nhưng rất khuyến khích cho những người có một số kiến thức về Pandas.
Đó là một giáo trình hay. Ngay cả một người mới bắt đầu như tôi cũng có thể nhìn thấy nguyên tắc hoạt động và kết quả, và hơn hết, tôi rất thích phần hỏi đáp. Nếu tôi không biết điều gì, anh ấy trả lời ngay câu hỏi như thể tôi đang hỏi giáo viên, và bước sóng giọng nói của giáo viên tốt đến mức tôi có thể tập trung tốt.
Sau khi tốt nghiệp Khoa Thống kê, tôi làm chuyên viên phân tích dữ liệu, sau đó nghỉ việc ở công ty và hiện đang học phân tích dữ liệu bằng Python qua bài giảng của Jo-eun Park. Tôi có thể theo dõi bài giảng một cách thích thú vì nó cung cấp thông tin dễ hiểu bằng cách sử dụng dữ liệu kịp thời thay vì dữ liệu ví dụ rõ ràng. Tôi cũng thích xem YouTube. Cảm ơn!