단 두 trang tài liệu để phân tích và trực quan hóa dữ liệu
Pandas được sử dụng để phân tích dữ liệu, xử lý trước dữ liệu, máy học và học sâu, vì vậy bạn sẽ thường sử dụng các chức năng chính.
Có một Pandas Cheat Sheet tập hợp và sắp xếp những nội dung cốt lõi này. Nếu bạn đã mệt mỏi khi học Pandas từ một cuốn sách dày, thì chỉ với hai trang tài liệu, chúng tôi sẽ giới thiệu Python Pandas cho bạn. Hãy làm quen với các chức năng cốt lõi của Pandas bằng cách sử dụng cheat sheet được cung cấp trong hướng dẫn chính thức của Pandas.
Các tính năng chính được đề cập trong Pandas Cheat Sheet
Phân tích dữ liệu Python
Tiền xử lý dữ liệu cho máy học và học sâu
thực hiện trực quan hóa dữ liệu
Pandas trích xuất, xử lý trước, phân tích và trực quan hóa trang web COVID-19 của thành phố Seoul
Phân tích dữ liệu Python Pandas, tất cả những điều cần thiết cùng một lúc!
Chỉ trong hai tài liệu Phân tích dữ liệu Pandas Bạn có thể giải được không?
Có một thư viện có tên là Pandas cho phép bạn sử dụng các hàm giống như Excel trong Python.
Excel không thể xử lý được Xử lý dữ liệu quy mô lớn cũng được.
Pandas dùng để phân tích và xử lý dữ liệu. Đây là thư viện phân tích dữ liệu Python.
Khi phân tích dữ liệu, xử lý trước hoặc trực quan hóa bằng Python Pandas, bạn sẽ chủ yếu sử dụng các hàm mà bạn thường dùng nhất. Và đây là Bảng hướng dẫn tóm tắt những tính năng cốt lõi này chỉ trong hai trang.
Tuy nhiên, nếu bạn cố gắng tự tìm tài liệu chỉ chứa nội dung cốt lõi, bạn có thể cảm thấy bối rối không biết phải thực hành nội dung nào. Trong bài giảng này, chúng tôi sẽ chỉ trích xuất nội dung cốt lõi của tài liệu hướng dẫn và giải thích cách sử dụng Matplotlib phức tạp với Pandas một cách dễ dàng. Bạn có muốn thử cùng không?
Ai sẽ được hưởng lợi khi học điều này?
phân tích dữ liệu, Yêu cầu đối với ML/DL Tôi muốn thực hiện tiền xử lý Những người làm điều đó
Khối lượng dữ liệu lớn Mở nó bằng Excel Tệp tin không mở được Những người đã bối rối
Sử dụng Excel thực hiện phân tích dữ liệu Trong các công thức phức tạp Người mệt mỏi
Khác nhau trong Excel Tôi đã thực hiện công thức nhưng Nó chậm quá Những người phải làm thêm giờ
📣 Kiểm tra kiến thức chơi game của bạn!
Cần có kiến thức tiên quyết về Python và Jupyter Notebooks, Anaconda và các khái niệm về hàng/cột trong Excel .
Tập trung vào các tài liệu chính thức Dễ dàng, nhanh chóng và chính xác.
Một, trong sổ ghi chép Jupyter Sử dụng docstring
Bạn không cần phải ghi nhớ nhiều phương pháp. Bởi vì các chức năng được sử dụng là cố định. Trong bài giảng này, chúng tôi sẽ chỉ cho bạn cách thực hành bằng cách duyệt tài liệu chính thức trong Jupyter Notebooks để bạn có thể tự học bằng cách xem phần trợ giúp và tài liệu.
2. Hình ảnh hóa dữ liệu Pandas Làm thế nào để làm được điều đó hai lần nữa!
Bạn có biết biểu đồ nào phù hợp với dữ liệu nào không? Trong bài giảng này, chúng ta cũng sẽ xem xét sự khác biệt và cách sử dụng biểu đồ thanh, bảng phân phối tần suất, biểu đồ histogram và phân phối chuẩn. Ngoài ra, tài liệu chính thức của Pandas còn giải thích nhiều phương pháp trực quan hóa Python và cách sử dụng các tùy chọn.
Phần thưởng, hãy trực quan hóa dữ liệu Series và DataFrame!
Cập nhật thêm! Hoàn hảo cho mục đích sử dụng thực tế Dự án phân tích dữ liệu.
Chúng tôi sẽ phân tích trang web về tình hình bùng phát dịch COVID-19 tại thành phố Seoul bằng Pandas, từ thu thập dữ liệu đến xử lý trước, phân tích và trực quan hóa. Bạn có thể phân tích những gì đã học được chỉ trong hai tài liệu thành một dự án tương tự như công việc thực tế của bạn . (Mục 13)
Đầu tiên, chúng ta trực tiếp phân tích dữ liệu mà chúng ta thường gặp trong cuộc sống hàng ngày thông qua tin tức.
Quận nào có nhiều ca bệnh được xác nhận nhất?
Bệnh viện nào điều trị nhiều ca bệnh được xác nhận nhất?
Có bệnh viện nào mà mọi người thường xuyên được chuyển đến theo quận không?
Quận nào có nhiều ca bệnh được xác nhận từ nước ngoài nhất?
Làm thế nào tôi có thể xử lý trước văn bản từ nhiều quốc gia, chẳng hạn như Châu Âu, Nam Mỹ, v.v.?
Sẽ có sự khác biệt bao nhiêu về số ca được xác nhận đến từ nước ngoài theo từng tháng?
Thứ hai, hiểu và thực hành các phương pháp xử lý dữ liệu trước bằng Pandas.
Làm thế nào để lấy được năm, tháng, ngày, ngày trong tuần và số tuần từ một ngày trong văn bản?
Làm thế nào chúng ta có thể tính toán số ca bệnh được xác nhận tích lũy bằng cách sử dụng dữ liệu trạng thái ca bệnh được xác nhận?
Sự khác biệt giữa groupby, crosstab, pivot và pivot_table là gì và hàm nào phù hợp để sử dụng?
3. Hiểu cấu trúc dữ liệu của khung dữ liệu và chuỗi dữ liệu và xử lý chúng thành dạng phù hợp để phân tích.
Tôi nên tạo khung dữ liệu để vẽ đồ thị bằng Pandas như thế nào?
Tôi có thể thay đổi khung dữ liệu của mình như thế nào nếu tôi muốn hiển thị các giá trị theo nhiều màu khác nhau dựa trên các giá trị phân loại của chúng trong biểu đồ?
Có cách nào để chuyển đổi một chuỗi thành một khung dữ liệu không?
Ví dụ về phân tích và hình ảnh hóa Python, Hãy tự mình kiểm tra trong lớp nhé!
Đã tạo khóa học này Bạn có tò mò về người chia sẻ kiến thức không? 👩💻
Người chia sẻ kiến thức Park Jo-eun X Phỏng vấn Inflearn
Khuyến nghị cho những người này
Khóa học này dành cho ai?
Bất kỳ ai muốn thực hiện xử lý trước cần thiết cho phân tích dữ liệu, học máy và học sâu bằng Python
Bất kỳ ai cũng từng bối rối khi mở một lượng lớn dữ liệu trong Excel và tệp không tải được
Bạn có thấy chán những công thức phức tạp trong Excel không?
Những người đã triển khai nhiều công thức khác nhau trong Excel nhưng phải làm thêm giờ vì tốc độ chậm
As a beginner, I think this is a great lecture that will help you learn the overall concept of Pandas and learn thoroughly how to use it for actual analysis. I have taken several lectures on Pandas, but I think this is the only lecture that explains the details one by one with such quality. I will review it again and apply it to actual business data and analyze it. Thank you so much for making such a great lecture!!
Overall, it was a good course. I studied Pandas on my own with a book and applied for this course for the purpose of repeated learning and application of Pandas.
The Pandas cheat sheet course was actually not that great. It won't be of much help to those who are new to Pandas, new to Python, or very beginners. It's okay as a YouTube video, but it's a bit disappointing as a paid lecture.
The Seoul City Corona Analysis course was good. It was a very useful part for me who studied the basics of Pandas because I was able to practice how to process data by applying Pandas to obtain the desired form and results.
And the tips given here and there were also very helpful. Like shift-tab, or using ? after a function to see the dot string... I think these are great tips...
Summary in one line: I don't recommend it to those who are just starting out with Pandas, but I highly recommend it to those who know a little about Pandas.
It's a good curriculum. Even a beginner like me could see the operating principles and results at the same time. What I like the most is the Q&A part. If there's something you don't know, you can ask the teacher questions and get answers right away. And the teacher's voice has such a good wavelength that it's easy to concentrate.
After graduating from the Department of Statistics and working as a data analyst, I quit my job and am studying data analysis using Python through Park Jo-eun's lecture. It was interesting to follow the lecture because it was easy to understand using timely data rather than obvious example data. I also watch YouTube a lot. Thank you!