Pandas để phân tích dữ liệu: Từ cơ bản đến phân tích dữ liệu
Bài giảng cơ bản về Pandas của Datarian, người có hơn 10.000 sinh viên tích lũy và có kinh nghiệm giảng dạy trực tuyến và ngoại tuyến sâu rộng. Tìm hiểu một cách có hệ thống về Pandas, thư viện phân tích dữ liệu đại diện của Python, với tài liệu chính thức. Bạn cũng có thể nâng cao trình độ của mình bằng cách kết hợp học lý thuyết và giải quyết vấn đề.
Tăng trình độ Pandas của bạn thông qua việc giải quyết vấn đề
Pandas để phân tích dữ liệu, Hãy tìm hiểu kỹ hơn thông qua tài liệu chính thức!
Gấu trúc, tại sao tôi phải học nó?
Sử dụng thư viện Python, Pandas Bạn có thể phân tích dữ liệu một cách dễ dàng và thuận tiện.
Khi các nhà phân tích dữ liệu tiến hành phân tích bằng Python, điều đầu tiên họ thường làm là nhập thư viện Pandas . Cho dù đó là trực quan hóa, học máy hay áp dụng các mô hình thống kê, việc tiền xử lý dữ liệu để tạo ra một định dạng phù hợp là điều cần thiết. Pandas là thư viện (gói) chuyên biệt nhất cho quy trình xử lý dữ liệu này, và do đó được sử dụng rộng rãi nhất.
Bắt đầu với Pandas, khóa học phân tích dữ liệu Python thiết yếu, cùng Datarian!
✔️Lộ trình khóa học
Điều gì làm cho khóa học này đặc biệt?
Sử dụng tài liệu chính thức của Pandas.
Tất cả chúng ta đều đồng ý rằng "Google là điều cần thiết" khi lập trình. Mặc dù web cung cấp rất nhiều tài liệu tham khảo, nhưng tài liệu chính thức chắc chắn là tốt nhất. Nó cung cấp thuật ngữ và hướng dẫn sử dụng chính xác. Ngay cả những người đã thành thạo Pandas cũng thường ngạc nhiên trước tài liệu chính thức và thốt lên: "Ồ, có một tính năng tuyệt vời!"
Dành cho những bạn mới bắt đầu với Pandas, tại sao không bắt đầu với tài liệu chính thức, cuốn sách giáo khoa tốt nhất từ trước đến nay? Khóa học của chúng tôi sẽ đóng vai trò như một hướng dẫn giúp bạn trên hành trình này. Bạn sẽ học bằng cách đọc tài liệu chính thức, làm theo mã ví dụ và thêm các giải thích bổ sung.
So sánh với SQL và Excel giúp bạn hiểu nhanh hơn.
Dữ liệu mà Pandas xử lý là một "khung dữ liệu hai chiều". Mặc dù thuật ngữ "khung dữ liệu hai chiều" nghe có vẻ xa lạ, nhưng thực ra đây là một khái niệm bạn đã quen thuộc. Hãy hình dung nó như dữ liệu dạng bảng, giống như dữ liệu thường thấy trong các bảng tính như Excel. Nếu bạn đã quen thuộc với bảng SQL, bạn sẽ hiểu rõ hơn về nó.
Vì Pandas là một công cụ xử lý các kiểu dữ liệu tương tự, nên nó thường cung cấp các tính năng tương tự, hoặc thậm chí mạnh mẽ hơn, SQL và Excel. Đó là lý do tại sao khi học một hàm mới, tôi đã đưa vào các phép so sánh với SQL hoặc Excel. Học bằng cách so sánh với những gì bạn đã biết sẽ giúp bạn hiểu dễ dàng và nhanh chóng hơn, đúng không?
Khóa học này hữu ích cho những người mới bắt đầu sử dụng Python để phân tích và trực quan hóa sâu hơn những gì có thể thực hiện được bằng SQL, hoặc cho những người cần Pandas để xử lý lượng dữ liệu lớn không thể nhập vào Excel, hoặc cho những người đang sử dụng các công cụ khác.
H. SQL, đây có phải là điều tôi thực sự cần biết không?
Tôi khuyên bạn nên bắt đầu với SQL trước, nhưng nếu bạn có kinh nghiệm với Excel, tôi không nghĩ bạn sẽ gặp nhiều khó khăn trong việc hiểu bài giảng :)
Excel, Pandas và SQL đều là những công cụ tương tự nhau ở chỗ chúng xử lý dữ liệu dạng bảng với các hàng và cột . Các tính năng được hỗ trợ của chúng cũng rất giống nhau. Tài liệu chính thức, cũng được bao gồm trong bài giảng, không yêu cầu kiến thức trước về bất kỳ ngôn ngữ nào khác ngoài Python. Mặc dù một số khái niệm phổ biến của SQL khi làm việc với các bảng dữ liệu, chẳng hạn như nối hai bảng bằng các khóa chung và các phép toán nhóm theo, đã bị bỏ qua trong video, nhưng tài liệu bổ sung được cung cấp ở cuối video. Nếu bạn đã xem bài giảng mẫu và nghĩ rằng "Điều này đáng để thử", thì vậy là đủ.
Cải thiện kỹ năng của bạn bằng cách cùng nhau giải quyết vấn đề.
Trăm nghe không bằng một thấy! Học chỉ hiệu quả khi được thực hành. Hãy dành thời gian để thực sự hiểu và nắm vững ngữ pháp đã học, đồng thời hiểu rõ các tình huống và nhiệm vụ cụ thể mà ngữ pháp đó có thể áp dụng.
Cuối mỗi phần, chúng tôi sẽ cung cấp danh sách các bài toán giúp bạn thực hành các hàm đã học trong phần đó. Chúng tôi khuyến khích bạn tạm dừng bài giảng và ôn tập bằng cách giải các bài toán. Chúng tôi cũng sẽ chia sẻ quy trình giải bài toán trong video cuối cùng, "Giải quyết vấn đề", của mỗi phần. Phần cuối cùng bao gồm các bài toán tổng hợp tất cả những gì bạn đã học, vậy nên hãy tiếp tục nhé!
Học sinh được đề xuất
Gấu trúc Có hệ thống Bất cứ ai muốn hiểu
Với việc giải quyết vấn đề Gấu trúc Những người muốn học
Khi sử dụng SQL Khu vực phân tích với Python Những người muốn mở rộng
Các bảng tính như Excel Tôi đã thử nó Bất kỳ ai muốn học Pandas
Chương trình giảng dạy Hãy kiểm tra thử nhé.
Gấu trúc khởi động nào!
Chúng ta sẽ tìm hiểu về Google Colaboratory (Colab), nền tảng chúng ta sẽ sử dụng trong khóa học này, và sau đó tìm hiểu tài liệu chính thức của Pandas. Chúng ta sẽ khám phá các bước liên quan đến việc tải và lưu dữ liệu với Pandas, cũng như tìm hiểu cách chọn các cột và hàng cụ thể.
Khám phá dữ liệu từ A đến Z.
Chúng ta sẽ sử dụng Pandas để tạo các hình ảnh trực quan đơn giản nhằm hiểu xu hướng và luồng dữ liệu. Bạn cũng sẽ học cách tạo cột mới bằng cách tính toán giá trị từ các cột hiện có, thực hiện các phép tính cần thiết, cũng như tổng hợp và chia tỷ lệ dữ liệu.
Dữ liệu được sắp xếp thành bảng!
Tìm hiểu cách chuyển đổi và sắp xếp bảng, liên kết với Google Trang tính và tạo bảng tổng hợp dữ liệu. Bạn cũng sẽ học cách liên kết các hàng từ nhiều bảng và kết hợp chúng bằng các cột chung.
Nhiều loại dữ liệu khác nhau cũng được.
Chúng ta sẽ học cách xử lý dữ liệu chuỗi thời gian và dữ liệu văn bản, thậm chí cách sử dụng biểu thức chính quy để tìm ra các mẫu cụ thể.
Nhóm Datarian Bạn có quan tâm đến các bài giảng khác không?
Thầy thực sự là tuyệt vời nhất! Cảm ơn bạn rất nhiều... Tôi thực sự thích các tài liệu tham khảo được chiếu giữa các buổi học, đến mức tôi tự hỏi liệu có thứ gì như thế này không... Tôi chỉ muốn cảm ơn bạn. Tôi nghĩ sẽ rất tốt nếu bạn. ra thêm bài giảng Python...!!!!
Sang-yeol, người đã để lại bài đánh giá lớp học này, thực sự là người giỏi nhất. Cảm ơn bạn rất nhiều... Tôi thực sự tự hào vì những tài liệu tham khảo mà bạn cung cấp rất hữu ích. Tôi đang nỗ lực tạo một khóa học trực quan hóa Python. Hẹn gặp lại các bạn vào nửa đầu năm nay! Chúng tôi cũng đã biên soạn các tài liệu được đề xuất thường xuyên cho những người nghiên cứu phân tích dữ liệu để có thể xem trên KakaoTalk. Bạn có thể xem ngay cả khi không theo dõi, vì vậy tôi hy vọng bạn tìm thấy thông tin hữu ích, cảm ơn bạn ~ :D http://pf.kakao.com/_DQxfsb (Liên kết mở trên thiết bị di động và bạn có thể vào tab bảng !)
Xin chào! ID này trông hơi quen haha. Bạn có thích bài giảng này không? Các bài giảng về SQL và Python mang lại cảm giác hơi khác một chút, vì vậy tôi tò mò bạn thích chúng như thế nào. Cảm ơn bạn đã đánh giá của bạn!