Pandas để phân tích dữ liệu: Từ cơ bản đến phân tích dữ liệu
Bài giảng cơ bản về Pandas của Datarian, người có hơn 10.000 sinh viên tích lũy và có kinh nghiệm giảng dạy trực tuyến và ngoại tuyến sâu rộng. Tìm hiểu một cách có hệ thống về Pandas, thư viện phân tích dữ liệu đại diện của Python, với tài liệu chính thức. Bạn cũng có thể nâng cao trình độ của mình bằng cách kết hợp học lý thuyết và giải quyết vấn đề.
Tăng trình độ Pandas của bạn thông qua việc giải quyết vấn đề
Pandas để phân tích dữ liệu, Hãy tìm hiểu kỹ hơn thông qua tài liệu chính thức!
Gấu trúc, tại sao tôi phải học nó?
Sử dụng thư viện Python, Pandas Bạn có thể phân tích dữ liệu một cách dễ dàng và thuận tiện.
Khi các nhà phân tích dữ liệu tiến hành phân tích bằng Python, điều đầu tiên họ thường làm là nhập thư viện Pandas . Cho dù đó là trực quan hóa, học máy hay áp dụng các mô hình thống kê, việc tiền xử lý dữ liệu để tạo ra một định dạng phù hợp là điều cần thiết. Pandas là thư viện (gói) chuyên biệt nhất cho quy trình xử lý dữ liệu này, và do đó được sử dụng rộng rãi nhất.
Bắt đầu với Pandas, khóa học phân tích dữ liệu Python thiết yếu, cùng Datarian!
✔️Lộ trình khóa học
Điều gì làm cho khóa học này đặc biệt?
Sử dụng tài liệu chính thức của Pandas.
Tất cả chúng ta đều đồng ý rằng "Google là điều cần thiết" khi lập trình. Mặc dù web cung cấp rất nhiều tài liệu tham khảo, nhưng tài liệu chính thức chắc chắn là tốt nhất. Nó cung cấp thuật ngữ và hướng dẫn sử dụng chính xác. Ngay cả những người đã thành thạo Pandas cũng thường ngạc nhiên trước tài liệu chính thức và thốt lên: "Ồ, có một tính năng tuyệt vời!"
Dành cho những bạn mới bắt đầu với Pandas, tại sao không bắt đầu với tài liệu chính thức, cuốn sách giáo khoa tốt nhất từ trước đến nay? Khóa học của chúng tôi sẽ đóng vai trò như một hướng dẫn giúp bạn trên hành trình này. Bạn sẽ học bằng cách đọc tài liệu chính thức, làm theo mã ví dụ và thêm các giải thích bổ sung.
So sánh với SQL và Excel giúp bạn hiểu nhanh hơn.
Dữ liệu mà Pandas xử lý là một "khung dữ liệu hai chiều". Mặc dù thuật ngữ "khung dữ liệu hai chiều" nghe có vẻ xa lạ, nhưng thực ra đây là một khái niệm bạn đã quen thuộc. Hãy hình dung nó như dữ liệu dạng bảng, giống như dữ liệu thường thấy trong các bảng tính như Excel. Nếu bạn đã quen thuộc với bảng SQL, bạn sẽ hiểu rõ hơn về nó.
Vì Pandas là một công cụ xử lý các kiểu dữ liệu tương tự, nên nó thường cung cấp các tính năng tương tự, hoặc thậm chí mạnh mẽ hơn, SQL và Excel. Đó là lý do tại sao khi học một hàm mới, tôi đã đưa vào các phép so sánh với SQL hoặc Excel. Học bằng cách so sánh với những gì bạn đã biết sẽ giúp bạn hiểu dễ dàng và nhanh chóng hơn, đúng không?
Khóa học này hữu ích cho những người mới bắt đầu sử dụng Python để phân tích và trực quan hóa sâu hơn những gì có thể thực hiện được bằng SQL, hoặc cho những người cần Pandas để xử lý lượng dữ liệu lớn không thể nhập vào Excel, hoặc cho những người đang sử dụng các công cụ khác.
H. SQL, đây có phải là điều tôi thực sự cần biết không?
Tôi khuyên bạn nên bắt đầu với SQL trước, nhưng nếu bạn có kinh nghiệm với Excel, tôi không nghĩ bạn sẽ gặp nhiều khó khăn trong việc hiểu bài giảng :)
Excel, Pandas và SQL đều là những công cụ tương tự nhau ở chỗ chúng xử lý dữ liệu dạng bảng với các hàng và cột . Các tính năng được hỗ trợ của chúng cũng rất giống nhau. Tài liệu chính thức, cũng được bao gồm trong bài giảng, không yêu cầu kiến thức trước về bất kỳ ngôn ngữ nào khác ngoài Python. Mặc dù một số khái niệm phổ biến của SQL khi làm việc với các bảng dữ liệu, chẳng hạn như nối hai bảng bằng các khóa chung và các phép toán nhóm theo, đã bị bỏ qua trong video, nhưng tài liệu bổ sung được cung cấp ở cuối video. Nếu bạn đã xem bài giảng mẫu và nghĩ rằng "Điều này đáng để thử", thì vậy là đủ.
Cải thiện kỹ năng của bạn bằng cách cùng nhau giải quyết vấn đề.
Trăm nghe không bằng một thấy! Học chỉ hiệu quả khi được thực hành. Hãy dành thời gian để thực sự hiểu và nắm vững ngữ pháp đã học, đồng thời hiểu rõ các tình huống và nhiệm vụ cụ thể mà ngữ pháp đó có thể áp dụng.
Cuối mỗi phần, chúng tôi sẽ cung cấp danh sách các bài toán giúp bạn thực hành các hàm đã học trong phần đó. Chúng tôi khuyến khích bạn tạm dừng bài giảng và ôn tập bằng cách giải các bài toán. Chúng tôi cũng sẽ chia sẻ quy trình giải bài toán trong video cuối cùng, "Giải quyết vấn đề", của mỗi phần. Phần cuối cùng bao gồm các bài toán tổng hợp tất cả những gì bạn đã học, vậy nên hãy tiếp tục nhé!
Học sinh được đề xuất
Gấu trúc Có hệ thống Bất cứ ai muốn hiểu
Với việc giải quyết vấn đề Gấu trúc Những người muốn học
Khi sử dụng SQL Khu vực phân tích với Python Những người muốn mở rộng
Các bảng tính như Excel Tôi đã thử nó Bất kỳ ai muốn học Pandas
Chương trình giảng dạy Hãy kiểm tra thử nhé.
Gấu trúc khởi động nào!
Chúng ta sẽ tìm hiểu về Google Colaboratory (Colab), nền tảng chúng ta sẽ sử dụng trong khóa học này, và sau đó tìm hiểu tài liệu chính thức của Pandas. Chúng ta sẽ khám phá các bước liên quan đến việc tải và lưu dữ liệu với Pandas, cũng như tìm hiểu cách chọn các cột và hàng cụ thể.
Khám phá dữ liệu từ A đến Z.
Chúng ta sẽ sử dụng Pandas để tạo các hình ảnh trực quan đơn giản nhằm hiểu xu hướng và luồng dữ liệu. Bạn cũng sẽ học cách tạo cột mới bằng cách tính toán giá trị từ các cột hiện có, thực hiện các phép tính cần thiết, cũng như tổng hợp và chia tỷ lệ dữ liệu.
Dữ liệu được sắp xếp thành bảng!
Tìm hiểu cách chuyển đổi và sắp xếp bảng, liên kết với Google Trang tính và tạo bảng tổng hợp dữ liệu. Bạn cũng sẽ học cách liên kết các hàng từ nhiều bảng và kết hợp chúng bằng các cột chung.
Nhiều loại dữ liệu khác nhau cũng được.
Chúng ta sẽ học cách xử lý dữ liệu chuỗi thời gian và dữ liệu văn bản, thậm chí cách sử dụng biểu thức chính quy để tìm ra các mẫu cụ thể.
Nhóm Datarian Bạn có quan tâm đến các bài giảng khác không?
Teacher, you are really the best! Thank you so much... The reference materials you show us during class are so good that I didn't know there was something like this... I'm just gratefulㅠ I think it would be good if you release more Python lectures...!!!!
Sangyeol, who left this course review, is the best. Thank you so much... I'm so happy that you found the reference materials useful. I'm working hard on creating a Python visualization lecture. I'll visit you within the first half of this year! And I've collected the materials that I often recommend to those studying data analysis so that you can see them on KakaoTalk. You can see them even if you don't follow me, so I hope you find the materials useful to Sangyeol. Thank you~ :D http://pf.kakao.com/_DQxfsb (Open the link on your mobile phone and go to the board tab!)
Hello! This ID seems familiar to me. Did you enjoy the lecture? The SQL lecture and Python lecture have slightly different feelings, so I wonder how you listened to them. Thank you for your review!