강의

멘토링

로드맵

BEST
Data Science

/

Data Analysis

단 두 trang tài liệu để phân tích và trực quan hóa dữ liệu

Pandas được sử dụng để phân tích dữ liệu, xử lý trước dữ liệu, máy học và học sâu, vì vậy bạn sẽ thường sử dụng các chức năng chính. Có một Pandas Cheat Sheet tập hợp và sắp xếp những nội dung cốt lõi này. Nếu bạn đã mệt mỏi khi học Pandas từ một cuốn sách dày, thì chỉ với hai trang tài liệu, chúng tôi sẽ giới thiệu Python Pandas cho bạn. Hãy làm quen với các chức năng cốt lõi của Pandas bằng cách sử dụng cheat sheet được cung cấp trong hướng dẫn chính thức của Pandas.

(4.8) 170 đánh giá

2,557 học viên

  • todaycode
Python
Pandas

Đánh giá từ những học viên đầu tiên

Dịch cái này sang tiếng Việt

  • Các tính năng chính được đề cập trong Pandas Cheat Sheet

  • Phân tích dữ liệu Python

  • Tiền xử lý dữ liệu cho máy học và học sâu

  • thực hiện trực quan hóa dữ liệu

  • Pandas trích xuất, xử lý trước, phân tích và trực quan hóa trang web COVID-19 của thành phố Seoul

Phân tích dữ liệu Python Pandas, tất cả những điều cần thiết cùng một lúc!

Chỉ trong hai tài liệu
Phân tích dữ liệu Pandas
Bạn có thể giải được không?

Có một thư viện có tên là Pandas cho phép bạn sử dụng các hàm giống như Excel trong Python.

Excel không thể xử lý được
Xử lý dữ liệu quy mô lớn cũng được.

Pandas dùng để phân tích và xử lý dữ liệu.
Đây là thư viện phân tích dữ liệu Python.

Khi phân tích dữ liệu, xử lý trước hoặc trực quan hóa bằng Python Pandas, bạn sẽ chủ yếu sử dụng các hàm mà bạn thường dùng nhất. Và đây là Bảng hướng dẫn tóm tắt những tính năng cốt lõi này chỉ trong hai trang.

Tuy nhiên, nếu bạn cố gắng tự tìm tài liệu chỉ chứa nội dung cốt lõi, bạn có thể cảm thấy bối rối không biết phải thực hành nội dung nào. Trong bài giảng này, chúng tôi sẽ chỉ trích xuất nội dung cốt lõi của tài liệu hướng dẫn và giải thích cách sử dụng Matplotlib phức tạp với Pandas một cách dễ dàng. Bạn có muốn thử cùng không?


Ai sẽ được hưởng lợi khi học điều này?

phân tích dữ liệu,
Yêu cầu đối với ML/DL
Tôi muốn thực hiện tiền xử lý
Những người làm điều đó

Khối lượng dữ liệu lớn
Mở nó bằng Excel
Tệp tin không mở được
Những người đã bối rối

Sử dụng Excel
thực hiện phân tích dữ liệu
Trong các công thức phức tạp
Người mệt mỏi

Khác nhau trong Excel
Tôi đã thực hiện công thức nhưng
Nó chậm quá
Những người phải làm thêm giờ

📣 Kiểm tra kiến ​​thức chơi game của bạn!

  • Cần có kiến ​​thức tiên quyết về Python và Jupyter Notebooks, Anaconda và các khái niệm về hàng/cột trong Excel .

Tập trung vào các tài liệu chính thức
Dễ dàng, nhanh chóng và chính xác.

Một, trong sổ ghi chép Jupyter
Sử dụng docstring

Bạn không cần phải ghi nhớ nhiều phương pháp. Bởi vì các chức năng được sử dụng là cố định. Trong bài giảng này, chúng tôi sẽ chỉ cho bạn cách thực hành bằng cách duyệt tài liệu chính thức trong Jupyter Notebooks để bạn có thể tự học bằng cách xem phần trợ giúp và tài liệu.

2. Hình ảnh hóa dữ liệu Pandas
Làm thế nào để làm được điều đó hai lần nữa!

Bạn có biết biểu đồ nào phù hợp với dữ liệu nào không? Trong bài giảng này, chúng ta cũng sẽ xem xét sự khác biệt và cách sử dụng biểu đồ thanh, bảng phân phối tần suất, biểu đồ histogram và phân phối chuẩn. Ngoài ra, tài liệu chính thức của Pandas còn giải thích nhiều phương pháp trực quan hóa Python và cách sử dụng các tùy chọn.

Phần thưởng, hãy trực quan hóa dữ liệu Series và DataFrame!

Ví dụ trực quan hóa Python Pandas

Ví dụ trực quan hóa Python Pandas
Ví dụ trực quan hóa Python Pandas
Ví dụ trực quan hóa Python Pandas

Cập nhật thêm!
Hoàn hảo cho mục đích sử dụng thực tế
Dự án phân tích dữ liệu.

Chúng tôi sẽ phân tích trang web về tình hình bùng phát dịch COVID-19 tại thành phố Seoul bằng Pandas, từ thu thập dữ liệu đến xử lý trước, phân tích và trực quan hóa. Bạn có thể phân tích những gì đã học được chỉ trong hai tài liệu thành một dự án tương tự như công việc thực tế của bạn . (Mục 13)

Đầu tiên, chúng ta trực tiếp phân tích dữ liệu mà chúng ta thường gặp trong cuộc sống hàng ngày thông qua tin tức.

  • Quận nào có nhiều ca bệnh được xác nhận nhất?
  • Bệnh viện nào điều trị nhiều ca bệnh được xác nhận nhất?
  • Có bệnh viện nào mà mọi người thường xuyên được chuyển đến theo quận không?
  • Quận nào có nhiều ca bệnh được xác nhận từ nước ngoài nhất?
  • Làm thế nào tôi có thể xử lý trước văn bản từ nhiều quốc gia, chẳng hạn như Châu Âu, Nam Mỹ, v.v.?
  • Sẽ có sự khác biệt bao nhiêu về số ca được xác nhận đến từ nước ngoài theo từng tháng?

Thứ hai, hiểu và thực hành các phương pháp xử lý dữ liệu trước bằng Pandas.

  • Làm thế nào để lấy được năm, tháng, ngày, ngày trong tuần và số tuần từ một ngày trong văn bản?
  • Làm thế nào chúng ta có thể tính toán số ca bệnh được xác nhận tích lũy bằng cách sử dụng dữ liệu trạng thái ca bệnh được xác nhận?
  • Sự khác biệt giữa groupby, crosstab, pivot và pivot_table là gì và hàm nào phù hợp để sử dụng?

3. Hiểu cấu trúc dữ liệu của khung dữ liệu và chuỗi dữ liệu và xử lý chúng thành dạng phù hợp để phân tích.

  • Tôi nên tạo khung dữ liệu để vẽ đồ thị bằng Pandas như thế nào?
  • Tôi có thể thay đổi khung dữ liệu của mình như thế nào nếu tôi muốn hiển thị các giá trị theo nhiều màu khác nhau dựa trên các giá trị phân loại của chúng trong biểu đồ?
  • Có cách nào để chuyển đổi một chuỗi thành một khung dữ liệu không?

Ví dụ về phân tích và hình ảnh hóa Python,
Hãy tự mình kiểm tra trong lớp nhé!


Đã tạo khóa học này
Bạn có tò mò về người chia sẻ kiến ​​thức không? 👩‍💻

Người chia sẻ kiến ​​thức Park Jo-eun X Phỏng vấn Inflearn

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • Bất kỳ ai muốn thực hiện xử lý trước cần thiết cho phân tích dữ liệu, học máy và học sâu bằng Python

  • Bất kỳ ai cũng từng bối rối khi mở một lượng lớn dữ liệu trong Excel và tệp không tải được

  • Bạn có thấy chán những công thức phức tạp trong Excel không?

  • Những người đã triển khai nhiều công thức khác nhau trong Excel nhưng phải làm thêm giờ vì tốc độ chậm

Cần biết trước khi bắt đầu?

  • Trăn

  • Máy tính xách tay Jupiter

  • rắn anaconda

  • Khái niệm hàng và cột trong Excel

Xin chào
Đây là

18,878

Học viên

791

Đánh giá

1,334

Trả lời

4.9

Xếp hạng

6

Các khóa học

  • Microsoft MVP(Python Developer Technologies)

  • 오늘코드 YouTube 📺 https://youtube.com/todaycode

  • “모두가 데이터에 친숙해지는 날이 오길”– 마이크로소프트웨어 (링크)

  • 네이버 커넥트 재단 부스트코스 데이터사이언스 강의 설계 및 교수자

  • 서울대 빅데이터혁신공유대학, 서울대 평생교육원, 연세대 DX Academy, 한신대 ABC Camp, 한양대 대학원, 전남대,

    한국능률협회, 삼성SDS 멀티캠퍼스, 멋쟁이사자처럼, 패스트캠퍼스, 모두의연구소 등 다수의 교육기관 및 기업 강의

  • 다양한 도메인(제약, 통신, 자동차, 커머스, 교육, 정부기관 등)의 기업 데이터 분석

  • 20년이상 게임, 광고, 교육 등 다양한 도메인에서 웹 백엔드 개발자 및 데이터 분석가 현업 경험

Chương trình giảng dạy

Tất cả

63 bài giảng ∙ (11giờ 10phút)

Tài liệu khóa học:

Tài liệu bài giảng
Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Tất cả

170 đánh giá

4.8

170 đánh giá

  • eypark1465님의 프로필 이미지
    eypark1465

    Đánh giá 1

    Đánh giá trung bình 5.0

    5

    89% đã tham gia

    Tôi muốn biến phương pháp phân tích của người hướng dẫn thành của riêng tôi. Cảm ơn

    • wonseok

      Bạn có tham lam không?

  • wonseok님의 프로필 이미지
    wonseok

    Đánh giá 15

    Đánh giá trung bình 4.7

    5

    89% đã tham gia

    Là người mới bắt đầu, tôi nghĩ đây là một khóa học tuyệt vời để bạn làm quen với các khái niệm tổng thể về Pandas và tìm hiểu chi tiết cách sử dụng nó trong phân tích thực tế. Tôi đã tham gia một số bài giảng liên quan đến Pandas, nhưng tôi nghĩ đây là bài duy nhất giải thích rõ ràng từng chi tiết. Sau khi xem xét lại, tôi dự định áp dụng nó vào dữ liệu công việc thực tế và phân tích nó. Cảm ơn bạn rất nhiều vì đã tạo ra một khóa học tuyệt vời!!

    • easonjung1977님의 프로필 이미지
      easonjung1977

      Đánh giá 1

      Đánh giá trung bình 4.0

      4

      100% đã tham gia

      Nhìn chung, đó là một khóa học tốt. Tôi đã tự mình nghiên cứu Pandas và đăng ký tham gia khóa học này với mục đích học và ứng dụng Pandas nhiều lần. Khóa học Pandas Cheat Sheet thực sự không tốt lắm. Nếu bạn là người mới làm quen với Pandas, mới làm quen với Python hoặc rất cơ bản thì điều này sẽ không giúp ích nhiều. Đối với một video trên YouTube thì không sao, nhưng đối với một bài giảng trả phí thì hơi thất vọng. Bài giảng Phân tích Corona của Thành phố Seoul rất hay. Đó là một phần rất hữu ích đối với tôi, người đã nghiên cứu những điều cơ bản về Pandas, vì tôi có thể thực hành áp dụng Pandas để xử lý dữ liệu nhằm đạt được hình thức và kết quả mong muốn. Và những lời khuyên trong quá trình thực hiện rất hữu ích. Tab Shift hay sau hàm? Bạn có thể thấy chuỗi dấu chấm bằng cách sử dụng... Có lẽ đây là một mẹo hay... Tóm tắt một dòng: Không được khuyến khích cho những người mới làm quen với Pandas, nhưng rất khuyến khích cho những người có một số kiến ​​thức về Pandas.

      • flyhigh님의 프로필 이미지
        flyhigh

        Đánh giá 1

        Đánh giá trung bình 5.0

        5

        37% đã tham gia

        Đó là một giáo trình hay. Ngay cả một người mới bắt đầu như tôi cũng có thể nhìn thấy nguyên tắc hoạt động và kết quả, và hơn hết, tôi rất thích phần hỏi đáp. Nếu tôi không biết điều gì, anh ấy trả lời ngay câu hỏi như thể tôi đang hỏi giáo viên, và bước sóng giọng nói của giáo viên tốt đến mức tôi có thể tập trung tốt.

        • ptr81903298님의 프로필 이미지
          ptr81903298

          Đánh giá 1

          Đánh giá trung bình 5.0

          5

          100% đã tham gia

          Sau khi tốt nghiệp Khoa Thống kê, tôi làm chuyên viên phân tích dữ liệu, sau đó nghỉ việc ở công ty và hiện đang học phân tích dữ liệu bằng Python qua bài giảng của Jo-eun Park. Tôi có thể theo dõi bài giảng một cách thích thú vì nó cung cấp thông tin dễ hiểu bằng cách sử dụng dữ liệu kịp thời thay vì dữ liệu ví dụ rõ ràng. Tôi cũng thích xem YouTube. Cảm ơn!

          Ưu đãi có thời hạn, kết thúc sau 3 ngày ngày

          716.441 ₫

          25%

          955.255 ₫

          Khóa học khác của todaycode

          Hãy khám phá các khóa học khác của giảng viên!

          Khóa học tương tự

          Khám phá các khóa học khác trong cùng lĩnh vực!