강의

멘토링

로드맵

Inflearn brand logo image
BEST
Data Science

/

Data Analysis

단 두 trang tài liệu để phân tích và trực quan hóa dữ liệu

Pandas được sử dụng để phân tích dữ liệu, xử lý trước dữ liệu, máy học và học sâu, vì vậy bạn sẽ thường sử dụng các chức năng chính. Có một Pandas Cheat Sheet tập hợp và sắp xếp những nội dung cốt lõi này. Nếu bạn đã mệt mỏi khi học Pandas từ một cuốn sách dày, thì chỉ với hai trang tài liệu, chúng tôi sẽ giới thiệu Python Pandas cho bạn. Hãy làm quen với các chức năng cốt lõi của Pandas bằng cách sử dụng cheat sheet được cung cấp trong hướng dẫn chính thức của Pandas.

(4.8) 169 đánh giá

2,553 học viên

  • todaycode
Python
Pandas

Đánh giá từ những học viên đầu tiên

Dịch cái này sang tiếng Việt

  • Các tính năng chính được đề cập trong Pandas Cheat Sheet

  • Phân tích dữ liệu Python

  • Tiền xử lý dữ liệu cho máy học và học sâu

  • thực hiện trực quan hóa dữ liệu

  • Pandas trích xuất, xử lý trước, phân tích và trực quan hóa trang web COVID-19 của thành phố Seoul

Phân tích dữ liệu Python Pandas, tất cả những điều cần thiết cùng một lúc!

Chỉ trong hai tài liệu
Phân tích dữ liệu Pandas
Bạn có thể giải được không?

Có một thư viện có tên là Pandas cho phép bạn sử dụng các hàm giống như Excel trong Python.

Excel không thể xử lý được
Xử lý dữ liệu quy mô lớn cũng được.

Pandas dùng để phân tích và xử lý dữ liệu.
Đây là thư viện phân tích dữ liệu Python.

Khi phân tích dữ liệu, xử lý trước hoặc trực quan hóa bằng Python Pandas, bạn sẽ chủ yếu sử dụng các hàm mà bạn thường dùng nhất. Và đây là Bảng hướng dẫn tóm tắt những tính năng cốt lõi này chỉ trong hai trang.

Tuy nhiên, nếu bạn cố gắng tự tìm tài liệu chỉ chứa nội dung cốt lõi, bạn có thể cảm thấy bối rối không biết phải thực hành nội dung nào. Trong bài giảng này, chúng tôi sẽ chỉ trích xuất nội dung cốt lõi của tài liệu hướng dẫn và giải thích cách sử dụng Matplotlib phức tạp với Pandas một cách dễ dàng. Bạn có muốn thử cùng không?


Ai sẽ được hưởng lợi khi học điều này?

phân tích dữ liệu,
Yêu cầu đối với ML/DL
Tôi muốn thực hiện tiền xử lý
Những người làm điều đó

Khối lượng dữ liệu lớn
Mở nó bằng Excel
Tệp tin không mở được
Những người đã bối rối

Sử dụng Excel
thực hiện phân tích dữ liệu
Trong các công thức phức tạp
Người mệt mỏi

Khác nhau trong Excel
Tôi đã thực hiện công thức nhưng
Nó chậm quá
Những người phải làm thêm giờ

📣 Kiểm tra kiến ​​thức chơi game của bạn!

  • Cần có kiến ​​thức tiên quyết về Python và Jupyter Notebooks, Anaconda và các khái niệm về hàng/cột trong Excel .

Tập trung vào các tài liệu chính thức
Dễ dàng, nhanh chóng và chính xác.

Một, trong sổ ghi chép Jupyter
Sử dụng docstring

Bạn không cần phải ghi nhớ nhiều phương pháp. Bởi vì các chức năng được sử dụng là cố định. Trong bài giảng này, chúng tôi sẽ chỉ cho bạn cách thực hành bằng cách duyệt tài liệu chính thức trong Jupyter Notebooks để bạn có thể tự học bằng cách xem phần trợ giúp và tài liệu.

2. Hình ảnh hóa dữ liệu Pandas
Làm thế nào để làm được điều đó hai lần nữa!

Bạn có biết biểu đồ nào phù hợp với dữ liệu nào không? Trong bài giảng này, chúng ta cũng sẽ xem xét sự khác biệt và cách sử dụng biểu đồ thanh, bảng phân phối tần suất, biểu đồ histogram và phân phối chuẩn. Ngoài ra, tài liệu chính thức của Pandas còn giải thích nhiều phương pháp trực quan hóa Python và cách sử dụng các tùy chọn.

Phần thưởng, hãy trực quan hóa dữ liệu Series và DataFrame!

Ví dụ trực quan hóa Python Pandas

Ví dụ trực quan hóa Python Pandas
Ví dụ trực quan hóa Python Pandas
Ví dụ trực quan hóa Python Pandas

Cập nhật thêm!
Hoàn hảo cho mục đích sử dụng thực tế
Dự án phân tích dữ liệu.

Chúng tôi sẽ phân tích trang web về tình hình bùng phát dịch COVID-19 tại thành phố Seoul bằng Pandas, từ thu thập dữ liệu đến xử lý trước, phân tích và trực quan hóa. Bạn có thể phân tích những gì đã học được chỉ trong hai tài liệu thành một dự án tương tự như công việc thực tế của bạn . (Mục 13)

Đầu tiên, chúng ta trực tiếp phân tích dữ liệu mà chúng ta thường gặp trong cuộc sống hàng ngày thông qua tin tức.

  • Quận nào có nhiều ca bệnh được xác nhận nhất?
  • Bệnh viện nào điều trị nhiều ca bệnh được xác nhận nhất?
  • Có bệnh viện nào mà mọi người thường xuyên được chuyển đến theo quận không?
  • Quận nào có nhiều ca bệnh được xác nhận từ nước ngoài nhất?
  • Làm thế nào tôi có thể xử lý trước văn bản từ nhiều quốc gia, chẳng hạn như Châu Âu, Nam Mỹ, v.v.?
  • Sẽ có sự khác biệt bao nhiêu về số ca được xác nhận đến từ nước ngoài theo từng tháng?

Thứ hai, hiểu và thực hành các phương pháp xử lý dữ liệu trước bằng Pandas.

  • Làm thế nào để lấy được năm, tháng, ngày, ngày trong tuần và số tuần từ một ngày trong văn bản?
  • Làm thế nào chúng ta có thể tính toán số ca bệnh được xác nhận tích lũy bằng cách sử dụng dữ liệu trạng thái ca bệnh được xác nhận?
  • Sự khác biệt giữa groupby, crosstab, pivot và pivot_table là gì và hàm nào phù hợp để sử dụng?

3. Hiểu cấu trúc dữ liệu của khung dữ liệu và chuỗi dữ liệu và xử lý chúng thành dạng phù hợp để phân tích.

  • Tôi nên tạo khung dữ liệu để vẽ đồ thị bằng Pandas như thế nào?
  • Tôi có thể thay đổi khung dữ liệu của mình như thế nào nếu tôi muốn hiển thị các giá trị theo nhiều màu khác nhau dựa trên các giá trị phân loại của chúng trong biểu đồ?
  • Có cách nào để chuyển đổi một chuỗi thành một khung dữ liệu không?

Ví dụ về phân tích và hình ảnh hóa Python,
Hãy tự mình kiểm tra trong lớp nhé!


Đã tạo khóa học này
Bạn có tò mò về người chia sẻ kiến ​​thức không? 👩‍💻

Người chia sẻ kiến ​​thức Park Jo-eun X Phỏng vấn Inflearn

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • Bất kỳ ai muốn thực hiện xử lý trước cần thiết cho phân tích dữ liệu, học máy và học sâu bằng Python

  • Bất kỳ ai cũng từng bối rối khi mở một lượng lớn dữ liệu trong Excel và tệp không tải được

  • Bạn có thấy chán những công thức phức tạp trong Excel không?

  • Những người đã triển khai nhiều công thức khác nhau trong Excel nhưng phải làm thêm giờ vì tốc độ chậm

Cần biết trước khi bắt đầu?

  • Trăn

  • Máy tính xách tay Jupiter

  • rắn anaconda

  • Khái niệm hàng và cột trong Excel

Xin chào
Đây là

18,828

Học viên

787

Đánh giá

1,334

Trả lời

4.9

Xếp hạng

6

Các khóa học

  • Microsoft MVP(Python Developer Technologies)

  • 오늘코드 YouTube 📺 https://youtube.com/todaycode

  • “모두가 데이터에 친숙해지는 날이 오길”– 마이크로소프트웨어 (링크)

  • 네이버 커넥트 재단 부스트코스 데이터사이언스 강의 설계 및 교수자

  • 서울대 빅데이터혁신공유대학, 서울대 평생교육원, 연세대 DX Academy, 한신대 ABC Camp, 한양대 대학원, 전남대,

    한국능률협회, 삼성SDS 멀티캠퍼스, 멋쟁이사자처럼, 패스트캠퍼스, 모두의연구소 등 다수의 교육기관 및 기업 강의

  • 다양한 도메인(제약, 통신, 자동차, 커머스, 교육, 정부기관 등)의 기업 데이터 분석

  • 20년이상 게임, 광고, 교육 등 다양한 도메인에서 웹 백엔드 개발자 및 데이터 분석가 현업 경험

Chương trình giảng dạy

Tất cả

63 bài giảng ∙ (11giờ 10phút)

Tài liệu khóa học:

Tài liệu bài giảng
Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Tất cả

169 đánh giá

4.8

169 đánh giá

  • eypark1465님의 프로필 이미지
    eypark1465

    Đánh giá 1

    Đánh giá trung bình 5.0

    5

    89% đã tham gia

    I want to make your analysis method mine. Thank you.

    • wonseok

      Are you greedy?

  • wonseok님의 프로필 이미지
    wonseok

    Đánh giá 15

    Đánh giá trung bình 4.7

    5

    89% đã tham gia

    As a beginner, I think this is a great lecture that will help you learn the overall concept of Pandas and learn thoroughly how to use it for actual analysis. I have taken several lectures on Pandas, but I think this is the only lecture that explains the details one by one with such quality. I will review it again and apply it to actual business data and analyze it. Thank you so much for making such a great lecture!!

    • easonjung1977님의 프로필 이미지
      easonjung1977

      Đánh giá 1

      Đánh giá trung bình 4.0

      4

      100% đã tham gia

      Overall, it was a good course. I studied Pandas on my own with a book and applied for this course for the purpose of repeated learning and application of Pandas. The Pandas cheat sheet course was actually not that great. It won't be of much help to those who are new to Pandas, new to Python, or very beginners. It's okay as a YouTube video, but it's a bit disappointing as a paid lecture. The Seoul City Corona Analysis course was good. It was a very useful part for me who studied the basics of Pandas because I was able to practice how to process data by applying Pandas to obtain the desired form and results. And the tips given here and there were also very helpful. Like shift-tab, or using ? after a function to see the dot string... I think these are great tips... Summary in one line: I don't recommend it to those who are just starting out with Pandas, but I highly recommend it to those who know a little about Pandas.

      • flyhigh님의 프로필 이미지
        flyhigh

        Đánh giá 1

        Đánh giá trung bình 5.0

        5

        37% đã tham gia

        It's a good curriculum. Even a beginner like me could see the operating principles and results at the same time. What I like the most is the Q&A part. If there's something you don't know, you can ask the teacher questions and get answers right away. And the teacher's voice has such a good wavelength that it's easy to concentrate.

        • ptr81903298님의 프로필 이미지
          ptr81903298

          Đánh giá 1

          Đánh giá trung bình 5.0

          5

          100% đã tham gia

          After graduating from the Department of Statistics and working as a data analyst, I quit my job and am studying data analysis using Python through Park Jo-eun's lecture. It was interesting to follow the lecture because it was easy to understand using timely data rather than obvious example data. I also watch YouTube a lot. Thank you!

          956.615 ₫

          Khóa học khác của todaycode

          Hãy khám phá các khóa học khác của giảng viên!

          Khóa học tương tự

          Khám phá các khóa học khác trong cùng lĩnh vực!