강의

멘토링

커뮤니티

BEST
Data Science

/

Data Analysis

단 두 trang tài liệu để phân tích và trực quan hóa dữ liệu

Pandas được sử dụng để phân tích dữ liệu, xử lý trước dữ liệu, máy học và học sâu, vì vậy bạn sẽ thường sử dụng các chức năng chính. Có một Pandas Cheat Sheet tập hợp và sắp xếp những nội dung cốt lõi này. Nếu bạn đã mệt mỏi khi học Pandas từ một cuốn sách dày, thì chỉ với hai trang tài liệu, chúng tôi sẽ giới thiệu Python Pandas cho bạn. Hãy làm quen với các chức năng cốt lõi của Pandas bằng cách sử dụng cheat sheet được cung cấp trong hướng dẫn chính thức của Pandas.

(4.8) 170 đánh giá

2,558 học viên

  • todaycode
Python
Pandas

Đánh giá từ những học viên đầu tiên

Dịch cái này sang tiếng Việt

  • Các tính năng chính được đề cập trong Pandas Cheat Sheet

  • Phân tích dữ liệu Python

  • Tiền xử lý dữ liệu cho máy học và học sâu

  • thực hiện trực quan hóa dữ liệu

  • Pandas trích xuất, xử lý trước, phân tích và trực quan hóa trang web COVID-19 của thành phố Seoul

Phân tích dữ liệu Python Pandas, tất cả những điều cần thiết cùng một lúc!

Chỉ trong hai tài liệu
Phân tích dữ liệu Pandas
Bạn có thể giải được không?

Có một thư viện có tên là Pandas cho phép bạn sử dụng các hàm giống như Excel trong Python.

Excel không thể xử lý được
Xử lý dữ liệu quy mô lớn cũng được.

Pandas dùng để phân tích và xử lý dữ liệu.
Đây là thư viện phân tích dữ liệu Python.

Khi phân tích dữ liệu, xử lý trước hoặc trực quan hóa bằng Python Pandas, bạn sẽ chủ yếu sử dụng các hàm mà bạn thường dùng nhất. Và đây là Bảng hướng dẫn tóm tắt những tính năng cốt lõi này chỉ trong hai trang.

Tuy nhiên, nếu bạn cố gắng tự tìm tài liệu chỉ chứa nội dung cốt lõi, bạn có thể cảm thấy bối rối không biết phải thực hành nội dung nào. Trong bài giảng này, chúng tôi sẽ chỉ trích xuất nội dung cốt lõi của tài liệu hướng dẫn và giải thích cách sử dụng Matplotlib phức tạp với Pandas một cách dễ dàng. Bạn có muốn thử cùng không?


Ai sẽ được hưởng lợi khi học điều này?

phân tích dữ liệu,
Yêu cầu đối với ML/DL
Tôi muốn thực hiện tiền xử lý
Những người làm điều đó

Khối lượng dữ liệu lớn
Mở nó bằng Excel
Tệp tin không mở được
Những người đã bối rối

Sử dụng Excel
thực hiện phân tích dữ liệu
Trong các công thức phức tạp
Người mệt mỏi

Khác nhau trong Excel
Tôi đã thực hiện công thức nhưng
Nó chậm quá
Những người phải làm thêm giờ

📣 Kiểm tra kiến ​​thức chơi game của bạn!

  • Cần có kiến ​​thức tiên quyết về Python và Jupyter Notebooks, Anaconda và các khái niệm về hàng/cột trong Excel .

Tập trung vào các tài liệu chính thức
Dễ dàng, nhanh chóng và chính xác.

Một, trong sổ ghi chép Jupyter
Sử dụng docstring

Bạn không cần phải ghi nhớ nhiều phương pháp. Bởi vì các chức năng được sử dụng là cố định. Trong bài giảng này, chúng tôi sẽ chỉ cho bạn cách thực hành bằng cách duyệt tài liệu chính thức trong Jupyter Notebooks để bạn có thể tự học bằng cách xem phần trợ giúp và tài liệu.

2. Hình ảnh hóa dữ liệu Pandas
Làm thế nào để làm được điều đó hai lần nữa!

Bạn có biết biểu đồ nào phù hợp với dữ liệu nào không? Trong bài giảng này, chúng ta cũng sẽ xem xét sự khác biệt và cách sử dụng biểu đồ thanh, bảng phân phối tần suất, biểu đồ histogram và phân phối chuẩn. Ngoài ra, tài liệu chính thức của Pandas còn giải thích nhiều phương pháp trực quan hóa Python và cách sử dụng các tùy chọn.

Phần thưởng, hãy trực quan hóa dữ liệu Series và DataFrame!

Ví dụ trực quan hóa Python Pandas

Ví dụ trực quan hóa Python Pandas
Ví dụ trực quan hóa Python Pandas
Ví dụ trực quan hóa Python Pandas

Cập nhật thêm!
Hoàn hảo cho mục đích sử dụng thực tế
Dự án phân tích dữ liệu.

Chúng tôi sẽ phân tích trang web về tình hình bùng phát dịch COVID-19 tại thành phố Seoul bằng Pandas, từ thu thập dữ liệu đến xử lý trước, phân tích và trực quan hóa. Bạn có thể phân tích những gì đã học được chỉ trong hai tài liệu thành một dự án tương tự như công việc thực tế của bạn . (Mục 13)

Đầu tiên, chúng ta trực tiếp phân tích dữ liệu mà chúng ta thường gặp trong cuộc sống hàng ngày thông qua tin tức.

  • Quận nào có nhiều ca bệnh được xác nhận nhất?
  • Bệnh viện nào điều trị nhiều ca bệnh được xác nhận nhất?
  • Có bệnh viện nào mà mọi người thường xuyên được chuyển đến theo quận không?
  • Quận nào có nhiều ca bệnh được xác nhận từ nước ngoài nhất?
  • Làm thế nào tôi có thể xử lý trước văn bản từ nhiều quốc gia, chẳng hạn như Châu Âu, Nam Mỹ, v.v.?
  • Sẽ có sự khác biệt bao nhiêu về số ca được xác nhận đến từ nước ngoài theo từng tháng?

Thứ hai, hiểu và thực hành các phương pháp xử lý dữ liệu trước bằng Pandas.

  • Làm thế nào để lấy được năm, tháng, ngày, ngày trong tuần và số tuần từ một ngày trong văn bản?
  • Làm thế nào chúng ta có thể tính toán số ca bệnh được xác nhận tích lũy bằng cách sử dụng dữ liệu trạng thái ca bệnh được xác nhận?
  • Sự khác biệt giữa groupby, crosstab, pivot và pivot_table là gì và hàm nào phù hợp để sử dụng?

3. Hiểu cấu trúc dữ liệu của khung dữ liệu và chuỗi dữ liệu và xử lý chúng thành dạng phù hợp để phân tích.

  • Tôi nên tạo khung dữ liệu để vẽ đồ thị bằng Pandas như thế nào?
  • Tôi có thể thay đổi khung dữ liệu của mình như thế nào nếu tôi muốn hiển thị các giá trị theo nhiều màu khác nhau dựa trên các giá trị phân loại của chúng trong biểu đồ?
  • Có cách nào để chuyển đổi một chuỗi thành một khung dữ liệu không?

Ví dụ về phân tích và hình ảnh hóa Python,
Hãy tự mình kiểm tra trong lớp nhé!


Đã tạo khóa học này
Bạn có tò mò về người chia sẻ kiến ​​thức không? 👩‍💻

Người chia sẻ kiến ​​thức Park Jo-eun X Phỏng vấn Inflearn

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • Bất kỳ ai muốn thực hiện xử lý trước cần thiết cho phân tích dữ liệu, học máy và học sâu bằng Python

  • Bất kỳ ai cũng từng bối rối khi mở một lượng lớn dữ liệu trong Excel và tệp không tải được

  • Bạn có thấy chán những công thức phức tạp trong Excel không?

  • Những người đã triển khai nhiều công thức khác nhau trong Excel nhưng phải làm thêm giờ vì tốc độ chậm

Cần biết trước khi bắt đầu?

  • Trăn

  • Máy tính xách tay Jupiter

  • rắn anaconda

  • Khái niệm hàng và cột trong Excel

Xin chào
Đây là

18,918

Học viên

797

Đánh giá

1,336

Trả lời

4.8

Xếp hạng

6

Các khóa học

  • Microsoft MVP(Python Developer Technologies)

  • 오늘코드 YouTube 📺 https://youtube.com/todaycode

  • “모두가 데이터에 친숙해지는 날이 오길”– 마이크로소프트웨어 (링크)

  • 네이버 커넥트 재단 부스트코스 데이터사이언스 강의 설계 및 교수자

  • 서울대 빅데이터혁신공유대학, 서울대 평생교육원, 연세대 DX Academy, 한신대 ABC Camp, 한양대 대학원, 전남대,

    한국능률협회, 삼성SDS 멀티캠퍼스, 멋쟁이사자처럼, 패스트캠퍼스, 모두의연구소 등 다수의 교육기관 및 기업 강의

  • 다양한 도메인(제약, 통신, 자동차, 커머스, 교육, 정부기관 등)의 기업 데이터 분석

  • 20년이상 게임, 광고, 교육 등 다양한 도메인에서 웹 백엔드 개발자 및 데이터 분석가 현업 경험

Chương trình giảng dạy

Tất cả

63 bài giảng ∙ (11giờ 10phút)

Tài liệu khóa học:

Tài liệu bài giảng
Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Tất cả

170 đánh giá

4.8

170 đánh giá

  • 티보그님의 프로필 이미지
    티보그

    Đánh giá 1

    Đánh giá trung bình 5.0

    5

    89% đã tham gia

    강사님의 분석 방법을 내것으로 만들고 싶어요. 감사합니다.

    • 세바스찬 주니어 3세

      욕심쟁이 입니까?

  • 세바스찬 주니어 3세님의 프로필 이미지
    세바스찬 주니어 3세

    Đánh giá 15

    Đánh giá trung bình 4.7

    5

    89% đã tham gia

    초급자로서 판다스에 대한 개념을 전반적으로 익히고, 실제 분석에 어떻게 활용할 수 있을지 꼼꼼하게 배울 수 있는 명강의라고 생각합니다. 판다스 관련 강의들을 몇 가지 들어봤는데 세심한 부분들까지 하나하나 퀄리티있게 알려주는 강의는 이 강의 밖에는 없는 것 같아요. 다시 한 번 더 복습을 한 뒤에 실제 업무용 데이터로도 적용해서 분석해보려고 합니다. 좋은 강의 만들어주셔서 진심으로 감사드립니다!!

    • Eason Jung님의 프로필 이미지
      Eason Jung

      Đánh giá 1

      Đánh giá trung bình 4.0

      4

      100% đã tham gia

      전체적으로 좋은 강좌였습니다. 저의 경의 판다스를 혼자 책으로 공부하고 이 강좌를 판다스 반복 학습 및 응용을 목적으로 신청하여 듣게 되었습니다. 판다스 치트시트 강좌는 사실 별로였습니다. 판다스를 처음 보시거나 파이썬을 처음, 아님 아주 기초분이신분들은 별로 도움이 안되실겁니다. 유튜브영상으론 괜찮은데 돈을받고 강의로썬 좀 안타까운 부분이 있습니다. 서울시 코로나 분석 강의는 좋았습니다. 판다스를 응용하여 데이터를 어떤게 가공하여 자신이 원하는 형태, 결과를 얻을수 있는가를 연습할수 있어서, 판다스 기초를 공부한 저로썬 아주 유용한 파트가 되었습니다. 그리고 중간중간에 알려주시는 팁도 엄청 도움이 많이 되었습니다. shift-tab이라던가, 함수뒤 ? 을 사용하여 돗스트링을 볼수 있다던가... 아마 이런게 꿀팁이겠죠... 한줄 요약 : 판다스 처음 시작하시는 분들껜 비추, 판다스좀 아시는 분들께 강추합니다.

      • pooh9431님의 프로필 이미지
        pooh9431

        Đánh giá 1

        Đánh giá trung bình 5.0

        5

        37% đã tham gia

        좋은 커리큘럼입니다 저같은 입문자도 작동원리와 결과물을 함께 볼 수 있었고 무엇보다 질의응답 부분이 너무 마음에 듭니다. 모르는것이 있으면 선생님께 질문하듯 편하게 질의응답을 바로 바로 해주시고 그리고 선생님 목소리의 파장대가 너무 좋아서 집중이 잘됩니다.

        • 박태렬님의 프로필 이미지
          박태렬

          Đánh giá 1

          Đánh giá trung bình 5.0

          5

          100% đã tham gia

          통계학과를 졸업 후 데이터 분석직으로 일하다가 퇴사하고 박조은님 강의 통해서 파이썬을 이용한 데이터 분석 공부중입니다. 뻔한 예제 데이터가 아니라 시기적절한 데이터 활용해서 쉽게 알려주셔서 흥미있게 강의 따라갈 수 있었습니다. 유튜브도 잘 보고 있습니다. 감사합니다!

          954.620 ₫

          Khóa học khác của todaycode

          Hãy khám phá các khóa học khác của giảng viên!

          Khóa học tương tự

          Khám phá các khóa học khác trong cùng lĩnh vực!