강의

멘토링

커뮤니티

Data Science

/

Data Analysis

Phần giới thiệu dễ dàng nhất về phân tích dữ liệu dành cho người không chuyên ngành

Phân tích dữ liệu nghe có vẻ hoành tráng nhưng thực chất đó là quá trình tạo ra một giả thuyết và xác minh nó dựa trên dữ liệu. Bạn có thể sử dụng Python để tìm hiểu dữ liệu nào cần phân tích và cách kiểm tra giả thuyết của mình.

(4.6) 14 đánh giá

186 học viên

  • learnaday
Python
Pandas
Anaconda

Đánh giá từ những học viên đầu tiên

Dịch cái này sang tiếng Việt

  • Hiểu các khái niệm về phân tích dữ liệu

  • Master Pandas, một công cụ phân tích dữ liệu tiêu biểu

  • Làm chủ trực quan hóa phân tích dữ liệu

  • Tự thực hành phân tích dữ liệu bằng nhiều ví dụ khác nhau

Ngay cả những người không chuyên ngành cũng có thể bắt đầu phân tích dữ liệu!
Trải nghiệm quy trình 3 bước xây dựng giả thuyết, phân tích dữ liệu và kiểm tra giả thuyết.

Phân tích dữ liệu đang nổi lên như một năng lực cốt lõi trong nhiều lĩnh vực.

Bạn đã từng do dự vì không biết lập trình, thiếu tự tin về thống kê, hay đơn giản là không biết bắt đầu từ đâu? Giờ đây, hãy bắt đầu phân tích dữ liệu với chuyên gia Python Kim Jeong-wook. Anh ấy sẽ giúp bạn thực hiện phân tích dữ liệu cơ bản , ngay cả khi bạn chưa có kinh nghiệm lập trình hay kiến thức thống kê .

1. Đánh giá Python và cài đặt Anaconda

  • Chúng ta chỉ nghe nói về phân tích dữ liệu, nhưng thực chất nó có nghĩa là gì?
  • Jupyter Notebook giúp Python dễ sử dụng hơn.
  • Tóm tắt ngữ pháp Python cần thiết cho phân tích dữ liệu: kiểu dữ liệu, vòng lặp, hàm, v.v.

2. Tìm hiểu công cụ phân tích dữ liệu Pandas.

  • Pandas, cốt lõi của quá trình tiền xử lý dữ liệu
  • Các chức năng thiết yếu cung cấp thông tin về dữ liệu một cách tổng quan
  • Cấu trúc của dữ liệu so với cấu trúc của dữ liệu riêng lẻ
  • Chuyển đổi kiểu dữ liệu thành dữ liệu có thể phân tích
  • Xóa/thêm các cột chỉ có dữ liệu tôi muốn
  • Nhiều cách khác nhau để trích xuất dữ liệu
  • Tôi nên xử lý thế nào trong trường hợp dữ liệu trống (thiếu giá trị)?
  • Giống hệt như Excel. Bảng Pivot được tạo bằng Pandas.

3. Thực hành các công cụ trực quan hóa Matplotlip và Seaborn với dữ liệu về người sống sót trên tàu Titanic.

  • Phương pháp trực quan hóa khác nhau tùy thuộc vào loại dữ liệu: dữ liệu phân loại so với dữ liệu số.
  • Hai cách để trực quan hóa dữ liệu phân loại: biểu đồ tròn và biểu đồ countplot.
  • Khi bạn muốn biết mối quan hệ giữa dữ liệu liên tục và dữ liệu phân loại, hãy sử dụng Swarmplot và Violinplot.
  • Đừng để giá trị trung bình đánh lừa. Có rất nhiều giá trị đại diện khác nhau.
  • Các đồ thị quen thuộc nhất: Varplot và Pointplot
  • Tôi muốn xem nhiều biểu đồ cùng lúc. Cách sử dụng Facet Grid.
  • Mối quan hệ giữa tỷ lệ và tỷ lệ sống sót là gì? Làm thế nào để xác định mối tương quan giữa hai biến số này?

4. Khai thác dữ liệu du khách của Công viên Seoul Grand

  • Phân tích dữ liệu thực tế Bước 1: Hiểu thông tin dữ liệu
  • Phân tích dữ liệu thực tế Bước 2: Làm sạch dữ liệu
  • Thay đổi kiểu dữ liệu, xử lý dữ liệu bị thiếu, thêm cột dữ liệu, v.v.
  • Bước 3: Phân tích dữ liệu thực tế: Phát triển giả thuyết về dữ liệu
  • Bước 4: Phân tích dữ liệu thực tế: Xác thực giả thuyết thông qua trực quan hóa và suy luận thống kê

Giới thiệu giảng viên

Kim Jeong-wook
Tốt nghiệp Đại học Sungkyunkwan, Khoa Kinh tế

• Cựu thành viên của Danal Future Business Team
• Cựu thành viên nhóm kinh doanh cơ sở hạ tầng Samsung SDS
• Cựu đội ngũ kinh doanh của Miracom Solution Factory
• Tổng giám đốc điều hành của Soencoding
• Giảng viên phân tích dữ liệu/Python tại nhiều trường đại học và học viện
• Chứng chỉ nhà phát triển Tensorflow

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • Những người muốn phân tích dữ liệu lần đầu tiên

  • Những người trước đây đã phân tích dữ liệu bằng Excel nhưng muốn phân tích dữ liệu dễ dàng và hiệu quả hơn bằng Python

  • Những người muốn làm quen với việc phân tích dữ liệu trước khi học về máy học/trí tuệ nhân tạo

Xin chào
Đây là

3,355

Học viên

216

Đánh giá

204

Trả lời

4.8

Xếp hạng

6

Các khóa học

인공지능, 머신러닝, 딥러닝의 대중화를 꿈꿉니다.

Chương trình giảng dạy

Tất cả

62 bài giảng ∙ (4giờ 25phút)

Tài liệu khóa học:

Tài liệu bài giảng
Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Tất cả

14 đánh giá

4.6

14 đánh giá

  • kejint8347님의 프로필 이미지
    kejint8347

    Đánh giá 1

    Đánh giá trung bình 5.0

    5

    100% đã tham gia

    Thông qua việc cung cấp các tài liệu cơ bản và giải thích chi tiết về phần giới thiệu về phân tích dữ liệu, tôi đã hiểu thêm về các phương pháp phân tích và cách sử dụng dữ liệu.

    • learnaday
      Giảng viên

      Cảm ơn bạn đã đánh giá tốt ^^

  • wkdgns78843941님의 프로필 이미지
    wkdgns78843941

    Đánh giá 2

    Đánh giá trung bình 4.0

    4

    100% đã tham gia

    Cảm ơn bạn đã giải thích nó rất dễ dàng.

    • learnaday
      Giảng viên

      Cảm ơn bạn đã đánh giá tốt ^^

  • jungwoolee님의 프로필 이미지
    jungwoolee

    Đánh giá 1

    Đánh giá trung bình 5.0

    5

    100% đã tham gia

    Nó là tốt nhất!!

    • learnaday
      Giảng viên

      Cảm ơn bạn đã đánh giá tốt ^^

  • ksh6117085님의 프로필 이미지
    ksh6117085

    Đánh giá 2

    Đánh giá trung bình 5.0

    5

    100% đã tham gia

    Lời giải thích rõ ràng và dễ hiểu. Cảm ơn

    • learnaday
      Giảng viên

      Cảm ơn bạn đã đánh giá tốt ^^

  • jinhyupkim4138님의 프로필 이미지
    jinhyupkim4138

    Đánh giá 2

    Đánh giá trung bình 4.5

    5

    100% đã tham gia

    Hãy dạy chúng tôi về Pandas một cách dễ dàng, từ những điều cơ bản đến thực hành.

    • learnaday
      Giảng viên

      Cảm ơn bạn đã đánh giá tốt ^^

477.310 ₫

Khóa học khác của learnaday

Hãy khám phá các khóa học khác của giảng viên!

Khóa học tương tự

Khám phá các khóa học khác trong cùng lĩnh vực!