강의

멘토링

로드맵

Inflearn brand logo image
Data Science

/

Data Analysis

Phần giới thiệu dễ dàng nhất về phân tích dữ liệu dành cho người không chuyên ngành

Phân tích dữ liệu nghe có vẻ hoành tráng nhưng thực chất đó là quá trình tạo ra một giả thuyết và xác minh nó dựa trên dữ liệu. Bạn có thể sử dụng Python để tìm hiểu dữ liệu nào cần phân tích và cách kiểm tra giả thuyết của mình.

(4.6) 14 đánh giá

185 học viên

  • learnaday
Python
Pandas
Anaconda

Đánh giá từ những học viên đầu tiên

Dịch cái này sang tiếng Việt

  • Hiểu các khái niệm về phân tích dữ liệu

  • Master Pandas, một công cụ phân tích dữ liệu tiêu biểu

  • Làm chủ trực quan hóa phân tích dữ liệu

  • Tự thực hành phân tích dữ liệu bằng nhiều ví dụ khác nhau

Ngay cả những người không chuyên ngành cũng có thể bắt đầu phân tích dữ liệu!
Trải nghiệm quy trình 3 bước xây dựng giả thuyết, phân tích dữ liệu và kiểm tra giả thuyết.

Phân tích dữ liệu đang nổi lên như một năng lực cốt lõi trong nhiều lĩnh vực.

Bạn đã từng do dự vì không biết lập trình, thiếu tự tin về thống kê, hay đơn giản là không biết bắt đầu từ đâu? Giờ đây, hãy bắt đầu phân tích dữ liệu với chuyên gia Python Kim Jeong-wook. Anh ấy sẽ giúp bạn thực hiện phân tích dữ liệu cơ bản , ngay cả khi bạn chưa có kinh nghiệm lập trình hay kiến thức thống kê .

1. Đánh giá Python và cài đặt Anaconda

  • Chúng ta chỉ nghe nói về phân tích dữ liệu, nhưng thực chất nó có nghĩa là gì?
  • Jupyter Notebook giúp Python dễ sử dụng hơn.
  • Tóm tắt ngữ pháp Python cần thiết cho phân tích dữ liệu: kiểu dữ liệu, vòng lặp, hàm, v.v.

2. Tìm hiểu công cụ phân tích dữ liệu Pandas.

  • Pandas, cốt lõi của quá trình tiền xử lý dữ liệu
  • Các chức năng thiết yếu cung cấp thông tin về dữ liệu một cách tổng quan
  • Cấu trúc của dữ liệu so với cấu trúc của dữ liệu riêng lẻ
  • Chuyển đổi kiểu dữ liệu thành dữ liệu có thể phân tích
  • Xóa/thêm các cột chỉ có dữ liệu tôi muốn
  • Nhiều cách khác nhau để trích xuất dữ liệu
  • Tôi nên xử lý thế nào trong trường hợp dữ liệu trống (thiếu giá trị)?
  • Giống hệt như Excel. Bảng Pivot được tạo bằng Pandas.

3. Thực hành các công cụ trực quan hóa Matplotlip và Seaborn với dữ liệu về người sống sót trên tàu Titanic.

  • Phương pháp trực quan hóa khác nhau tùy thuộc vào loại dữ liệu: dữ liệu phân loại so với dữ liệu số.
  • Hai cách để trực quan hóa dữ liệu phân loại: biểu đồ tròn và biểu đồ countplot.
  • Khi bạn muốn biết mối quan hệ giữa dữ liệu liên tục và dữ liệu phân loại, hãy sử dụng Swarmplot và Violinplot.
  • Đừng để giá trị trung bình đánh lừa. Có rất nhiều giá trị đại diện khác nhau.
  • Các đồ thị quen thuộc nhất: Varplot và Pointplot
  • Tôi muốn xem nhiều biểu đồ cùng lúc. Cách sử dụng Facet Grid.
  • Mối quan hệ giữa tỷ lệ và tỷ lệ sống sót là gì? Làm thế nào để xác định mối tương quan giữa hai biến số này?

4. Khai thác dữ liệu du khách của Công viên Seoul Grand

  • Phân tích dữ liệu thực tế Bước 1: Hiểu thông tin dữ liệu
  • Phân tích dữ liệu thực tế Bước 2: Làm sạch dữ liệu
  • Thay đổi kiểu dữ liệu, xử lý dữ liệu bị thiếu, thêm cột dữ liệu, v.v.
  • Bước 3: Phân tích dữ liệu thực tế: Phát triển giả thuyết về dữ liệu
  • Bước 4: Phân tích dữ liệu thực tế: Xác thực giả thuyết thông qua trực quan hóa và suy luận thống kê

Giới thiệu giảng viên

Kim Jeong-wook
Tốt nghiệp Đại học Sungkyunkwan, Khoa Kinh tế

• Cựu thành viên của Danal Future Business Team
• Cựu thành viên nhóm kinh doanh cơ sở hạ tầng Samsung SDS
• Cựu đội ngũ kinh doanh của Miracom Solution Factory
• Tổng giám đốc điều hành của Soencoding
• Giảng viên phân tích dữ liệu/Python tại nhiều trường đại học và học viện
• Chứng chỉ nhà phát triển Tensorflow

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • Những người muốn phân tích dữ liệu lần đầu tiên

  • Những người trước đây đã phân tích dữ liệu bằng Excel nhưng muốn phân tích dữ liệu dễ dàng và hiệu quả hơn bằng Python

  • Những người muốn làm quen với việc phân tích dữ liệu trước khi học về máy học/trí tuệ nhân tạo

Xin chào
Đây là

3,287

Học viên

208

Đánh giá

204

Trả lời

4.8

Xếp hạng

6

Các khóa học

인공지능, 머신러닝, 딥러닝의 대중화를 꿈꿉니다.

Chương trình giảng dạy

Tất cả

62 bài giảng ∙ (4giờ 25phút)

Tài liệu khóa học:

Tài liệu bài giảng
Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Tất cả

14 đánh giá

4.6

14 đánh giá

  • kejint님의 프로필 이미지
    kejint

    Đánh giá 1

    Đánh giá trung bình 5.0

    5

    100% đã tham gia

    데이터분석 입문을 위한 기본 자료 제공 및 상세한 설명으로 데이터 분석방법과 활용에 대해 자세히 알게 되었습니다.

    • 런어데이
      Giảng viên

      좋은 평가 감사드립니다^^

  • wkdgns7884님의 프로필 이미지
    wkdgns7884

    Đánh giá 2

    Đánh giá trung bình 4.0

    4

    100% đã tham gia

    쉽게 설명해주셔서 감사합니다.

    • 런어데이
      Giảng viên

      좋은 평가 감사드립니다^^

  • jungwoo.lee님의 프로필 이미지
    jungwoo.lee

    Đánh giá 1

    Đánh giá trung bình 5.0

    5

    100% đã tham gia

    최고에요!!

    • 런어데이
      Giảng viên

      좋은 평가 감사드립니다^^

  • ksh611님의 프로필 이미지
    ksh611

    Đánh giá 2

    Đánh giá trung bình 5.0

    5

    100% đã tham gia

    귀에 속쏙 들어오게 설명을 명쾌하게 하시네요~ 감사합니다.

    • 런어데이
      Giảng viên

      좋은 평가 감사드립니다^^

  • jinhyup.kim님의 프로필 이미지
    jinhyup.kim

    Đánh giá 2

    Đánh giá trung bình 4.5

    5

    100% đã tham gia

    Pandas에 대해 기초부터 실습까지 쉽게 알려주세요

    • 런어데이
      Giảng viên

      좋은 평가 감사드립니다^^

478.307 ₫

Khóa học khác của learnaday

Hãy khám phá các khóa học khác của giảng viên!

Khóa học tương tự

Khám phá các khóa học khác trong cùng lĩnh vực!