강의

멘토링

로드맵

Data Science

/

Data Analysis

Bắt đầu phân tích dữ liệu với Kaggle Surveys

Kaggle là loại nền tảng gì? Hàng năm, Kaggle khảo sát người dùng trên khắp thế giới. Khi bạn muốn học khoa học dữ liệu, có rất nhiều câu hỏi được đặt ra. Bây giờ bắt đầu có phải là quá muộn không? Bạn nên chọn ngôn ngữ nào giữa Python và R? Mức lương là bao nhiêu? Nhận câu trả lời cho câu hỏi của bạn thông qua phản hồi từ người dùng trên khắp thế giới! Bạn có thể thực hiện phân tích tần suất và trực quan hóa dữ liệu chỉ bằng một vài tính năng mạnh mẽ của Pandas.

(4.9) 95 đánh giá

3,408 học viên

  • todaycode
Kaggle
Pandas
Seaborn
Thumbnail

Đánh giá từ những học viên đầu tiên

Dịch cái này sang tiếng Việt

  • Cách sử dụng máy tính xách tay kaggle

  • Xử lý dữ liệu ở định dạng DataFrame và Series với gấu trúc

  • Lập chỉ mục dữ liệu qua loc trong pandas

  • Tính tần số với gấu trúc value_counts

  • Hiển thị tần số bằng bảng đếm seaborn

  • Vẽ biểu đồ thanh bằng seaborn barplot

  • Tìm tần suất phản hồi cho nhiều câu hỏi bằng pd.crosstab

  • Sắp xếp dữ liệu với Sort_index() và Sort_values()

  • Cách sử dụng bộ lọc gấu trúc

Bí mật của Kaggler được tiết lộ qua dữ liệu!
Bây giờ, hãy thực hiện bước đầu tiên để phân tích dữ liệu.

Người dùng Kaggler trên toàn thế giới đang nghĩ gì?

Nhà phân tích dữ liệu , Nhà khoa học dữ liệu ,
Tôi muốn trở thành một kỹ sư máy học ...
Nếu bạn không có nơi nào để hỏi và có nhiều câu hỏi?!

Phân tích nó bằng dữ liệu!

  • Có thể điều này sẽ giúp bạn giải quyết vấn đề của mình một chút.
  • Có một số lựa chọn dành cho người mới bắt đầu sử dụng dữ liệu.

Nếu bạn đang băn khoăn không biết nên chọn gì?

Câu trả lời có thể nằm ở dữ liệu!

Python so với R so với SQL

scikit-learn so với TensorFlow

Matplotlib so với Seaborn so với Plotly so với ggplot

Jupyter so với Mã VS so với PyCharm

AWS so với MS Azure so với GCP

Có quá muộn để bắt đầu khoa học dữ liệu không?

👉 Giới tính và độ tuổi của người dùng Kaggler là bao nhiêu?

Người dùng Kaggler chủ yếu sống ở đâu và làm nghề gì?

👉 Nhà phân tích dữ liệu? Nhà khoa học? Kỹ sư học máy? Lập trình viên?

Người dùng Kaggle chủ yếu sử dụng ngôn ngữ nào và bạn khuyên dùng ngôn ngữ nào cho người mới bắt đầu?

👉 Python so với R so với SQL?
👉 Jupyter? VS Code? PyCharm? Bạn nên dùng trình soạn thảo nào?
👉 Tỷ lệ giới tính của người dùng Kaggler có thay đổi theo nhóm tuổi không?
👉 Ngoài ra, có sự khác biệt trong cách sử dụng ngôn ngữ và nghề nghiệp tùy theo giới tính không?

Tìm hiểu về sở thích và thông tin nhân khẩu học của người dùng Kaggler thông qua phân tích tần suất đơn giản.

Nếu bạn phải làm đi làm lại cùng một công việc thì sao? Hãy tạo một hàm để giảm khối lượng công việc lặp đi lặp lại.
Tôi sẽ tạo một hàm tự động phân tích tần suất chỉ bằng cách truyền vào số câu hỏi!

Hãy thử luyện tập bằng cách đăng nhập vào Kaggle mà không cần cài đặt hoặc tải xuống riêng!

⚠️ Những điều cần lưu ý trước khi tham gia lớp học

  • Chúng tôi sẽ không dạy những kiến thức cơ bản về Python hay Pandas mà sẽ tiến hành phân tích trực tiếp.
  • Chúng tôi sẽ không đi sâu vào chi tiết về cách sử dụng Python, Pandas hoặc trực quan hóa.
  • Chúng tôi chỉ đề cập đến một số kỹ năng để phân tích khảo sát.
  • Nếu bạn không có kinh nghiệm về Python, Pandas hoặc trực quan hóa, bạn có thể gặp khó khăn khi tham gia khóa học.
  • Chúng tôi sẽ chỉ đề cập đến các kỹ năng về cách kiểm tra trực tiếp câu trả lời cho 39 câu hỏi bằng mã và phân tích chúng theo cách đơn giản.

Lộ trình liên quan

Phân tích dữ liệu thực tế bằng Python cho khoa học xương
Lộ trình khoa học dữ liệu bạn có thể sử dụng trong công việc thực tế của mình!
Bao gồm bài giảng này

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • Người mới bắt đầu khoa học dữ liệu

  • Kaggle người mới bắt đầu

  • Bất cứ ai tò mò về thông tin nhân khẩu học của các nhà phân tích dữ liệu khác

  • Bất cứ ai muốn phân tích khảo sát với Pandas

  • nhà phân tích dữ liệu

  • Bất cứ ai muốn tìm hiểu kỹ thuật tiền xử lý dữ liệu

Cần biết trước khi bắt đầu?

  • Hiểu biết cơ bản về các kiểu dữ liệu, biến, danh sách, câu lệnh điều kiện và hàm trong Python.

  • Các thao tác so sánh và gán trong Python

  • Hiểu biết cơ bản về định dạng DataFrame và Series của gấu trúc

  • Hiểu biểu đồ thanh

Xin chào
Đây là

18,879

Học viên

791

Đánh giá

1,334

Trả lời

4.9

Xếp hạng

6

Các khóa học

  • Microsoft MVP(Python Developer Technologies)

  • 오늘코드 YouTube 📺 https://youtube.com/todaycode

  • “모두가 데이터에 친숙해지는 날이 오길”– 마이크로소프트웨어 (링크)

  • 네이버 커넥트 재단 부스트코스 데이터사이언스 강의 설계 및 교수자

  • 서울대 빅데이터혁신공유대학, 서울대 평생교육원, 연세대 DX Academy, 한신대 ABC Camp, 한양대 대학원, 전남대,

    한국능률협회, 삼성SDS 멀티캠퍼스, 멋쟁이사자처럼, 패스트캠퍼스, 모두의연구소 등 다수의 교육기관 및 기업 강의

  • 다양한 도메인(제약, 통신, 자동차, 커머스, 교육, 정부기관 등)의 기업 데이터 분석

  • 20년이상 게임, 광고, 교육 등 다양한 도메인에서 웹 백엔드 개발자 및 데이터 분석가 현업 경험

Chương trình giảng dạy

Tất cả

13 bài giảng ∙ (2giờ 40phút)

Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Tất cả

95 đánh giá

4.9

95 đánh giá

  • KYUNG TAE BAE님의 프로필 이미지
    KYUNG TAE BAE

    Đánh giá 286

    Đánh giá trung bình 5.0

    5

    15% đã tham gia

    캐글과 데이터분석에 대해 궁금했는데.. 알려주셔서 감사합니다~! 유료 강의도 수강신청해서 열심히 공부하겠습니다

    • 장성덕님의 프로필 이미지
      장성덕

      Đánh giá 97

      Đánh giá trung bình 4.2

      5

      31% đã tham gia

      • 송호성님의 프로필 이미지
        송호성

        Đánh giá 1

        Đánh giá trung bình 5.0

        5

        31% đã tham gia

        • eunh2106님의 프로필 이미지
          eunh2106

          Đánh giá 3

          Đánh giá trung bình 5.0

          5

          31% đã tham gia

          목소리도 차분하시고 편안하게 들을 수 있도록 강의를 해주세요. 코드 하나하나를 자세하게 설명해 주시니 이해하기가 쉬웠어요.

          • ssonnr@naver.com손나님의 프로필 이미지
            ssonnr@naver.com손나

            Đánh giá 1

            Đánh giá trung bình 5.0

            5

            23% đã tham gia

            Miễn phí

            Khóa học khác của todaycode

            Hãy khám phá các khóa học khác của giảng viên!

            Khóa học tương tự

            Khám phá các khóa học khác trong cùng lĩnh vực!