Kaggle là loại nền tảng gì? Hàng năm, Kaggle khảo sát người dùng trên khắp thế giới. Khi bạn muốn học khoa học dữ liệu, có rất nhiều câu hỏi được đặt ra.
Bây giờ bắt đầu có phải là quá muộn không? Bạn nên chọn ngôn ngữ nào giữa Python và R? Mức lương là bao nhiêu?
Nhận câu trả lời cho câu hỏi của bạn thông qua phản hồi từ người dùng trên khắp thế giới!
Bạn có thể thực hiện phân tích tần suất và trực quan hóa dữ liệu chỉ bằng một vài tính năng mạnh mẽ của Pandas.
Xử lý dữ liệu ở định dạng DataFrame và Series với gấu trúc
Lập chỉ mục dữ liệu qua loc trong pandas
Tính tần số với gấu trúc value_counts
Hiển thị tần số bằng bảng đếm seaborn
Vẽ biểu đồ thanh bằng seaborn barplot
Tìm tần suất phản hồi cho nhiều câu hỏi bằng pd.crosstab
Sắp xếp dữ liệu với Sort_index() và Sort_values()
Cách sử dụng bộ lọc gấu trúc
Bí mật của Kaggler được tiết lộ qua dữ liệu! Bây giờ, hãy thực hiện bước đầu tiên để phân tích dữ liệu.
Người dùng Kaggler trên toàn thế giới đang nghĩ gì?
Nhà phân tích dữ liệu , Nhà khoa học dữ liệu , Tôi muốn trở thành một kỹ sư máy học ... Nếu bạn không có nơi nào để hỏi và có nhiều câu hỏi?!
Phân tích nó bằng dữ liệu!
Có thể điều này sẽ giúp bạn giải quyết vấn đề của mình một chút.
Có một số lựa chọn dành cho người mới bắt đầu sử dụng dữ liệu.
Nếu bạn đang băn khoăn không biết nên chọn gì?
Câu trả lời có thể nằm ở dữ liệu!
Pythonso vớiRso vớiSQL
scikit-learnso vớiTensorFlow
Matplotlibso vớiSeabornso vớiPlotlyso vớiggplot
Jupyterso vớiMã VSso vớiPyCharm
AWSso vớiMS Azureso vớiGCP
Có quá muộn để bắt đầu khoa học dữ liệu không?
👉 Giới tính và độ tuổi của người dùng Kaggler là bao nhiêu?
Người dùng Kaggler chủ yếu sống ở đâu và làm nghề gì?
👉 Nhà phân tích dữ liệu? Nhà khoa học? Kỹ sư học máy? Lập trình viên?
Người dùng Kaggle chủ yếu sử dụng ngôn ngữ nào và bạn khuyên dùng ngôn ngữ nào cho người mới bắt đầu?
👉 Python so với R so với SQL? 👉 Jupyter? VS Code? PyCharm? Bạn nên dùng trình soạn thảo nào? 👉 Tỷ lệ giới tính của người dùng Kaggler có thay đổi theo nhóm tuổi không? 👉 Ngoài ra, có sự khác biệt trong cách sử dụng ngôn ngữ và nghề nghiệp tùy theo giới tính không?
Tìm hiểu về sở thích và thông tin nhân khẩu học của người dùng Kaggler thông qua phân tích tần suất đơn giản.
Nếu bạn phải làm đi làm lại cùng một công việc thì sao? Hãy tạo một hàm để giảm khối lượng công việc lặp đi lặp lại. Tôi sẽ tạo một hàm tự động phân tích tần suất chỉ bằng cách truyền vào số câu hỏi!
Hãy thử luyện tập bằng cách đăng nhập vào Kaggle mà không cần cài đặt hoặc tải xuống riêng!
⚠️ Những điều cần lưu ý trước khi tham gia lớp học
Chúng tôi sẽ không dạy những kiến thức cơ bản về Python hay Pandas mà sẽ tiến hành phân tích trực tiếp.
Chúng tôi sẽ không đi sâu vào chi tiết về cách sử dụng Python, Pandas hoặc trực quan hóa.
Chúng tôi chỉ đề cập đến một số kỹ năng để phân tích khảo sát.
Nếu bạn không có kinh nghiệm về Python, Pandas hoặc trực quan hóa, bạn có thể gặp khó khăn khi tham gia khóa học.
Chúng tôi sẽ chỉ đề cập đến các kỹ năng về cách kiểm tra trực tiếp câu trả lời cho 39 câu hỏi bằng mã và phân tích chúng theo cách đơn giản.