inflearn logo
inflearn logo

Tìm hiểu khoa học dữ liệu thông qua thực hành Kaggle

Hãy cùng bắt tay vào phân tích dữ liệu và học máy thông qua Kaggle, một nền tảng cạnh tranh về học máy và khoa học dữ liệu.

(4.8) 73 đánh giá

4,707 học viên

Độ khó Cơ bản

Thời gian Không giới hạn

Kaggle
Kaggle
Kaggle
Kaggle
todaycode님의 프로필 이미지

Một phần bài giảng về phân tích tình hình bùng phát dịch bệnh COVID-19 ở Seoul có tiêu đề “Phân tích và trực quan hóa dữ liệu chỉ trong hai tài liệu”. Nó mở cửa cho công chúng và bạn có thể xem toàn bộ sổ tay phân tích ngay cả khi bạn không tham gia khóa học.

Xin chào.

Đã hơn một năm kể từ khi tôi tổ chức khóa học " Kết hợp phân tích dữ liệu và trực quan hóa chỉ với hai tài liệu ".

Nội dung phân tích về tình hình bùng phát dịch COVID-19 tại Seoul đã được bổ sung vào khóa học “ Phân tích và trực quan hóa dữ liệu chỉ trong hai tài liệu ”.

để kỷ niệm bản cập nhật, chúng tôi sẽ giảm giá 20% cho đến ngày 24 tháng 7 .

Ngay cả khi bạn không tham gia khóa học, bạn có thể xem một số khóa học trong " Kết hợp phân tích dữ liệu và trực quan hóa chỉ trong hai tài liệu " và toàn bộ mã nguồn cũng có thể được tải xuống từ khóa học .

Chúng tôi thu thập dữ liệu, xử lý trước, phân tích và trực quan hóa dữ liệu trạng thái trường hợp đã được xác nhận ( https://www.seoul.go.kr/coronaV/coronaStatus.do ) do Chính quyền Thủ đô Seoul phát hành cho đến tháng 6 bằng cách sử dụng Pandas.

Phân tích những gì bạn đã học được chỉ trong hai tài liệu thông qua một dự án tương tự như công việc hiện tại của bạn.

Chúng tôi sẽ phân tích trang web về tình trạng bùng phát dịch bệnh COVID-19 của Thành phố Seoul bằng cách sử dụng Pandas, từ thu thập dữ liệu đến tiền xử lý, phân tích và trực quan hóa.

Chúng tôi trực tiếp phân tích dữ liệu chúng tôi thường gặp thông qua các bài báo và cuộc sống hàng ngày.

  • Quận nào có nhiều trường hợp được xác nhận nhất?
  • Bệnh viện nào điều trị các trường hợp được xác nhận nhiều nhất?
  • Có bệnh viện nào nhận chuyển viện nhiều không?
  • Quận nào có số ca nhiễm từ nước ngoài được xác nhận cao nhất?
  • Làm cách nào tôi có thể xử lý trước văn bản cho nhiều quốc gia như Châu Âu, Nam Mỹ, v.v.?
  • Số trường hợp được xác nhận nhập cảnh từ nước ngoài khác nhau bao nhiêu theo tháng?

Hiểu và thực hành các phương pháp tiền xử lý dữ liệu bằng Pandas.

  • Làm cách nào để có được năm, tháng, ngày, ngày trong tuần và tuần từ ngày văn bản?
  • Làm cách nào để tìm số lượng tích lũy các trường hợp được xác nhận bằng cách sử dụng dữ liệu trạng thái bệnh nhân đã được xác nhận?
  • Sự khác biệt giữa nhóm, chéo bảng, trục và bảng trụ và chức năng nào phù hợp để sử dụng?

 

Hiểu cấu trúc dữ liệu của các khung và chuỗi dữ liệu và xử lý chúng thành dạng phù hợp để phân tích.

  • Tôi nên tạo khung dữ liệu để vẽ biểu đồ bằng cốt truyện của Pandas như thế nào?
  • Nếu tôi muốn hiển thị các giá trị có màu sắc khác nhau tùy thuộc vào các giá trị phân loại trong biểu đồ thì tôi nên thay đổi khung dữ liệu như thế nào?
  • Có cách nào để chuyển đổi một chuỗi thành khung dữ liệu không?

Hãy tự mình kiểm tra nó trong khóa học!

 

 

Nhờ có nhiều câu hỏi và đánh giá tốt về khóa học mà bạn đã để lại trong năm qua, chúng tôi đã có thể cập nhật khóa học.

Chúng tôi sẽ tiếp tục cải thiện và cập nhật khóa học trong tương lai.

Nếu bạn để lại một đánh giá tốt về khóa học, nó sẽ giúp ích rất nhiều trong việc liên tục cải thiện nội dung.

 

Tôi hy vọng chúng ta có thể thoát khỏi COVID-19 và trở lại cuộc sống thường ngày!

Cảm ơn

Bình luận
Chưa có bình luận nào.

Miễn phí