inflearn logo
inflearn logo

Bắt đầu phân tích dữ liệu Python với dữ liệu công khai

Có tin đồn rằng Ediya sẽ mở một cửa hàng gần Starbucks. Vị trí cửa hàng của Ediya và Starbucks khác nhau như thế nào? Liệu xu hướng biến động giá bất động sản từ năm 2013 – 2019 có được phản ánh vào giá bán căn hộ? Có những công viên nào trong khu phố của chúng tôi? Làm cách nào chúng tôi có thể sử dụng dữ liệu trong cổng dữ liệu công cộng? Mục tiêu là xử lý nhiều loại dữ liệu khác nhau thông qua dữ liệu công cộng và làm quen với Python cũng như các thư viện phân tích dữ liệu khác nhau.

(4.9) 339 đánh giá

6,347 học viên

Độ khó Cơ bản

Thời gian Không giới hạn

Python
Python
Pandas
Pandas
Numpy
Numpy
Python
Python
Pandas
Pandas
Numpy
Numpy
todaycode님의 프로필 이미지

Một phần bài giảng về phân tích tình hình bùng phát dịch bệnh COVID-19 ở Seoul có tiêu đề “Phân tích và trực quan hóa dữ liệu chỉ trong hai tài liệu”. Nó được tiết lộ cho công chúng và bạn có thể xem toàn bộ phân tích ngay cả khi bạn không tham gia khóa học.

Xin chào.

Đã hơn một năm kể từ khi tôi tổ chức khóa học " Kết hợp phân tích dữ liệu và trực quan hóa chỉ với hai tài liệu ".

Giống như khóa học “Bắt đầu phân tích dữ liệu Python với dữ liệu công khai”, khóa học này sẽ được cập nhật liên tục.

Nội dung phân tích về tình hình bùng phát dịch COVID-19 tại Seoul đã được bổ sung vào khóa học “ Phân tích và trực quan hóa dữ liệu chỉ trong hai tài liệu ”.

để kỷ niệm bản cập nhật, chúng tôi sẽ giảm giá 20% cho đến ngày 24 tháng 7 .

Ngay cả khi bạn không tham gia khóa học, bạn có thể xem một số khóa học trong " Kết hợp phân tích dữ liệu và trực quan hóa chỉ trong hai tài liệu " và toàn bộ mã nguồn cũng có thể được tải xuống từ khóa học .

Chúng tôi thu thập dữ liệu, xử lý trước, phân tích và trực quan hóa dữ liệu trạng thái trường hợp đã được xác nhận ( https://www.seoul.go.kr/coronaV/coronaStatus.do ) do Chính quyền Thủ đô Seoul phát hành cho đến tháng 6 bằng cách sử dụng Pandas.

Phân tích những gì bạn đã học được chỉ trong hai tài liệu thông qua một dự án tương tự như công việc hiện tại của bạn.

Chúng tôi sẽ phân tích trang web về tình trạng bùng phát dịch bệnh COVID-19 của Thành phố Seoul bằng cách sử dụng Pandas, từ thu thập dữ liệu đến tiền xử lý, phân tích và trực quan hóa.

Chúng tôi trực tiếp phân tích dữ liệu chúng tôi thường gặp thông qua các bài báo và cuộc sống hàng ngày.

  • Quận nào có nhiều trường hợp được xác nhận nhất?
  • Bệnh viện nào điều trị các trường hợp được xác nhận nhiều nhất?
  • Có bệnh viện nào nhận chuyển viện nhiều không?
  • Quận nào có số ca nhiễm từ nước ngoài được xác nhận cao nhất?
  • Làm cách nào tôi có thể xử lý trước văn bản cho nhiều quốc gia như Châu Âu, Nam Mỹ, v.v.?
  • Số ca xác nhận nhập cảnh từ nước ngoài thay đổi bao nhiêu theo từng tháng?

Hiểu và thực hành các phương pháp tiền xử lý dữ liệu bằng Pandas.

  • Làm cách nào để có được năm, tháng, ngày, ngày trong tuần và tuần từ ngày văn bản?
  • Làm cách nào để tìm số lượng tích lũy các trường hợp được xác nhận bằng cách sử dụng dữ liệu trạng thái bệnh nhân đã được xác nhận?
  • Sự khác biệt giữa nhóm, chéo bảng, trục và bảng trụ và chức năng nào phù hợp để sử dụng?

 

Hiểu cấu trúc dữ liệu của các khung và chuỗi dữ liệu và xử lý chúng thành dạng phù hợp để phân tích.

  • Tôi nên tạo khung dữ liệu để vẽ biểu đồ bằng cốt truyện của Pandas như thế nào?
  • Nếu tôi muốn hiển thị các giá trị có màu sắc khác nhau tùy thuộc vào các giá trị phân loại trong biểu đồ thì tôi nên thay đổi khung dữ liệu như thế nào?
  • Có cách nào để chuyển đổi một chuỗi thành khung dữ liệu không?

Hãy tự mình kiểm tra nó trong khóa học!

 

 

Nhờ có nhiều câu hỏi và đánh giá tốt về khóa học mà bạn đã để lại trong năm qua, chúng tôi đã có thể cập nhật khóa học.

Chúng tôi sẽ tiếp tục cải thiện và cập nhật khóa học trong tương lai.

Nếu bạn để lại một đánh giá tốt về khóa học, nó sẽ giúp ích rất nhiều trong việc liên tục cải thiện nội dung.

 

Tôi hy vọng chúng ta có thể thoát khỏi COVID-19 và trở lại cuộc sống thường ngày!

Cảm ơn

Bình luận
Chưa có bình luận nào.

1.378.296 ₫