강의

멘토링

로드맵

BEST
Data Science

/

Certificate (Data Science)

[Làm gì sau giờ làm] Chứng chỉ Phân tích Dữ liệu lớn - Kỳ thi thực hành (Dạng bài tập 1, 2, 3)

Chúng tôi sẽ hướng dẫn cách để những người không chuyên hoặc người mới bắt đầu có thể nhanh chóng lấy được chứng chỉ thực hành Phân tích Dữ liệu lớn (Big Data Analysis)! Lý thuyết nhẹ nhàng, thực hành chắc chắn – không cần kiến thức nền tảng phức tạp, chúng ta sẽ tập trung học những điểm mấu chốt chắc chắn xuất hiện trong kỳ thi thông qua các câu hỏi đã từng ra.

(4.9) 804 đánh giá

5,453 học viên

Độ khó Nhập môn

Thời gian 12 tháng

  • roadmap
Engineer Big Data Analysis
Engineer Big Data Analysis
Big Data
Big Data
Python
Python
Pandas
Pandas
Machine Learning(ML)
Machine Learning(ML)
Engineer Big Data Analysis
Engineer Big Data Analysis
Big Data
Big Data
Python
Python
Pandas
Pandas
Machine Learning(ML)
Machine Learning(ML)

[Loại công việc 2] Điều gì sẽ xảy ra nếu dữ liệu chứa dữ liệu chuỗi thời gian?

Bạn dự định làm gì nếu có dữ liệu chuỗi thời gian giữa các cột trong một bài toán phân loại hoặc hồi quy?

Nếu bạn có đủ khả năng, vui lòng tạo một biến dẫn xuất (cột mới).

Mã dưới đây là

  1. Chuyển đổi dữ liệu chuỗi thời gian sang kiểu dữ liệu ngày giờ

  2. Tôi đã tạo các cột mới cho năm, tháng và ngày.

  3. Và cột ngày giờ hiện tại đã bị xóa.

 

# datetime train['datetime'] = pd.to_datetime(train['datetime']) test['datetime'] = pd.to_datetime(test['datetime']) train['year'] = train['datetime'].dt.year train['month'] = train['datetime'].dt.month train['day'] = train['datetime'].dt.day test['year'] = test['datetime'].dt.year test['month'] = test['datetime'].dt.month test['day'] = test['datetime'].dt.day train = train.drop('datetime', axis=1) test = test.drop('datetime', axis=1)

Hãy cùng nhau thử nhé. Chúng ta hãy xem những thay đổi về hiệu suất của mô hình tùy thuộc vào việc nó có được sử dụng hay không!

https://www.kaggle.com/code/agileteam/t2-6-bike-regressor

 

 

Bình luận