Khóa học này được thiết kế để giúp bạn nâng cao trình độ trở thành chuyên gia xây dựng máy học thực tế thông qua việc triển khai mô hình máy học của cuộc thi Home Credit Default Risk trên Kaggle.
Kaggle thực tế thi đấu vấn đề khi tiếp xúc với máy học thực tế hiện thực hóa khả năng nâng cấp
Nâng cấp khả năng triển khai lên mức có thể áp dụng máy học vào thực tế
Máy học cải thiện hiệu suất mô hình như thế nào
Cải thiện khả năng phân tích dữ liệu cho máy học
Cách thực hiện cụ thể của Feature Engineering trong Machine Learning
Học máy, với khả năng triển khai thực tế! Triển khai mô hình máy học cuộc thi của riêng bạn.
Giới thiệu bài giảng 🤖
Xin chào,
Tôi là Cheolmin Kwon, tác giả của The Complete Guide to Python Machine Learning.
Để trở thành chuyên gia thực thụ về máy học trong lĩnh vực này, bạn không chỉ cần hiểu biết về máy học mà còn phải có khả năng xử lý dữ liệu và hiểu các tác vụ được áp dụng. Tuy nhiên, những khả năng này rất khó có được ngay cả khi bạn dành nhiều thời gian và công sức nếu bạn không thực sự trải nghiệm hoặc rèn luyện chúng một cách có hệ thống.
Khóa học "Thử thách thực hành học máy nâng cao Kaggle" mới phát hành gần đây sẽ giúp bạn trau dồi ba yếu tố này trong khi triển khai vấn đề học máy của "Cuộc thi rủi ro tín dụng mặc định tại nhà" của Kaggle cùng tôi và sẽ giúp bạn phát triển các kỹ năng triển khai học máy thực tế của mình. Đó là được thiết kế để mang lại cho bạn sự tự tin vững chắc.
Bài toán 'Cuộc thi rủi ro tín dụng mặc định tại nhà' có mô hình dữ liệu và một số tập dữ liệu có thể được sử dụng trong công việc thực tế.
Bài giảng này dựa trên các vấn đề của cuộc thi này và cung cấp thông tin chi tiết về các lĩnh vực quan trọng của máy học như mô hình dữ liệu, miền phân tích, phân tích dữ liệu EDA, kỹ thuật tính năng, điều chỉnh siêu tham số và tối ưu hóa hiệu suất mô hình để bạn có thể trau dồi đầy đủ khả năng. Tôi sẽ giải thích chi tiết khi tôi triển khai mã.
Thuật toán học máy được sử dụng trong bài giảng là LightGBM, được nhiều thành viên Kaggler yêu thích. Thông qua thử thách triển khai, bạn sẽ viết mã triển khai được xếp hạng trong top 10% của cuộc thi Home Credit Default Risk, điều này sẽ giúp bạn tự tin triển khai các mô hình được tối ưu hóa về hiệu suất.
Các tính năng của khóa học này 📚
1. Nâng cao hiểu biết về việc triển khai thực tế thông qua các giải thích mã thực tế chi tiết và dễ hiểu cùng với Live Coding
Hầu hết các bài giảng đều dành để giải thích mã thực tế và các mã được giải thích từng dòng một cách rất chi tiết. Đặc biệt đối với các phần triển khai quan trọng, tôi đã tạo điều kiện để bạn có thể thực hành Lập trình trực tiếp cùng tôi, điều này sẽ giúp bạn hiểu rõ hơn về quá trình triển khai.
2. Nâng cao khả năng triển khai các mô hình hướng đến hiệu suất để chuẩn bị cho các cuộc thi như Kaggle và Deacon
Trong khóa học này, bạn sẽ học các kỹ thuật học máy tiên tiến, kỹ thuật thiết kế tính năng và kỹ thuật điều chỉnh siêu tham số để giúp bạn đạt điểm cao trong các cuộc thi như Kaggle và Deacon. Điều này sẽ giúp bạn đạt đến trình độ có thể tự tin tham gia các cuộc thi học máy.
3. Giải thích chi tiết về tất cả các lĩnh vực học máy cần thiết trong thực tế
Khóa học này cung cấp các giải thích chi tiết về mọi lĩnh vực của máy học, bao gồm mô hình dữ liệu và miền phân tích, phân tích dữ liệu EDA, kỹ thuật tính năng, điều chỉnh siêu tham số và tối ưu hóa hiệu suất mô hình. Nhờ đó, bạn có thể cải thiện không chỉ khả năng học máy mà còn khả năng xử lý dữ liệu và hiểu biết về lĩnh vực kinh doanh, từ đó đặt nền tảng để trở thành chuyên gia học máy cần thiết trong lĩnh vực này.
Bài giảng này là bài giảng về Dự án học máy nâng cao dành cho sinh viên có hiểu biết cơ bản về học máy. Tài liệu này được tạo ra với giả định rằng bạn đã hiểu nội dung của Chương 1 đến Chương 4 (Phân loại) trong cuốn sách ' Hướng dẫn đầy đủ về học máy Python ' .
Ngay cả khi bạn chưa đọc cuốn sách hoặc bài giảng ' The Complete Guide to Python Machine Learning ', bạn vẫn có thể tham gia khóa học nếu bạn đã xem trước mục lục của 'The Complete Guide to Python Machine Learning' và đã quen thuộc với nội dung của mục lục đến Chương 4.
Môi trường thực hành 💻
Jupyter NotebookColab
Có thể thực hiện ở bất kỳ đâu trong môi trường có bộ nhớ RAM lớn hơn 12GB. (Với khoảng 8GB, có thể sẽ khó thực hành do bộ nhớ không đủ ở giai đoạn thực hành cuối cùng). Nếu bạn không có hơn 12GB RAM, bạn có thể tạo máy chủ bằng khoản tín dụng miễn phí 300 đô la của Google Cloud hoặc sử dụng Google Colab. Phần đầu tiên của bài giảng sẽ trình bày chi tiết cách thiết lập môi trường phòng thí nghiệm này.
Mã thực hành được cung cấp dưới dạng sổ tay Jupyter và một mã thực hành riêng cho Google Colab cũng được cung cấp. Có thể tải xuống mã thực hành và tài liệu bài giảng từ phòng tài liệu bài giảng.
Tôi nghĩ đây là một khóa học tốt cho phép bạn có được trải nghiệm thực tế bằng cách sử dụng dữ liệu thực tế của Kaggle. Lần đầu tiên tôi biết đến bài giảng của Cheolmin Kwon là khi tôi đang nghe một bài giảng có tên "Hướng dẫn hoàn chỉnh về học máy" và bài giảng này cũng rất hay...
Cảm ơn bạn rất nhiều vì đã luôn tạo ra những bài giảng hay, và hơn hết, điều tôi thực sự thích là khi bạn đăng một câu hỏi và trả lời, bạn sẽ trả lời trong thời gian ngắn... Tôi nghĩ đây là một điểm rất hay. Tất nhiên, chất lượng của các bài giảng là điều không thể bàn cãi.
Cảm ơn bạn một lần nữa.
Mình biết lý thuyết ở mức độ nhất định, nhưng cá nhân mình còn nhiều thiếu sót trong phần thực hiện, nhưng bài giảng này rất hữu ích vì nó dễ hiểu và chi tiết nhất có thể.
Tôi nghĩ rằng tôi đã có một số kinh nghiệm với gấu trúc, nhưng hóa ra chỉ biết cách làm điều đó không đảm bảo hiệu suất. Đây là một bài giảng tuyệt vời đã dạy tôi cách áp dụng thuật toán học máy cho các tập dữ liệu phức tạp cũng như tầm quan trọng của các lĩnh vực phân tích và tiền xử lý dữ liệu. Sau khi nghe điều này, tôi cảm thấy như mình đã biết tại sao thứ hạng của mình trên Kaggle không tăng lên. Tiền thưởng năm nay rất lớn...