Tiền xử lý và xử lý dữ liệu thông qua thư viện Pandas
Trực quan hóa dữ liệu với thư viện Matplotlib và Seaborn
Lý thuyết và thực hành học máy bằng thư viện Scikit-Learn
Bài tập thực hành sử dụng dữ liệu Kaggle
Với mã hóa thô sơ nhưng hữu ích, Xây dựng máy học Python từ đầu 📖
Bạn có muốn thực hiệnnhững bước đầu tiên trong lĩnh vực học máy không?
Những điều bạn cần biết để bắt đầu học máy Thư viện cơ bản và Tìm hiểu về các mô hình học máy thực tế! #Gấu trúc #Matplotlib #Seaborn
Ồ, anh đang nói về tôi à?
Học máy đang rất phổ biến hiện nay Tôi biết là tốt, nhưng Tôi thực sự không biết nên bắt đầu từ đâu .
Tôi đã học về máy học rồi Nó đang được áp dụng, nhưng Tôi không chắc mình có biết điều này đúng không .
Học máy: Tại sao nó lại quan trọng?
Học máy đang ngày càng trở nên quan trọng! Học máy là quá trình lập trình máy tính để học từ dữ liệu bằng nhiều thuật toán thống kê khác nhau. Nhân tiện, bạn có biết tại sao chúng ta sử dụng máy học không?
Ví dụ, hãy lấy trường hợp tạo bộ lọc để xử lý thư rác trong một dịch vụ bằng các kỹ thuật truyền thống. Trong trường hợp này, chúng ta sẽ tạo một bộ lọc thư rác như thế này:
Phát hiện các mẫu câu chứa các từ và cụm từ thường có trong thư rác, chẳng hạn như 'thẻ tín dụng', 'miễn phí', 'quảng cáo' và 'cho vay'.
Tạo thuật toán phát hiện mẫu câu để phân loại thư rác qua email.
Tiến hành thử nghiệm và đánh giá thuật toán.
Cách tiếp cận trên có vẻ đơn giản, nhưng khi vấn đề trở nên phức tạp hơn và số lượng quy tắc tăng lên, việc bảo trì sẽ trở nên khó khăn. Mặt khác, máy học có thể cải thiện đáng kể khả năng bảo trì và độ chính xác bằng cách tự động học các mẫu xuất hiện trong thư rác.
Vì vậy chúng tôi Bạn cần phải học về máy học!
Học máy học tập Còn nếu bạn cảm thấy khó khăn thì sao?
Khi công nghệ học máy ngày càng được biết đến rộng rãi và nhận được nhiều sự yêu thích, vô số khóa học liên quan đã xuất hiện. Tuy nhiên, hầu hết các khóa học này đều đi theo một mô hình tương tự, chỉ tập trung vào chủ đề hoặc khái niệm một cách cứng nhắc, thiếu giải thích về cách áp dụng và vận dụng công nghệ này vào thực tế.
Vì vậy, không giống như các bài giảng khác, bài giảng này không đi thẳng vào chủ đề về máy học. Thay vào đó, chúng ta sẽ tìm hiểu về các thư viện thực sự cần thiết trước khi thực sự thực hiện học máy, trong khi tự do xử lý trước và trực quan hóa dữ liệu thực , sau đó tìm hiểu về các khái niệm học máy tổng thể.
Để bạn có thể học máy một cách 'đúng cách'.
💡 Bạn có thể thiết lập hướng để bắt đầu học máy.
💡 Bạn có thể học những khái niệm cơ bản về máy học.
💡 Bạn có thể phát triển các khả năng cần thiết để phân tích ngoài việc học máy.
Dựa trên kiến thức chuyên môn tích lũy được trong nhiều năm, chúng tôi sẽ giúp bạn học máy hiệu quả. Bạn có muốn cùng chúng tôi thử học máy không?
Chú ý, những người này!
Trong phân tích dữ liệu Python Bất cứ ai quan tâm
Nghiên cứu về máy học Dành cho người mới bắt đầu
Tiền xử lý và xử lý dữ liệu Những người muốn học
Lý thuyết học máy Những người muốn xem lại
Hãy kiểm tra kiến thức chơi game của bạn!
Bạn nên biết ngữ pháp cơ bản của ngôn ngữ lập trình Python .
Bạn học được gì?
Kaggle
Gấu trúc
Matplotlib
Scikit-Learn
Trong bài giảng này Hãy xem những lợi ích.
Chỉ những thứ cần thiết thôi!
Nhiều sản phẩm khác trên thị trường Không giống như các bài giảng về máy học, Chỉ nội dung cần thiết Để tôi giới thiệu sơ qua cho bạn nhé.
Nâng cấp thông qua thực hành
Nó không dừng lại ở lý thuyết scikit-learn tích hợp sẵn và Sử dụng dữ liệu Kaggle Chúng tôi cung cấp đào tạo thực tế.
Học máy cho người mới bắt đầu
Biết những điều cơ bản của Python Phù hợp với trình độ người mới bắt đầu Không khó Bạn có thể học khái niệm này.
Phân tích dữ liệu nữa à?
Không chỉ là khái niệm học máy Cần thiết cho việc phân tích dữ liệu Sử dụng thư viện Chúng tôi cũng sẽ giới thiệu nó.
Để bạn có thể học máy một cách 'đúng cách'.
✅ Tôi sẽ hướng dẫn bạn các phương pháp học tập hiệu quả dựa trên kiến thức chuyên môn mà tôi đã tích lũy được thông qua việc học máy.
✅ Chúng tôi sẽ giúp bạn nhớ lại những khái niệm khó hiểu thông qua các bài giảng lý thuyết về các mô hình học máy tổng thể.
✅ Nếu bạn có bất kỳ thắc mắc nào trong quá trình học, vui lòng để lại câu hỏi. Tôi sẽ cố gắng giải đáp.
Học máy được xây dựng từ đầu, Chúng ta hãy học theo thứ tự nhé!
Tuần 1: Thiết lập Colab và trải nghiệm thực hành cơ bản với thư viện Pandas.
Tiền xử lý dữ liệu bằng thư viện Pandas
Tải và lưu dữ liệu
Loạt
Khung dữ liệu
Chọn và lọc các hàng và cột DataFrame
Xóa các hàng và cột DataFrame
Sửa đổi các hàng và cột DataFrame
Tuần 2: Cơ bản về Thư viện Pandas #2
Tiền xử lý dữ liệu bằng thư viện Pandas
Xem lại cách chọn và lọc các hàng và cột DataFrame
Xem lại việc xóa các hàng và cột DataFrame
Xem xét các sửa đổi hàng và cột của DataFrame
Tạo nhóm DataFrame
Xóa dữ liệu trùng lặp
Tìm NaN và thay đổi nó thành một giá trị khác
Sử dụng hàm apply
Trích xuất các giá trị duy nhất từ một cột và kiểm tra số
Hợp nhất hai DataFrame
Tuần 3: Trực quan hóa dữ liệu với Matplotlib và Thư viện Seaborn
Hiểu và tạo biểu đồ thanh
Hiểu và tạo biểu đồ hình tròn
Hiểu và tạo biểu đồ đường
Hiểu và tạo biểu đồ phân tán
Hiểu và tạo biểu đồ bản đồ nhiệt
Hiểu và tạo biểu đồ Histogram
Hiểu và tạo biểu đồ hộp
Tuần 4: Lý thuyết và thực hành hồi quy tuyến tính
Hồi quy tuyến tính là gì?
Đào tạo và chức năng chi phí của mô hình hồi quy tuyến tính
Phương pháp tối ưu hóa cho mô hình hồi quy tuyến tính
Giảm dần độ dốc hàng loạt
Giảm dần độ dốc ngẫu nhiên
Giảm dần độ dốc theo lô nhỏ
hồi quy đa thức
Mô hình tuyến tính có điều chỉnh
hồi quy Ridge
hồi quy Lasso
Mạng đàn hồi
Dừng sớm
Tuần 5: Lý thuyết và thực hành phân loại tuyến tính
Hồi quy logistic là gì?
Đào tạo và chức năng chi phí của mô hình hồi quy logistic
Máy vectơ hỗ trợ là gì?
Phân loại máy vectơ hỗ trợ
Phân loại lề cứng
Phân loại lề mềm
Tuần 6: Lý thuyết và thực hành mô hình cây quyết định
Mô hình cây quyết định là gì?
Học và trực quan hóa cây quyết định
Dự đoán
Ước tính xác suất lớp
Thuật toán đào tạo CART
Độ phức tạp tính toán
Tạp chất Genie hoặc entropy
các thông số điều chỉnh
trở lại
Tuần 7: Lý thuyết và thực hành mô hình tổng hợp
Mô hình tổng thể là gì?
Phân loại dựa trên bỏ phiếu
Đóng bao và dán
Đóng gói và dán trong scikit-learn
xếp hạng oob
Các bản vá ngẫu nhiên và không gian con ngẫu nhiên
Rừng ngẫu nhiên
Cây bổ sung
Tính năng quan trọng
Tăng cường
Adaboost
Tăng cường độ dốc
Xếp chồng
Tuần 8: Giới thiệu và phân tích dữ liệu Kaggle Tuần 9: Phân tích dữ liệu Kaggle
Xin lưu ý trước khi tham gia lớp học!
Trong khóa học này, chúng ta sẽ sử dụng Google Colab làm trình soạn thảo.
Để đảm bảo sự hiểu biết cân bằng giữa các khái niệm và ứng dụng , khóa học được thiết kế với tỷ lệ lý thuyết và thực hành 50/50 . Vui lòng kiểm tra chương trình giảng dạy để biết thông tin chi tiết.
Chúng tôi cung cấp tài liệu bài giảng thông qua blog của mình. Bạn có thể tìm thấy chúng tại liên kết sau. (Phím tắt)
Rất vui được gặp bạn! Giới thiệu mã hóa thô.
Hãy xem VLOG của chuyên gia chia sẻ kiến thức Rough Coding ngay nhé! 🐯
Khuyến nghị cho những người này
Khóa học này dành cho ai?
Bất cứ ai quan tâm đến học máy
người mới bắt đầu học máy
Bất cứ ai muốn học trực quan hóa Python
Bất cứ ai muốn tìm hiểu về tiền xử lý và xử lý dữ liệu
I'm even happier that you're satisfied~!!
As you said, all the lecture contents and source code for the lecture are all on the blog,
so if you get stuck while studying, please refer to the blog. Thank you!
I will always cheer you on as you study hard.
Thank you.
-Rough Coding Dream-
I was so satisfied with the mentoring with Mr. Geoun Coding that I decided to take this course as well. As expected, his teaching skills are great, and the class content is very informative! Thank you~! Please upload more lectures!!
Ah! You also took a lecture after the mentoring!
I will come back at the end of October for a lecture on personalized recommendation systems :)
-Rough Coding Dream-
Instructor
This is a question about pension data
Practice data url: https://drive.google.com/drive/folders/149jcCyJFKKG5MFaPNWnYYqM2EkzgRz2P?usp=sharing
Create a new data folder (machine_learning_data) and upload files
If you go to the above location, you will see a shared folder called "machine_learning_data",
but there are only jpg files and cvs files in it, and I could not find any files related to the lecture.
If I am looking for the wrong location, please let me know.
It was great that I could apply the basic grammar of Python to modeling and even case studies right in Kaggle! I can't believe this level of quality is available for free lectures.. I'm looking forward to the series of lectures :)