Bạn có thể phân tích dữ liệu mà không cần viết mã!
💭 Bạn đã bao giờ nghĩ về điều này chưa?
"Tôi cảm thấy chóng mặt khi nhìn vào đoạn mã Python triển khai công nghệ máy học."
"Tôi đã nghe rất nhiều về hồi quy tuyến tính, thuật toán K-means, v.v., nhưng tôi không biết chính xác chúng là gì."
"Tôi muốn trực quan hóa dữ liệu theo cách đơn giản, nhưng tôi có cần phải học lập trình trước không?"
"Tôi muốn viết một bài báo cáo tốt ở trường, nhưng tôi không có đủ thời gian để học."
"Tôi hy vọng kết quả sẽ sớm được công bố."
Khóa học này dành cho những ai tò mò và muốn tìm hiểu về học máy nhưng không muốn học ngôn ngữ lập trình dạng văn bản. Bạn cũng có thể dễ dàng phân tích dữ liệu được thu thập trong quá trình học tập hoặc trong cuộc sống hàng ngày. Bạn sẽ được tìm hiểu về cách thu thập, trực quan hóa và phân tích dữ liệu số, hình ảnh và văn bản, cũng như những kiến thức cơ bản về lý thuyết học máy và các chỉ số đánh giá. Trong dự án cuối kỳ, bạn sẽ trực quan hóa và phân tích dữ liệu thực tế - số ca nhiễm COVID-19 được xác nhận.
💻 Bạn có thể học ngay cả khi không hiểu mã hóa văn bản.
Ở đây, một widget tròn tương đương với một hàm.
Với quy trình làm việc đơn giản như thế này:
1. Tải hình ảnh và nhúng nó (trích xuất các tính năng và chuyển đổi chúng thành các giá trị số có thể tính toán được),
2. Đào tạo được thực hiện bằng các thuật toán học tập kNN, Random Forest và Logistic Regression.
3. Bạn có thể kiểm tra kết quả học tập.

Orange3 có thể không đặc biệt đẹp mắt, nhưng nó cung cấp nhiều tính năng trực quan hóa. Thậm chí có thể sử dụng chỉ với vài thao tác kéo và thả. Hình ảnh bên dưới là ví dụ về hình ảnh động thể hiện sự thay đổi số ca nhiễm được xác nhận theo thời gian.


▲ Ngoài cách sử dụng công cụ Orange3, chúng tôi còn cung cấp các giải thích chi tiết khi cần hiểu các khái niệm cơ bản.

▲ Đây là bài tập phân tích văn bản. Các từ thường gặp sẽ được xác định dưới dạng đám mây từ và được xử lý sơ bộ.
✔️ Học những điều như thế này
• Công cụ phân tích dữ liệu Orange3 (chạy trong môi trường Windows )
• Tạo một tệp CSV đơn giản bằng Excel hoặc Notepad
• Nếu bạn có kiến thức về Python, bạn có thể tạo và sử dụng widget của riêng mình. Tuy nhiên, bài giảng này không đề cập đến điều này.
😎 Bài giảng này!
• Chúng tôi sẽ tiến hành chậm rãi để bạn có thể thực hiện các bài tập từng bước ngay từ đầu.
• Công cụ Orange3 có giao diện trực quan, dễ hiểu.
• Trong những lĩnh vực cần giải thích khái niệm, các bài giảng lý thuyết đã được bổ sung.
• Cuối cùng, chúng tôi trình bày các trường hợp ứng dụng thực tế bằng cách phân tích dữ liệu COVID-19.
📂 Giới thiệu tài liệu bài giảng
• Loại: Cung cấp một số tập dữ liệu được sử dụng trong bài giảng.
• Khẩu phần ăn:
1. Dữ liệu thực hành hồi quy tuyến tính (train.csv, test.csv)
2. Dữ liệu phân loại và nhóm hình ảnh (20 bức tranh của Monet và Manet và 15 bức tranh của các nghệ sĩ khác)
3. Phân cụm và phân loại dữ liệu văn bản (20 tệp văn bản bài phát biểu của Kennedy)
4. 1 dữ liệu về số ca mắc COVID-19 được xác nhận

🔍 Trước khi tham gia lớp học, tôi có một số câu hỏi!
H. Sinh viên không chuyên ngành cũng có thể tham gia khóa học này không?
Có. Bất kỳ ai, kể cả những người không chuyên ngành và những người đang học tiểu học, đều có thể tham gia khóa học.
H. Nếu ngay cả học sinh tiểu học cũng làm được thì trình độ bài giảng có phải là quá thấp không?
Điều này có nghĩa là ngay cả học sinh tiểu học cũng có thể làm theo. Nội dung học tập sẽ khác nhau đáng kể tùy thuộc vào năng lực của mỗi học sinh. Bạn càng tìm hiểu sâu, bạn càng có thể làm được nhiều hơn.
H. Học Orange3 có lợi ích gì?
Bạn sẽ được học các khái niệm cơ bản về phân tích dữ liệu và học máy. Kết quả có sẵn trong vòng vài giây hoặc vài phút, giúp bạn dễ dàng áp dụng vào nhiều lĩnh vực khác nhau.
H. Bạn đặc biệt muốn giới thiệu ai?
Khóa học này đặc biệt được khuyến nghị cho học sinh trung học cơ sở và trung học phổ thông muốn phân tích dữ liệu thực tế theo nhiều cách khác nhau, và cho giáo viên muốn giảng dạy AI theo cách dễ hiểu cho học sinh. Ngay cả sinh viên chuyên ngành khoa học xã hội nhân văn cũng có thể phân tích dữ liệu. Khóa học này cũng rất được khuyến khích cho những ai cảm thấy việc lập trình văn bản là một thử thách.
H. Tôi có cần chuẩn bị gì trước khi tham dự buổi thuyết trình không?
Tất cả những gì bạn cần là một chiếc máy tính, một con chuột và một chút đam mê. Bạn có thể đọc một bài giới thiệu ngắn gọn về các nguyên lý học máy hoặc xem một video ngắn.
H. Nội dung bài học được trình bày ở mức độ nào?
Khóa học bao gồm mọi thứ, từ nguyên lý của các mô hình hồi quy tuyến tính đơn giản đến các chỉ số đánh giá cho học có giám sát, giới thiệu về các công cụ trực quan hóa và các nguyên tắc cơ bản của xử lý dữ liệu hình ảnh và văn bản. Ngay cả việc chỉ học những kiến thức cơ bản cũng sẽ mang lại kết quả đáng kể. Orange3 chỉ đơn giản là một công cụ giúp bạn thể hiện năng lực của mình.
Xin lưu ý khi tham gia lớp học!
- Orange3 có sẵn cho Windows, macOS và Linux, vì vậy bạn có thể cài đặt riêng. Tuy nhiên, bài giảng này được ghi lại trên Windows 10 Professional và không có hướng dẫn riêng cho macOS hoặc Linux.
- Bài giảng này được viết dựa trên hướng dẫn bằng tiếng Anh do Orange3 phân phối, trang web chính thức và GitHub chính thức.
- Nghiêm cấm sử dụng cho mục đích thương mại hoặc phân phối trái phép nội dung và tài liệu lớp học.
- Chúng tôi sẽ kiểm tra các câu hỏi bạn gửi mỗi tuần một lần và trả lời chúng hàng loạt.