PyTorch Computer Vision thực chiến: Hướng dẫn hoàn chỉnh từ CNN đến DETR mới nhất

Bạn đang cảm thấy bế tắc trong việc áp dụng vào thực tế và chuẩn bị phỏng vấn đúng không? Bằng cách đúc kết những kinh nghiệm thực tiễn của mình, tôi sẽ giúp bạn nắm vững kiến thức từ CNN đến DETR một cách chắc chắn thông qua việc tập trung vào mã nguồn (code).

(5.0) 7 đánh giá

95 học viên

Độ khó Trung cấp trở lên

Thời gian Không giới hạn

PyTorch
PyTorch
Computer Vision(CV)
Computer Vision(CV)
CNN
CNN
PyTorch
PyTorch
Computer Vision(CV)
Computer Vision(CV)
CNN
CNN

Đánh giá từ những học viên đầu tiên

5.0

5.0

Star Gu

100% đã tham gia

Đó là một buổi học rất bổ ích với những lời giải thích tận tình và chi tiết!!!

5.0

sunny75

100% đã tham gia

25/09/17/수 21:50 Sau khi nghe bài giảng, tôi đã hiểu rất nhiều về nhận diện đối tượng. Tôi luôn tò mò về cách nhận diện khi xem các video nhận diện đối tượng... Thầy đã tạo ra một bài giảng thực sự tuyệt vời. Tôi thường không nghe bài giảng vào các ngày trong tuần. Nhưng bài giảng này tôi đã nghe cả vào ngày thường. ^^;; Cảm ơn thầy đã tạo ra bài giảng hay như vậy.

5.0

원래그런거임

27% đã tham gia

Tôi là sinh viên đang học tại khoa liên quan đến thị giác máy tính. Bài giảng rất tỉ mỉ và quan trọng nhất là giải thích chi tiết để không còn phần nào mơ hồ, điều này đã giúp ích rất nhiều cho tôi. Trong quá trình học, tôi cũng bắt đầu quan tâm đến các khóa học khác. Tuy nhiên, mức giá của khóa học khá cao nên với tư cách là sinh viên thì thực sự là gánh nặng. Về phần video, ngoài nhận diện đối tượng, nếu có thêm các cập nhật về nhiều công nghệ thị giác máy tính khác nhau thì sẽ càng tốt hơn. Tôi sẽ tiếp tục học tập chăm chỉ những bài giảng còn lại. Cảm ơn thầy đã tạo ra khóa học tuyệt vời.

Bạn sẽ nhận được điều này sau khi học.

  • Năng lực thiết kế và tối ưu hóa mô hình CNN hiệu suất cao dựa trên PyTorch

  • Khả năng triển khai thực tế các thuật toán phát hiện vật thể mới nhất như YOLO, DETR, v.v.

  • Kỹ thuật giải quyết vấn đề sử dụng tăng cường dữ liệu và học chuyển tiếp

  • Thực hành phân đoạn (segmentation) chính xác dựa trên U-Net và Mask R-CNN

Lớp học chuyên sâu về nhận diện hình ảnh và đối tượng dựa trên Deep Learning mới nhất

Khóa học này là một chương trình tổng hợp bao quát một cách hệ thống từ các khái niệm cơ bản đến những thành tựu nghiên cứu mới nhất với chủ đề triển khai mô hình nhận diện hình ảnh và đối tượng dựa trên học sâu (deep learning). Học viên có thể học theo từng bước từ xử lý dữ liệu hình ảnh, hiểu và triển khai mạng thần kinh tích chập (CNN), học chuyển tiếp (Transfer Learning), phát hiện đối tượng (Object Detection) cho đến phân đoạn hình ảnh (Segmentation) bằng cách sử dụng PyTorch.

Đầu tiên, chúng ta sẽ bắt đầu từ những kiến thức cơ bản về PyTorch, một framework học sâu. Bạn sẽ được tìm hiểu về cấu trúc và các phép toán của Tensor, tính năng tự động tính đạo hàm (Autograd), và thực hành triển khai một mạng thần kinh cơ bản bằng cách sử dụng các kiến thức này. Tiếp theo, chúng ta sẽ học các khái niệm về Thị giác máy tính (Computer Vision), bao gồm cấu trúc dữ liệu hình ảnh, các phương thức biểu diễn màu sắc (RGB, RGBA), và các kỹ thuật tăng cường dữ liệu (Augmentation). Thông qua đó, bạn sẽ chuẩn bị để mô hình có thể học tập một cách mạnh mẽ trong các môi trường dữ liệu đa dạng.

Trong phần huấn luyện mô hình thực tế, chúng ta sẽ tìm hiểu về cấu trúc của CNN (Convolutional Neural Network), các phép toán tích chập (convolution) và pooling, khái niệm padding và striding, đồng thời thực hành phân loại hình ảnh với các bộ dữ liệu thực tế như CIFAR-10. Sau đó, chúng ta sẽ tìm hiểu về dòng chảy phát triển của các kiến trúc chính như AlexNet, VGG, ResNet, EfficientNet và đề cập đến phương pháp học chuyển tiếp (transfer learning) sử dụng các mô hình đã được huấn luyện trước. Đặc biệt, thông qua bài thực hành học chuyển tiếp sử dụng bộ dữ liệu X-ray COVID-19, người học sẽ được rèn luyện khả năng ứng dụng vào thực tiễn.

Trong khóa học về Phát hiện đối tượng (Object Detection), chúng ta sẽ học so sánh các thuật toán đa dạng như dòng R-CNN (Fast/Faster/Mask R-CNN), YOLO (You Only Look Once), SSD (Single Shot Detector) và DETR (Detection Transformer). Thông qua đặc điểm cấu trúc, sự khác biệt về tốc độ và độ chính xác, cũng như các ví dụ ứng dụng thực tế của từng mô hình, bạn có thể hiểu được tiêu chí để lựa chọn công nghệ. Các mô hình mới nhất như YOLOv11 và DETR cũng sẽ được đề cập, giúp bạn bắt kịp xu hướng phát triển nhanh chóng của lĩnh vực phát hiện đối tượng.

Cuối cùng, bạn sẽ được học về kỹ thuật phân đoạn hình ảnh (Segmentation). Bạn sẽ tìm hiểu sự khác biệt giữa Semantic Segmentation, Instance Segmentation và Panoptic Segmentation, đồng thời trải nghiệm việc phân đoạn đối tượng ở cấp độ pixel thông qua các bài thực hành sử dụng U-Net và Mask R-CNN. Khóa học cũng đề cập đến các ứng dụng trong nhiều lĩnh vực khác nhau như phân tích hình ảnh y tế, lái xe tự hành và hình ảnh vệ tinh, giúp bạn hiểu rõ cách các mô hình đã học được ứng dụng trong thực tế ngành công nghiệp như thế nào.

Khóa học này không chỉ dừng lại ở việc liệt kê lý thuyết đơn thuần mà được tiến hành theo phương thức thực hành và chạy mã trực tiếp trong môi trường Google Colab. Do đó, sau khi hoàn thành khóa học, học viên sẽ trang bị được năng lực thực tiễn để có thể xử lý các bộ dữ liệu thực tế, cũng như xây dựng, huấn luyện và đánh giá mô hình.

👉 Thông qua khóa học này, học viên có thể hiểu rõ hoàn toàn quy trình cốt lõi của thị giác máy tính từ “Phân loại hình ảnh → Phát hiện vật thể → Phân đoạn hình ảnh”, đồng thời có được khả năng ứng dụng các mô hình học sâu mới nhất.

Dành cho những người sau đây

Những người nên tham gia khóa học này (1)

  • Những người tò mò về Deep Learning và Computer Vision nhưng chưa biết phải bắt đầu từ đâu

  • Những người muốn học một cách hệ thống các khái niệm như CNN, Transfer Learning (học chuyển tiếp) và Object Detection (phát hiện đối tượng) ngay từ đầu.

Những ai nên tham gia khóa học này (2)

  • Những người muốn trực tiếp triển khai mô hình bằng bộ dữ liệu thực tế bằng cách sử dụng PyTorch

  • Những người muốn học tập trung vào thực hành thay vì chỉ lý thuyết suông để có thể "xác nhận bằng mã nguồn"

Những ai nên tham gia khóa học này (3)

  • Những người muốn áp dụng các mô hình phát hiện đối tượng mới nhất (YOLO, DETR, v.v.) và kỹ thuật phân đoạn (segmentation) vào thực tế.

  • Sinh viên, nhà phát triển, nhà nghiên cứu đang cân nhắc mở rộng sự nghiệp sang lĩnh vực AI/Machine Learning

Sau khi hoàn thành khóa học, bạn có thể

  • Bạn có thể trực tiếp triển khai các pipeline cốt lõi của thị giác máy tính từ phân loại hình ảnh → phát hiện đối tượng → phân đoạn hình ảnh dựa trên học sâu.

  • Bạn sẽ được trải nghiệm toàn bộ quy trình sử dụng PyTorch để tải các tập dữ liệu thực tế, huấn luyện, đánh giá và cải thiện mô hình.

  • Vượt xa việc hiểu lý thuyết đơn thuần, bạn sẽ được trang bị năng lực thực tiễn để áp dụng các mô hình phát hiện đối tượng mới nhất như YOLO, DETR.

  • Bạn sẽ có được khả năng ứng dụng có thể sử dụng trong nhiều lĩnh vực công nghiệp khác nhau như hình ảnh y tế, tự lái, hình ảnh vệ tinh, v.v.

  • Bằng cách thêm mã thực hành và kết quả dự án do chính tay bạn thực hiện vào portfolio, bạn có thể tạo ra lợi thế cạnh tranh trong việc tìm việc làm hoặc các hoạt động nghiên cứu.

Đặc điểm của bài giảng này

Hãy giới thiệu những đặc điểm cốt lõi và điểm khác biệt.

특징이미지_1

Điểm mạnh cốt lõi của bài giảng này (1)

  • Trọng tâm thực hành: Không chỉ dừng lại ở lý thuyết, bạn sẽ trực tiếp viết mã và thực hành trong môi trường Google Colab.

  • Giải thích dễ hiểu và hệ thống: Học từng bước từ cơ bản về PyTorch đến CNN, phát hiện đối tượng (Object Detection) và phân đoạn hình ảnh (Segmentation), giúp ngay cả người mới bắt đầu cũng có thể dễ dàng theo kịp.

  • Cập nhật các mô hình mới nhất: Bao gồm các thành tựu nghiên cứu mới nhất như YOLO, DETR, giúp bạn không bỏ lỡ dòng chảy phát triển nhanh chóng của thị giác máy tính.

Điểm mạnh cốt lõi của bài giảng này (2)

  • Sự cân bằng giữa lý thuyết và thực hành: Trước tiên, bạn sẽ hiểu các lý thuyết cơ bản như khái niệm tích chập (convolution) và pooling của CNN, sau đó thực hành với các bộ dữ liệu thực tế.

  • Kết nối với thực tiễn: Khóa học đề cập đến các ví dụ có thể ứng dụng trong thực tế công nghiệp như hình ảnh y tế, tự lái, phân tích ảnh vệ tinh.

  • Có thể xây dựng hồ sơ năng lực (portfolio): Bạn có thể xây dựng portfolio cá nhân thông qua các sản phẩm thực hành, giúp ích trực tiếp cho việc tìm việc làm và nghiên cứu.

Nội dung bạn sẽ học

Người tạo ra bài giảng này - Oh Young-je

  • 2019 ~ Hiện tại: Giảng viên trí tuệ nhân tạo chuyên nghiệp

  • 2001~2019: Phát triển và vận hành IT tại hiện trường

  • 2020~hiện tại : Đang giảng dạy online/offline

  • Đang vận hành 14 khóa học về trí tuệ nhân tạo trên Inflearn

Lưu ý trước khi khóa học bắt đầu

Môi trường thực hành

  • Bài giảng sử dụng Google Colab nên có thể tiến hành bất kể là Windows hay MacOS.


Tài liệu học tập

  • Được cung cấp dưới dạng tệp pdf và liên kết github!

Kiến thức tiên quyết và lưu ý

  • Ngữ pháp Python cơ bản

  • Kiến thức cơ bản về Machine Learning

  • Khóa học này dành cho những người ở trình độ trung cấp.

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • Người học cần một danh mục dự án (portfolio) về thị giác máy tính ở cấp độ thực tế thay vì chỉ dừng lại ở lý thuyết.

  • Sinh viên mới tốt nghiệp đang chuẩn bị cho phỏng vấn kỹ thuật Deep Learning và chứng minh năng lực thực tế.

  • Nhà phát triển đang làm việc thực tế cần trực tiếp áp dụng mô hình nhận diện hình ảnh vào dịch vụ

  • Những người mơ ước trở thành kỹ sư thị giác máy tính chuyên nghiệp sau khi học xong cơ bản về PyTorch

Cần biết trước khi bắt đầu?

  • Cơ bản về lập trình Python

  • Kiến thức cơ bản về phép toán vectơ và ma trận

  • Các khái niệm cơ bản về học máy

Xin chào
Đây là YoungJea Oh

4,676

Học viên

422

Đánh giá

158

Trả lời

4.7

Xếp hạng

18

Các khóa học

Tôi là một Senior Developer với nhiều năm kinh nghiệm phát triển. Tôi muốn chia sẻ những kiến thức và kinh nghiệm đã tích lũy được trong lĩnh vực IT suốt hơn 30 năm qua, từng làm việc tại phòng máy tính của Hyundai Engineering & Construction, Samsung SDS, công ty thương mại điện tử Xmetrics và bộ phận máy tính của Citibank. Hiện tại, tôi đang giảng dạy về Trí tuệ nhân tạo và Python.

Địa chỉ trang chủ:

https://ironmanciti.github.io/

Thêm

Chương trình giảng dạy

Tất cả

44 bài giảng ∙ (11giờ 5phút)

Tài liệu khóa học:

Tài liệu bài giảng
Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Tất cả

7 đánh giá

5.0

7 đánh giá

  • jyj1206님의 프로필 이미지
    jyj1206

    Đánh giá 2

    Đánh giá trung bình 5.0

    Đã chỉnh sửa

    5

    27% đã tham gia

    Tôi là sinh viên đang học tại khoa liên quan đến thị giác máy tính. Bài giảng rất tỉ mỉ và quan trọng nhất là giải thích chi tiết để không còn phần nào mơ hồ, điều này đã giúp ích rất nhiều cho tôi. Trong quá trình học, tôi cũng bắt đầu quan tâm đến các khóa học khác. Tuy nhiên, mức giá của khóa học khá cao nên với tư cách là sinh viên thì thực sự là gánh nặng. Về phần video, ngoài nhận diện đối tượng, nếu có thêm các cập nhật về nhiều công nghệ thị giác máy tính khác nhau thì sẽ càng tốt hơn. Tôi sẽ tiếp tục học tập chăm chỉ những bài giảng còn lại. Cảm ơn thầy đã tạo ra khóa học tuyệt vời.

    • trimurti
      Giảng viên

      Cảm ơn bạn đã đánh giá tốt. Nếu bạn là sinh viên và gặp khó khăn về chi phí, hãy cho tôi biết khóa học nào bạn muốn xem, tôi sẽ gửi mã giảm giá cho bạn.

  • starirene95758님의 프로필 이미지
    starirene95758

    Đánh giá 9

    Đánh giá trung bình 4.6

    5

    100% đã tham gia

    Đó là một buổi học rất bổ ích với những lời giải thích tận tình và chi tiết!!!

    • aceoftop1975님의 프로필 이미지
      aceoftop1975

      Đánh giá 121

      Đánh giá trung bình 5.0

      5

      100% đã tham gia

      25/09/17/수 21:50 Sau khi nghe bài giảng, tôi đã hiểu rất nhiều về nhận diện đối tượng. Tôi luôn tò mò về cách nhận diện khi xem các video nhận diện đối tượng... Thầy đã tạo ra một bài giảng thực sự tuyệt vời. Tôi thường không nghe bài giảng vào các ngày trong tuần. Nhưng bài giảng này tôi đã nghe cả vào ngày thường. ^^;; Cảm ơn thầy đã tạo ra bài giảng hay như vậy.

      • trimurti
        Giảng viên

        Cảm ơn bạn đã để lại đánh giá tốt về khóa học.

    • lovesome994824님의 프로필 이미지
      lovesome994824

      Đánh giá 3

      Đánh giá trung bình 3.7

      5

      61% đã tham gia

      Thật sự đã rất lâu rồi tôi mới tìm được một khóa học cần thiết cho mình như thế này Thay vì những quan điểm toán học phức tạp và khó hiểu, việc trình bày tập trung vào code khiến tôi cảm thấy thông suốt. Có thể học nhanh về CNN là gì và cách sử dụng nó như thế nào Thời gian mấy tháng qua xem đủ thứ sách và khóa học online thật là phí phạm Nếu có thêm bonus về công việc gán nhãn hình ảnh một cách đơn giản thì đây sẽ là khóa học vision tuyệt vời nhất cho nhiều người đang băn khoăn về vision

      • trimurti
        Giảng viên

        Cảm ơn bạn đã đánh giá tốt. Tôi cũng sẽ xem xét những lời khuyên bạn đưa ra cho việc cập nhật bài giảng tiếp theo.

    • yonsoo6259님의 프로필 이미지
      yonsoo6259

      Đánh giá 14

      Đánh giá trung bình 5.0

      5

      32% đã tham gia

      Khóa học khác của YoungJea Oh

      Hãy khám phá các khóa học khác của giảng viên!

      Khóa học tương tự

      Khám phá các khóa học khác trong cùng lĩnh vực!