강의

멘토링

로드맵

Inflearn brand logo image
NEW
AI Development

/

Deep Learning & Machine Learning

Nhận diện hình ảnh và đối tượng dựa trên deep learning: Từ CNN đến YOLO·DETR

Khóa học này là quá trình học từng bước về nguyên lý nhận diện hình ảnh và đối tượng sử dụng deep learning từ cơ bản đến các mô hình mới nhất. - Xây dựng nền tảng: Hiểu về tensor và cấu trúc cơ bản của mạng neural với Pytorch - Hiểu về hình ảnh: Học khái niệm computer vision, cấu trúc dữ liệu hình ảnh, kỹ thuật tăng cường dữ liệu (Augmentation) - Học mô hình CNN: Thực hành phân loại hình ảnh với mạng neural tích chập (CNN) (CIFAR-10, v.v.) - Transfer Learning: Sử dụng các mô hình đã được huấn luyện sẵn để học nhanh với ít dữ liệu - Object Detection: Hiểu và thực hành các mô hình phát hiện đối tượng mới nhất như R-CNN, YOLO, SSD, DETR - Segmentation: Trải nghiệm phân đoạn đối tượng theo từng pixel thông qua U-Net, Mask R-CNN

21 học viên đang tham gia khóa học này

  • YoungJea Oh
실습 중심
AI 활용법
AI 코딩
yolo
detr
PyTorch
Computer Vision(CV)
CNN

Dịch cái này sang tiếng Việt

  • Hiểu nguyên lý phân loại hình ảnh và phát hiện đối tượng sử dụng deep learning

  • Khả năng triển khai và thực hành mô hình nhận dạng hình ảnh dựa trên PyTorch

  • Học tập công nghệ phân đoạn hình ảnh (U-Net, Mask R-CNN)

  • Hiểu về việc tinh chỉnh mô hình và các trường hợp ứng dụng sử dụng bộ dữ liệu thực tế

Lớp học chuyên sâu về nhận diện hình ảnh và đối tượng dựa trên Deep Learning mới nhất

Khóa học này là một chương trình tổng hợp với chủ đề triển khai mô hình nhận dạng hình ảnh và đối tượng dựa trên deep learning, bao quát một cách có hệ thống từ các khái niệm cơ bản đến những thành tựu nghiên cứu mới nhất. Học viên có thể học từng bước bằng cách sử dụng PyTorch để xử lý dữ liệu hình ảnh, hiểu và triển khai mạng nơ-ron tích chập (CNN), Transfer Learning, Object Detection, và Image Segmentation.

Trước tiên, chúng ta bắt đầu từ những kiến thức cơ bản về PyTorch, một framework deep learning. Chúng ta sẽ hiểu về cấu trúc và phép toán của Tensor, tính năng tự động vi phân, và sử dụng những kiến thức này để triển khai mạng neural cơ bản. Tiếp theo, chúng ta sẽ học về khái niệm Computer Vision, tìm hiểu về cấu trúc dữ liệu hình ảnh, phương thức biểu diễn màu sắc (RGB, RGBA), các kỹ thuật tăng cường dữ liệu (Augmentation), v.v. Thông qua việc này, chúng ta sẽ chuẩn bị để mô hình có thể học tập một cách vững chắc trong nhiều môi trường dữ liệu khác nhau.

Trong phần học tập mô hình chính thức, chúng ta sẽ tìm hiểu cấu trúc của CNN (Convolutional Neural Network) và các phép toán tích chập·pooling, khái niệm về Padding và Striding, đồng thời thực hành phân loại hình ảnh với các bộ dữ liệu thực tế như CIFAR-10. Sau đó, chúng ta sẽ hiểu về dòng phát triển của các kiến trúc chính như AlexNet, VGG, ResNet, EfficientNet và tìm hiểu phương pháp transfer learning sử dụng các mô hình đã được huấn luyện trước. Đặc biệt, thông qua thực hành transfer learning với bộ dữ liệu X-ray COVID-19, chúng ta sẽ phát triển khả năng ứng dụng thực tế.

Trong quá trình phát hiện đối tượng (Object Detection), chúng ta sẽ học so sánh các thuật toán đa dạng như dòng R-CNN (Fast/Faster/Mask R-CNN), YOLO (You Only Look Once), SSD (Single Shot Detector), DETR (Detection Transformer). Thông qua các đặc điểm cấu trúc của từng mô hình, sự khác biệt về tốc độ và độ chính xác, cũng như các trường hợp ứng dụng thực tế, bạn có thể hiểu được tiêu chí lựa chọn công nghệ. Chúng ta cũng sẽ cùng tìm hiểu các mô hình mới nhất như YOLOv11, DETR để có thể theo kịp xu hướng phát triển nhanh chóng của lĩnh vực phát hiện đối tượng.

Cuối cùng, chúng ta sẽ học kỹ thuật Segmentation. Bạn sẽ tìm hiểu sự khác biệt giữa Semantic Segmentation, Instance Segmentation và Panoptic Segmentation, đồng thời trải nghiệm việc phân đoạn đối tượng theo từng pixel thông qua thực hành với U-Net và Mask R-CNN. Khóa học cũng đề cập đến các ứng dụng trong nhiều lĩnh vực khác nhau như phân tích hình ảnh y tế, xe tự hành, hình ảnh vệ tinh, giúp bạn hiểu được cách các mô hình đã học được áp dụng trong thực tế tại các hiện trường công nghiệp.

Khóa học này không chỉ dừng lại ở việc liệt kê các lý thuyết, mà được tiến hành theo cách thực hành trực tiếp bằng cách chạy code trong môi trường Google Colab. Do đó, sau khi hoàn thành khóa học, học viên sẽ có được năng lực thực tế để xử lý dataset thực tế và xây dựng·huấn luyện·đánh giá mô hình.

👉 Thông qua khóa học này, học viên có thể hiểu hoàn toàn pipeline cốt lõi của computer vision theo trình tự "phân loại hình ảnh → phát hiện đối tượng → phân đoạn" và có được khả năng ứng dụng các mô hình deep learning mới nhất.

Tôi khuyến nghị cho những người như thế này

Những người nên học khóa học này (1)

  • Những người tò mò về deep learning và computer vision nhưng không biết bắt đầu từ đâu

  • Những người muốn học một cách có hệ thống từ đầu các khái niệm như CNN, transfer learning, object detection

Ai nên học khóa học này (2)

  • Những người muốn sử dụng PyTorch để trực tiếp triển khai mô hình với bộ dữ liệu thực tế

  • Không chỉ học lý thuyết đơn thuần mà muốn học theo hướng thực hành để có thể "kiểm tra bằng code"

Những người nên học khóa học này (3)

  • Những người muốn áp dụng các mô hình phát hiện đối tượng mới nhất (YOLO, DETR, v.v.) và kỹ thuật phân đoạn vào thực tế công việc

  • Sinh viên, nhà phát triển, nhà nghiên cứu đang cân nhắc mở rộng sự nghiệp sang lĩnh vực AI/Machine Learning

Sau khi hoàn thành khóa học

  • Bạn có thể trực tiếp triển khai pipeline cốt lõi của computer vision từ phân loại hình ảnh → phát hiện đối tượng → phân đoạn dựa trên deep learning.

  • Bạn sẽ trải nghiệm toàn bộ quá trình sử dụng PyTorch để tải dữ liệu thực tế, huấn luyện, đánh giá và cải thiện mô hình.

  • Vượt ra ngoài việc hiểu lý thuyết đơn thuần, bạn sẽ có được năng lực thực tiễn để áp dụng các mô hình phát hiện đối tượng hiện đại như YOLO·DETR.

  • Bạn sẽ có được khả năng ứng dụng có thể áp dụng trong nhiều lĩnh vực công nghiệp khác nhau như hình ảnh y tế, xe tự hành, hình ảnh vệ tinh, v.v.

  • Bạn có thể thêm mã thực hành và kết quả dự án do chính mình viết vào portfolio để tạo ra điểm mạnh trong việc tìm kiếm việc làm hoặc hoạt động nghiên cứu.

Đặc điểm của khóa học này

Hãy giới thiệu các tính năng cốt lõi và điểm khác biệt.

특징이미지_1

Điểm mạnh cốt lõi của khóa học này (1)

  • Tập trung vào thực hành: Không chỉ dừng lại ở lý thuyết mà thực hành trực tiếp bằng cách viết code trong môi trường Google Colab.

  • Giải thích dễ hiểu và có hệ thống: Từ cơ bản PyTorch đến CNN, phát hiện đối tượng, phân đoạn được học từng bước một cách có hệ thống, người mới bắt đầu cũng có thể dễ dàng theo kịp.

  • Bao gồm các mô hình mới nhất: Bao gồm các thành tựu nghiên cứu mới nhất như YOLO, DETR, không bỏ lỡ xu hướng phát triển nhanh chóng của computer vision.

Điểm mạnh cốt lõi của khóa học này (2)

  • Cân bằng giữa lý thuyết và thực hành: Trước tiên hiểu các lý thuyết cơ bản như khái niệm tích chập và pooling của CNN, sau đó thực hành với các bộ dữ liệu thực tế.

  • Kết nối với thực tế: Đề cập đến các trường hợp có thể ứng dụng trong thực tế công nghiệp như hình ảnh y tế, lái xe tự động, phân tích hình ảnh vệ tinh.

  • Có thể tạo portfolio: Thông qua các kết quả thực hành, bạn có thể xây dựng portfolio cá nhân giúp ích trực tiếp cho việc tìm kiếm việc làm và nghiên cứu.

Bạn sẽ học những nội dung như thế này

Người tạo ra khóa học này - Oh Young Je

  • 2019 ~ hiện tại: Giảng viên chuyên ngành trí tuệ nhân tạo

  • 2001~2019: Phát triển và vận hành IT tại hiện trường

  • 2020~hiện tại: Đang giảng dạy trực tuyến/trực tiếp

  • Inflearn đang vận hành 14 khóa học về trí tuệ nhân tạo

Những lưu ý trước khi học

Môi trường thực hành

  • Khóa học sử dụng Google Colab nên có thể tiến hành không phân biệt Windows hay MacOS.


Tài liệu học tập

  • Tôi sẽ cung cấp cho bạn file pdf và link github!

Kiến thức tiên quyết và lưu ý

  • Cú pháp Python cơ bản

  • Kiến thức cơ bản về Machine Learning

  • Khóa học này dành cho đối tượng trình độ trung cấp.

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • Người học muốn tìm hiểu kiến thức cơ bản về AI·Deep Learning và bắt đầu với Computer Vision

  • Các nhà phát triển và nghiên cứu muốn áp dụng mô hình nhận dạng hình ảnh/đối tượng vào thực tế

  • Sinh viên đại học (và sau đại học), sinh viên mới vào phòng thí nghiệm và những người học lần đầu tiếp xúc với computer vision

  • Những người làm việc thực tế muốn mở rộng từ lĩnh vực khoa học dữ liệu/machine learning sang ứng dụng computer vision

Cần biết trước khi bắt đầu?

  • Cơ bản lập trình Python

  • Kiến thức cơ bản về phép toán vector và ma trận

  • Các khái niệm cơ bản về Machine Learning

Xin chào
Đây là

3,688

Học viên

276

Đánh giá

135

Trả lời

4.7

Xếp hạng

15

Các khóa học

오랜 개발 경험을 가지고 있는 Senior Developer 입니다. 현대건설 전산실, 삼성 SDS, 전자상거래업체 엑스메트릭스, 씨티은행 전산부를 거치며 30 년 이상 IT 분야에서 쌓아온 지식과 경험을 나누고 싶습니다. 현재는 인공지능과 파이썬 관련 강의를 하고 있습니다.

홈페이지 주소:

https://ironmanciti.github.io/

Chương trình giảng dạy

Tất cả

44 bài giảng ∙ (11giờ 5phút)

Tài liệu khóa học:

Tài liệu bài giảng
Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Chưa có đủ đánh giá.
Hãy trở thành tác giả của một đánh giá giúp mọi người!

Ưu đãi có thời hạn, kết thúc sau 4 ngày ngày

23.100 ₫

70%

1.614.287 ₫

Khóa học khác của YoungJea Oh

Hãy khám phá các khóa học khác của giảng viên!

Khóa học tương tự

Khám phá các khóa học khác trong cùng lĩnh vực!