강의

멘토링

커뮤니티

AI Technology

/

Deep Learning & Machine Learning

Nhận diện hình ảnh và đối tượng dựa trên deep learning: Từ CNN đến YOLO·DETR

Khóa học này là quá trình học từng bước về nguyên lý nhận diện hình ảnh và đối tượng sử dụng deep learning từ cơ bản đến các mô hình mới nhất. - Xây dựng nền tảng: Hiểu về tensor và cấu trúc cơ bản của mạng neural với Pytorch - Hiểu về hình ảnh: Học khái niệm computer vision, cấu trúc dữ liệu hình ảnh, kỹ thuật tăng cường dữ liệu (Augmentation) - Học mô hình CNN: Thực hành phân loại hình ảnh với mạng neural tích chập (CNN) (CIFAR-10, v.v.) - Transfer Learning: Sử dụng các mô hình đã được huấn luyện sẵn để học nhanh với ít dữ liệu - Object Detection: Hiểu và thực hành các mô hình phát hiện đối tượng mới nhất như R-CNN, YOLO, SSD, DETR - Segmentation: Trải nghiệm phân đoạn đối tượng theo từng pixel thông qua U-Net, Mask R-CNN

(5.0) 3 đánh giá

65 học viên

  • YoungJea Oh
실습 중심
AI 활용법
AI 코딩
yolo
detr
PyTorch
Computer Vision(CV)
CNN

Đánh giá từ những học viên đầu tiên

Bạn sẽ nhận được điều này sau khi học.

  • Hiểu nguyên lý phân loại hình ảnh và phát hiện đối tượng sử dụng deep learning

  • Khả năng triển khai và thực hành mô hình nhận dạng hình ảnh dựa trên PyTorch

  • Học tập công nghệ phân đoạn hình ảnh (U-Net, Mask R-CNN)

  • Hiểu về việc tinh chỉnh mô hình và các trường hợp ứng dụng sử dụng bộ dữ liệu thực tế

Lớp học chuyên sâu về nhận diện hình ảnh và đối tượng dựa trên Deep Learning mới nhất

Khóa học này là một chương trình tổng hợp với chủ đề triển khai mô hình nhận dạng hình ảnh và đối tượng dựa trên deep learning, bao quát một cách có hệ thống từ các khái niệm cơ bản đến những thành tựu nghiên cứu mới nhất. Học viên có thể học từng bước bằng cách sử dụng PyTorch để xử lý dữ liệu hình ảnh, hiểu và triển khai mạng nơ-ron tích chập (CNN), Transfer Learning, Object Detection, và Image Segmentation.

Trước tiên, chúng ta bắt đầu từ những kiến thức cơ bản về PyTorch, một framework deep learning. Chúng ta sẽ hiểu về cấu trúc và phép toán của Tensor, tính năng tự động vi phân, và sử dụng những kiến thức này để triển khai mạng neural cơ bản. Tiếp theo, chúng ta sẽ học về khái niệm Computer Vision, tìm hiểu về cấu trúc dữ liệu hình ảnh, phương thức biểu diễn màu sắc (RGB, RGBA), các kỹ thuật tăng cường dữ liệu (Augmentation), v.v. Thông qua việc này, chúng ta sẽ chuẩn bị để mô hình có thể học tập một cách vững chắc trong nhiều môi trường dữ liệu khác nhau.

Trong phần học tập mô hình chính thức, chúng ta sẽ tìm hiểu cấu trúc của CNN (Convolutional Neural Network) và các phép toán tích chập·pooling, khái niệm về Padding và Striding, đồng thời thực hành phân loại hình ảnh với các bộ dữ liệu thực tế như CIFAR-10. Sau đó, chúng ta sẽ hiểu về dòng phát triển của các kiến trúc chính như AlexNet, VGG, ResNet, EfficientNet và tìm hiểu phương pháp transfer learning sử dụng các mô hình đã được huấn luyện trước. Đặc biệt, thông qua thực hành transfer learning với bộ dữ liệu X-ray COVID-19, chúng ta sẽ phát triển khả năng ứng dụng thực tế.

Trong quá trình phát hiện đối tượng (Object Detection), chúng ta sẽ học so sánh các thuật toán đa dạng như dòng R-CNN (Fast/Faster/Mask R-CNN), YOLO (You Only Look Once), SSD (Single Shot Detector), DETR (Detection Transformer). Thông qua các đặc điểm cấu trúc của từng mô hình, sự khác biệt về tốc độ và độ chính xác, cũng như các trường hợp ứng dụng thực tế, bạn có thể hiểu được tiêu chí lựa chọn công nghệ. Chúng ta cũng sẽ cùng tìm hiểu các mô hình mới nhất như YOLOv11, DETR để có thể theo kịp xu hướng phát triển nhanh chóng của lĩnh vực phát hiện đối tượng.

Cuối cùng, chúng ta sẽ học kỹ thuật Segmentation. Bạn sẽ tìm hiểu sự khác biệt giữa Semantic Segmentation, Instance Segmentation và Panoptic Segmentation, đồng thời trải nghiệm việc phân đoạn đối tượng theo từng pixel thông qua thực hành với U-Net và Mask R-CNN. Khóa học cũng đề cập đến các ứng dụng trong nhiều lĩnh vực khác nhau như phân tích hình ảnh y tế, xe tự hành, hình ảnh vệ tinh, giúp bạn hiểu được cách các mô hình đã học được áp dụng trong thực tế tại các hiện trường công nghiệp.

Khóa học này không chỉ dừng lại ở việc liệt kê các lý thuyết, mà được tiến hành theo cách thực hành trực tiếp bằng cách chạy code trong môi trường Google Colab. Do đó, sau khi hoàn thành khóa học, học viên sẽ có được năng lực thực tế để xử lý dataset thực tế và xây dựng·huấn luyện·đánh giá mô hình.

👉 Thông qua khóa học này, học viên có thể hiểu hoàn toàn pipeline cốt lõi của computer vision theo trình tự "phân loại hình ảnh → phát hiện đối tượng → phân đoạn" và có được khả năng ứng dụng các mô hình deep learning mới nhất.

Tôi khuyến nghị cho những người như thế này

Những người nên học khóa học này (1)

  • Những người tò mò về deep learning và computer vision nhưng không biết bắt đầu từ đâu

  • Những người muốn học một cách có hệ thống từ đầu các khái niệm như CNN, transfer learning, object detection

Ai nên học khóa học này (2)

  • Những người muốn sử dụng PyTorch để trực tiếp triển khai mô hình với bộ dữ liệu thực tế

  • Không chỉ học lý thuyết đơn thuần mà muốn học theo hướng thực hành để có thể "kiểm tra bằng code"

Những người nên học khóa học này (3)

  • Những người muốn áp dụng các mô hình phát hiện đối tượng mới nhất (YOLO, DETR, v.v.) và kỹ thuật phân đoạn vào thực tế công việc

  • Sinh viên, nhà phát triển, nhà nghiên cứu đang cân nhắc mở rộng sự nghiệp sang lĩnh vực AI/Machine Learning

Sau khi hoàn thành khóa học

  • Bạn có thể trực tiếp triển khai pipeline cốt lõi của computer vision từ phân loại hình ảnh → phát hiện đối tượng → phân đoạn dựa trên deep learning.

  • Bạn sẽ trải nghiệm toàn bộ quá trình sử dụng PyTorch để tải dữ liệu thực tế, huấn luyện, đánh giá và cải thiện mô hình.

  • Vượt ra ngoài việc hiểu lý thuyết đơn thuần, bạn sẽ có được năng lực thực tiễn để áp dụng các mô hình phát hiện đối tượng hiện đại như YOLO·DETR.

  • Bạn sẽ có được khả năng ứng dụng có thể áp dụng trong nhiều lĩnh vực công nghiệp khác nhau như hình ảnh y tế, xe tự hành, hình ảnh vệ tinh, v.v.

  • Bạn có thể thêm mã thực hành và kết quả dự án do chính mình viết vào portfolio để tạo ra điểm mạnh trong việc tìm kiếm việc làm hoặc hoạt động nghiên cứu.

Đặc điểm của khóa học này

Hãy giới thiệu các tính năng cốt lõi và điểm khác biệt.

특징이미지_1

Điểm mạnh cốt lõi của khóa học này (1)

  • Tập trung vào thực hành: Không chỉ dừng lại ở lý thuyết mà thực hành trực tiếp bằng cách viết code trong môi trường Google Colab.

  • Giải thích dễ hiểu và có hệ thống: Từ cơ bản PyTorch đến CNN, phát hiện đối tượng, phân đoạn được học từng bước một cách có hệ thống, người mới bắt đầu cũng có thể dễ dàng theo kịp.

  • Bao gồm các mô hình mới nhất: Bao gồm các thành tựu nghiên cứu mới nhất như YOLO, DETR, không bỏ lỡ xu hướng phát triển nhanh chóng của computer vision.

Điểm mạnh cốt lõi của khóa học này (2)

  • Cân bằng giữa lý thuyết và thực hành: Trước tiên hiểu các lý thuyết cơ bản như khái niệm tích chập và pooling của CNN, sau đó thực hành với các bộ dữ liệu thực tế.

  • Kết nối với thực tế: Đề cập đến các trường hợp có thể ứng dụng trong thực tế công nghiệp như hình ảnh y tế, lái xe tự động, phân tích hình ảnh vệ tinh.

  • Có thể tạo portfolio: Thông qua các kết quả thực hành, bạn có thể xây dựng portfolio cá nhân giúp ích trực tiếp cho việc tìm kiếm việc làm và nghiên cứu.

Bạn sẽ học những nội dung như thế này

Người tạo ra khóa học này - Oh Young Je

  • 2019 ~ hiện tại: Giảng viên chuyên ngành trí tuệ nhân tạo

  • 2001~2019: Phát triển và vận hành IT tại hiện trường

  • 2020~hiện tại: Đang giảng dạy trực tuyến/trực tiếp

  • Inflearn đang vận hành 14 khóa học về trí tuệ nhân tạo

Những lưu ý trước khi học

Môi trường thực hành

  • Khóa học sử dụng Google Colab nên có thể tiến hành không phân biệt Windows hay MacOS.


Tài liệu học tập

  • Tôi sẽ cung cấp cho bạn file pdf và link github!

Kiến thức tiên quyết và lưu ý

  • Cú pháp Python cơ bản

  • Kiến thức cơ bản về Machine Learning

  • Khóa học này dành cho đối tượng trình độ trung cấp.

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • Người học muốn tìm hiểu kiến thức cơ bản về AI·Deep Learning và bắt đầu với Computer Vision

  • Các nhà phát triển và nghiên cứu muốn áp dụng mô hình nhận dạng hình ảnh/đối tượng vào thực tế

  • Sinh viên đại học (và sau đại học), sinh viên mới vào phòng thí nghiệm và những người học lần đầu tiếp xúc với computer vision

  • Những người làm việc thực tế muốn mở rộng từ lĩnh vực khoa học dữ liệu/machine learning sang ứng dụng computer vision

Cần biết trước khi bắt đầu?

  • Cơ bản lập trình Python

  • Kiến thức cơ bản về phép toán vector và ma trận

  • Các khái niệm cơ bản về Machine Learning

Xin chào
Đây là

4,100

Học viên

349

Đánh giá

149

Trả lời

4.7

Xếp hạng

15

Các khóa học

오랜 개발 경험을 가지고 있는 Senior Developer 입니다. 현대건설 전산실, 삼성 SDS, 전자상거래업체 엑스메트릭스, 씨티은행 전산부를 거치며 30 년 이상 IT 분야에서 쌓아온 지식과 경험을 나누고 싶습니다. 현재는 인공지능과 파이썬 관련 강의를 하고 있습니다.

홈페이지 주소:

https://ironmanciti.github.io/

Chương trình giảng dạy

Tất cả

44 bài giảng ∙ (11giờ 5phút)

Tài liệu khóa học:

Tài liệu bài giảng
Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Tất cả

3 đánh giá

5.0

3 đánh giá

  • sunny75님의 프로필 이미지
    sunny75

    Đánh giá 113

    Đánh giá trung bình 5.0

    5

    100% đã tham gia

    25/09/17/수 21:50 강의를 듣고, 객체인식에 대해 많이 이해 했습니다. 항상 객체인식하는 동영상을 볼때, 어떻게 인식하는 지 궁금했는데... 정말 좋은 강의 만드셨네요. 전 평일엔 강의를 잘 듣지 않는데요. 이 강의를 평일에도 들었네요. ^^;; 좋은 강의 만들어 주셔서 감사합니다.

    • YoungJea Oh
      Giảng viên

      좋은 수강평 감사합니다.

  • 원래그런거임님의 프로필 이미지
    원래그런거임

    Đánh giá 2

    Đánh giá trung bình 5.0

    Đã chỉnh sửa

    5

    27% đã tham gia

    저는 컴퓨터 비전 관련 학과에서 공부하고 있는 대학생입니다. 강의가 세심하고, 무엇보다 애매한 부분이 남지 않도록 상세하게 설명해 주셔서 큰 도움이 되었습니다. 수강하면서 다른 강의에도 흥미가 생겼습니다. 다만, 강의의 가격대가 다소 높아 학생으로서는 부담이 되는 것이 사실입니다. 영상 관련하여 객체 인식 외에도 다양한 컴퓨터 비전 기술들에 대한 추가 업데이트가 있다면 더욱 좋을 것 같습니다. 남은 강의도 꾸준히 열심히 수강하겠습니다. 훌륭한 강의를 만들어 주셔서 감사합니다.

    • YoungJea Oh
      Giảng viên

      좋은 평가 주셔서 감사합니다. 혹시 학생으로서 비용 부담 있으신 경우 보고 싶은 강의를 알려 주시면 할인 쿠폰 보내 드리겠습니다.

  • lovesome99님의 프로필 이미지
    lovesome99

    Đánh giá 3

    Đánh giá trung bình 3.7

    5

    61% đã tham gia

    정말 오랜만에 저에게 필요한 강의를 찾았네요 이런 저런 복잡하고 어려운 수학적 관점보다는 코드 중심으로 보여주어 속이 시원합니다. cnn이 뭔지 어떻게 활용하는지에 대해 빠르게 학습할 수 있습니다 몇달간 이런 저런 책과 인강을 봤던 시간이 너무 아깝네요 보너스로 이미지 라벨링 작업 등을 간단하게 넣어주셨으면 비전으로 고민하는 많은 사람들에게 최고의 비전강의가 아닐까 합니다

    • YoungJea Oh
      Giảng viên

      좋은 평가 주셔서 감사합니다. 조언해 주신 부분도 다음 강의 업데이트에 고려하겠습니다.

Ưu đãi có thời hạn, kết thúc sau 7 ngày ngày

58.300 ₫

24%

1.609.913 ₫

Khóa học khác của YoungJea Oh

Hãy khám phá các khóa học khác của giảng viên!

Khóa học tương tự

Khám phá các khóa học khác trong cùng lĩnh vực!