강의

멘토링

로드맵

Inflearn brand logo image
NEW
AI Development

/

Deep Learning & Machine Learning

Deep Learning-Based Image and Object Recognition: From CNN to YOLO and DETR

This course is a step-by-step learning process that covers the principles of image and object recognition using deep learning, from fundamentals to the latest models. - Building Foundations: Understanding tensors and basic neural network structures with PyTorch - Understanding Images: Learning computer vision concepts, image data structures, and augmentation techniques - CNN Model Training: Hands-on image classification practice with Convolutional Neural Networks (CNN) using datasets like CIFAR-10 - Transfer Learning: Leveraging pre-trained models to achieve fast learning with limited data - Object Detection: Understanding and practicing with the latest object detection models including R-CNN, YOLO, SSD, DETR - Segmentation: Experiencing pixel-level object segmentation through U-Net and Mask R-CNN

12 learners are taking this course

  • trimurti
실습 중심
AI 활용법
AI 코딩
yolo
detr
PyTorch
Computer Vision(CV)
CNN

What you will learn!

  • Understanding the Principles of Image Classification and Object Detection Using Deep Learning

  • PyTorch-based image recognition model implementation and hands-on practice skills

  • Image Segmentation Technology Acquisition (U-Net, Mask R-CNN)

  • Understanding Model Fine-tuning and Application Cases Using Real Datasets

최신 딥러닝 기반 이미지·객체 인식 마스터 클래스

이 강의는 딥러닝 기반 이미지·객체 인식 모델 구현을 주제로, 기초 개념부터 최신 연구 성과까지 체계적으로 다루는 종합 과정입니다. 수강생은 파이토치(PyTorch)를 활용하여 이미지 데이터 처리, 합성곱 신경망(CNN) 이해 및 구현, 전이 학습(Transfer Learning), 객체 탐지(Object Detection), 이미지 세그멘테이션(Segmentation)까지 단계적으로 학습할 수 있습니다.

우선, 딥러닝 프레임워크인 파이토치 기초부터 시작합니다. 텐서(Tensor)의 구조와 연산, 자동 미분 기능을 이해하고, 이를 활용해 기본 신경망을 구현해 봅니다. 이어서 컴퓨터 비전(Computer Vision)의 개념을 배우며, 이미지 데이터 구조, 색상 표현 방식(RGB, RGBA), 이미지 증강(Augmentation) 기법 등을 학습합니다. 이를 통해 모델이 다양한 데이터 환경에서 견고하게 학습되도록 준비합니다.

본격적인 모델 학습 파트에서는 CNN(Convolutional Neural Network)의 구조와 합성곱·풀링 연산, 패딩(Padding)과 스트라이딩(Striding)의 개념을 익히고 CIFAR-10과 같은 실제 데이터셋으로 이미지 분류를 실습합니다. 이후 AlexNet, VGG, ResNet, EfficientNet 등 주요 아키텍처의 발전 흐름을 이해하고, 사전 학습된 모델을 활용한 전이 학습 방법을 다룹니다. 특히 COVID-19 X-ray 데이터셋을 활용한 전이 학습 실습을 통해 실무 적용 능력을 기릅니다.

객체 탐지(Object Detection) 과정에서는 R-CNN 계열(Fast/Faster/Mask R-CNN), YOLO(You Only Look Once), SSD(Single Shot Detector), DETR(Detection Transformer) 등 다양한 알고리즘을 비교 학습합니다. 각 모델의 구조적 특징, 속도와 정확도 차이, 그리고 실제 적용 사례를 통해 기술 선택의 기준을 이해할 수 있습니다. 최신 YOLOv11, DETR과 같은 모델도 함께 다루어, 빠르게 발전하는 객체 탐지 분야의 흐름을 따라잡을 수 있습니다.

마지막으로 세그멘테이션(Segmentation) 기법을 학습합니다. Semantic Segmentation, Instance Segmentation, Panoptic Segmentation의 차이를 배우고, U-Net과 Mask R-CNN을 활용한 실습을 통해 픽셀 단위 객체 분할을 경험합니다. 의료 영상 분석, 자율주행, 위성 이미지 등 다양한 분야 응용도 다루어, 학습한 모델이 실제 산업 현장에서 어떻게 활용되는지 알 수 있습니다.

이 강의는 단순히 이론을 나열하는 데 그치지 않고, 구글 코랩(Google Colab) 환경에서 직접 코드를 실행하고 실습하는 방식으로 진행됩니다. 따라서 수강생은 강의를 마친 후, 실제 데이터셋을 다루고 모델을 구축·학습·평가할 수 있는 실무 역량을 갖추게 됩니다.

👉 본 과정을 통해 수강생은 “이미지 분류 → 객체 탐지 → 세그멘테이션”으로 이어지는 컴퓨터 비전의 핵심 파이프라인을 완전히 이해하고, 최신 딥러닝 모델을 응용할 수 있는 능력을 확보할 수 있습니다.

이런 분들께 추천해요

이 강의를 들어야 하는 분 (1)

  • 딥러닝과 컴퓨터 비전이 궁금하지만 어디서부터 시작해야 할지 막막한 분

  • CNN, 전이 학습, 객체 탐지 같은 개념을 처음부터 체계적으로 배우고 싶은 분

이 강의를 들어야 하는 분 (2)

  • PyTorch를 활용해 실제 데이터셋으로 모델을 직접 구현해보고 싶은 분

  • 단순 이론이 아니라 실습 중심으로 배워서 “코드로 확인”하고 싶은 분

이 강의를 들어야 하는 분 (3)

  • 최신 객체 탐지 모델(YOLO, DETR 등)과 세그멘테이션 기법을 실무에 적용해보고 싶은 분

  • AI/머신러닝 분야로 커리어 확장을 고민하는 학생, 개발자, 연구자

수강 후에는

  • 딥러닝 기반 이미지 분류 → 객체 탐지 → 세그멘테이션까지 컴퓨터 비전의 핵심 파이프라인을 직접 구현할 수 있습니다.

  • PyTorch를 활용해 실제 데이터셋을 불러오고, 모델을 학습·평가·개선하는 전 과정을 경험하게 됩니다.

  • 단순 이론 이해를 넘어, YOLO·DETR 등 최신 객체 탐지 모델을 적용할 수 있는 실무 역량을 갖추게 됩니다.

  • 의료 영상, 자율주행, 위성 이미지 등 다양한 산업 분야에 활용 가능한 응용 능력을 얻게 됩니다.

  • 직접 작성한 실습 코드와 프로젝트 결과물을 포트폴리오에 추가하여, 취업이나 연구 활동에서 강점을 만들 수 있습니다.

이 강의의 특징

핵심 특징과 차별점을 소개해보세요.

특징이미지_1

이 강의의 핵심 강점 (1)

  • 실습 중심: 이론에 머무르지 않고 Google Colab 환경에서 직접 코드를 작성하며 실습합니다.

  • 쉽고 체계적인 설명: PyTorch 기초부터 CNN, 객체 탐지, 세그멘테이션까지 단계적으로 배워 초보자도 쉽게 따라올 수 있습니다.

  • 최신 모델까지 다룸: YOLO, DETR 등 최신 연구 성과를 포함해, 빠르게 발전하는 컴퓨터 비전 흐름을 놓치지 않습니다.

이 강의의 핵심 강점 (2)

  • 이론과 실습의 균형: CNN의 합성곱·풀링 개념 같은 기본 이론을 먼저 이해하고, 이어서 실제 데이터셋으로 실습합니다.

  • 실무와 연결: 의료 영상, 자율주행, 위성 이미지 분석 등 산업 현장에서 활용 가능한 사례를 다룹니다.

  • 포트폴리오 제작 가능: 실습 결과물을 통해 개인 포트폴리오를 구성할 수 있어 취업·연구에 직접적인 도움이 됩니다.

이런 내용을 배워요

이 강의를 만든 사람 - 오영제

  • 2019 ~ 현재: 전문 인공지능 강사

  • 2001~2019: 현장에서 IT 개발 및 운영

  • 2020~현재 : 온/오프라인 강의 중

  • Inflearn 에 인공 지능 강의 14 개 과정 운영 중

수강 전 참고 사항

실습 환경

  • 강의는 Google Colab 을 사용하므로 Windows, MacOS 무관하게 진행 가능합니다.


학습 자료

  • pdf 파일과 github 링크로 제공해 드립니다!

선수 지식 및 유의사항

  • 기본적인 파이썬 문법

  • 머신러닝 기초 지식

  • 이 과정은 중급자 대상 과정입니다.

Recommended for
these people

Who is this course right for?

  • Learners who want to learn AI and deep learning fundamentals and get started with computer vision

  • Developers and researchers who want to apply image/object recognition models to real-world applications

  • University (graduate) students, new lab members, and other learners who are first encountering computer vision

  • Practitioners who want to expand beyond data science/machine learning into computer vision applications

Need to know before starting?

  • Python Programming Basics

  • Vector and Matrix Operations Fundamentals

  • Machine Learning Basic Concepts

Hello
This is

3,662

Learners

273

Reviews

135

Answers

4.7

Rating

15

Courses

오랜 개발 경험을 가지고 있는 Senior Developer 입니다. 현대건설 전산실, 삼성 SDS, 전자상거래업체 엑스메트릭스, 씨티은행 전산부를 거치며 30 년 이상 IT 분야에서 쌓아온 지식과 경험을 나누고 싶습니다. 현재는 인공지능과 파이썬 관련 강의를 하고 있습니다.

홈페이지 주소:

https://ironmanciti.github.io/

Curriculum

All

44 lectures ∙ (11hr 5min)

Course Materials:

Lecture resources
Published: 
Last updated: 

Reviews

Not enough reviews.
Please write a valuable review that helps everyone!

Limited time deal

$18.70

68%

$59.40

trimurti's other courses

Check out other courses by the instructor!

Similar courses

Explore other courses in the same field!