inflearn logo
강의

Course

Instructor

Latest deep learning technology and object recognition

YOLOv3 (2) Performance Improvement +FPNs, Nearest Neighbor

yolo anchor box 질문

Resolved

337

sh0331

6 asked

0

 안녕하세요 질문있어서 남깁니다.

input 이미지를 backbone을 거치고 정보가 함축된 이미지 feature map을 만든 후 cell별 anchor box를 통해 Detection을 진행하는걸로 이해했는데요,

실제 이미지는 feature map과 스케일이 다를텐데, 그러면 최종 결과 이미지에서는 이 값(x,y,w,h)을 보정한 최적 bounding box 값을 출력하는 건가요?

 

 

 

딥러닝 컴퓨터-비전

Answer 2

1

dlbro

안녕하세요.

좋은 질문입니다.

실제 Yolo의 위치 정보는 0~1의 스케일로 annotation 되어 있습니다.

이 후 이미지 크기에 맞춰 스케일이 변형되어 bounding box 위치를 알려줍니다!

 

감사합니다.

1

communityai8509

안녕하세요, 인프런 AI 인턴입니다.
딥러닝 기술과 객체인식과 관련된 사용자님의 질문에 답변 드리겠습니다.

말씀하신 것처럼 YOLO(You Only Look Once)와 같은 객체 인식 알고리즘에서는 입력 이미지를 통과시킨 후 얻은 feature map 상에서 각 cell에 대응하는 예측 bounding box들을 생성합니다. 이 때 각 예측 box는 anchor box를 기준으로 하여 위치(x,y), 너비(w), 높이(h) 등이 예측됩니다.

실제 이미지와 feature map의 스케일이 다른 점을 고려해야 합니다. 따라서, 알고리즘은 feature map 상의 예측 값들을 실제 이미지 스케일로 변환해야 합니다. 이 변환 과정을 통해 실제 이미지 상에서의 최적화된 bounding box 좌표가 계산되며, 이 좌표들이 객체의 위치와 크기를 나타내게 됩니다.

변환 과정은 일반적으로 feature map 상의 상대적 위치와 크기를 실제 이미지의 절대적인 스케일로 옮기는 작업을 포함합니다. 이를 위해 anchor box의 초기 설정값이 사용되며, 신경망을 통해 얻은 예측값에 따라 anchor box 값들이 조정되어 최종 bounding box 값으로 출력됩니다.

실제 예측 과정에서는 네트워크의 출력을 post-processing 단계에서 처리하여 최종 bounding box의 위치와 크기를 조정합니다. 이러한 과정을 통해 객체의 정확한 위치를 이미지 상에서 찾아내게 됩니다.

import torch가 안되는 경우는 어떻게 하나요?

0

16

1

소리가 겹쳐서 들려요

0

20

2

20강에서 파인튜닝 때 사용한 데이터가 없어졌습니다. LoRA Trainer 매개변수도 라이브러리 업그레이드로 수정되었습니다.

0

20

1

[개정판] 딥러닝 컴퓨터 비전 완벽 가이드 먼저? 구현하며 배우는 Transformer 먼저?

0

30

1

수업자료

0

23

2

전 강의와 전혀 이어지지가 않음

0

30

1

pytorch local 설치 옵션에 conda 가 없습니다.

0

38

3

pc에서는 괜찮은데 탭으로 들으니 화면확대시 화면이 까맙니다

0

22

1

강의 환경설정 질문

0

40

2

모든 자료 다운로드 누를때마다 똑같은 excel파일이 다운로드 받아짐. 노션 주소 공유되나요?

0

31

2

오토인코더+ Knn, SVC 로 해석하는경우

0

45

3

강의자료에 소스코드가 없는데요

0

49

3

강화학습저장 및 로드

0

57

1

카메라달린 자동차가 특정물체를 계속 따라가는 주행을 하게하기위한 학습으로 Yolo4를 이용해야하는 학교 과제가 있어서 질문드립니다.

0

64

2

질문하나 있습니당

0

110

1

강의자료

0

126

2

Yolov6 실습 에러

0

197

2

yolov4 bifpn

1

295

2

YOLOv1(2) 모델 + GoogLeNet~~ 관련 질문

0

196

1

평가 지표 실습(4) IoU와 mAP 질문

0

359

2

평가 지표 실습 (3) PR curve와 mAP 질문

0

291

1

프레임워크

0

428

1

transductive learning & inductive learning

1

453

1

YOLOv4 Receptive field관련 질문

1

364

1