YOLO 다양한 버전 관련 질문드립니다

인프런 커뮤니티 질문&답변

김남욱

작성한 질문수

[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

OpenCV DNN으로 YOLO Inference 실습 - 02

작성

1. 다크넷 사이트에 가보면 YOLOv3 뒤에 320, 416, 608과 같은 숫자가 있는데, 해당 숫자(n)가 input image를 (n x n)사이즈로 변환한 뒤 네트웍을 통과시키는 것을 의미하는지 궁금합니다. 또한 맞다면 input image의 사이즈에 따라 처리하는 속도가 달라지는 것인지, 아니라면 달라지는 것은 무엇인지 궁금합니다.

2. tiny YOLO가 YOLOv3-320, 416, 608과 다른 점이 무엇인지 알고싶습니다.

머신러닝 배워볼래요? tensorflow keras 딥러닝 python 컴퓨터-비전

답변 1

권 철민

지식공유자

안녕하십니까,

1. 320, 416, 608의 Network input image의 크기를 의미합니다. 320은 세로x가로 320x320을 의미하면 416, 608 역시 마찬가지 입니다. 그래서 Darknet network에 image를 입력 시 (보통은) 원본 이미지를 416x416 크기로 resize 한 뒤에 입력합니다. Darknet은 32의 배수 크기로 network 사이즈를 맞춰야 합니다.

이미지를 크게 할 수록 Detection 성능이 좋아집니다. 단점은 학습 시간이 오래 걸리고, 마찬가지로 inference도 오래 걸립니다.

2. tiny yolo는 yolo의 미니 버전입니다. 빠르게 inference를 하기 위해서 Network 모델을 간소화 하였습니다. yolo 보다 inference 속도는 더 빠르지만, 성능이 훨씬 떨어집니다.

감사합니다.

김남욱

작성한 질문수

전체 Q&A

질문하기