• 카테고리

    질문 & 답변
  • 세부 분야

    컴퓨터 비전

  • 해결 여부

    미해결

YOLO 다양한 버전 관련 질문드립니다

21.09.01 15:50 작성 조회수 786

0

1. 다크넷 사이트에 가보면 YOLOv3 뒤에 320, 416, 608과 같은 숫자가 있는데, 해당 숫자(n)가 input image를 (n x n)사이즈로 변환한 뒤 네트웍을 통과시키는 것을 의미하는지 궁금합니다. 또한 맞다면 input image의 사이즈에 따라 처리하는 속도가 달라지는 것인지, 아니라면 달라지는 것은 무엇인지 궁금합니다.

2. tiny YOLO가 YOLOv3-320, 416, 608과 다른 점이 무엇인지 알고싶습니다.

답변 1

답변을 작성해보세요.

0

안녕하십니까, 

1. 320, 416, 608의 Network input image의 크기를 의미합니다. 320은 세로x가로 320x320을 의미하면 416, 608 역시 마찬가지 입니다. 그래서 Darknet network에 image를 입력 시 (보통은) 원본 이미지를 416x416 크기로 resize 한 뒤에 입력합니다.  Darknet은 32의 배수 크기로 network 사이즈를 맞춰야 합니다.

이미지를 크게 할 수록 Detection 성능이 좋아집니다. 단점은 학습 시간이 오래 걸리고, 마찬가지로 inference도 오래 걸립니다. 

2. tiny yolo는 yolo의 미니 버전입니다. 빠르게 inference를 하기 위해서 Network 모델을 간소화 하였습니다.  yolo 보다 inference 속도는 더 빠르지만, 성능이 훨씬 떨어집니다. 

감사합니다.