작성
·
941
0
1. 다크넷 사이트에 가보면 YOLOv3 뒤에 320, 416, 608과 같은 숫자가 있는데, 해당 숫자(n)가 input image를 (n x n)사이즈로 변환한 뒤 네트웍을 통과시키는 것을 의미하는지 궁금합니다. 또한 맞다면 input image의 사이즈에 따라 처리하는 속도가 달라지는 것인지, 아니라면 달라지는 것은 무엇인지 궁금합니다.
2. tiny YOLO가 YOLOv3-320, 416, 608과 다른 점이 무엇인지 알고싶습니다.
답변 1
0
안녕하십니까,
1. 320, 416, 608의 Network input image의 크기를 의미합니다. 320은 세로x가로 320x320을 의미하면 416, 608 역시 마찬가지 입니다. 그래서 Darknet network에 image를 입력 시 (보통은) 원본 이미지를 416x416 크기로 resize 한 뒤에 입력합니다. Darknet은 32의 배수 크기로 network 사이즈를 맞춰야 합니다.
이미지를 크게 할 수록 Detection 성능이 좋아집니다. 단점은 학습 시간이 오래 걸리고, 마찬가지로 inference도 오래 걸립니다.
2. tiny yolo는 yolo의 미니 버전입니다. 빠르게 inference를 하기 위해서 Network 모델을 간소화 하였습니다. yolo 보다 inference 속도는 더 빠르지만, 성능이 훨씬 떨어집니다.
감사합니다.