작성
·
531
0
안녕하세요
https://pjreddie.com/darknet/yolo/
해당 사이트에 있는 yolov3-320, 416, 608 weight들 값은 다 다르게 훈련된 파일인가요? 그런데 내부 cfg는 608로 고정이 되어 있어서 어떻게 된지 궁금하네요
opencv 실습에서 416으로 resize 하는데, multi-scale training을 한 것이니 사실은 416이 굳이 아니어도 320, 608 모두 넣어도 되는 것 아닌가요??
답변 2
1
안녕하십니까,
1. 해당 사이트에 있는 yolov3-320, 416, 608 weight들 값은 다 다르게 훈련된 파일인가요? 그런데 내부 cfg는 608로 고정이 되어 있어서 어떻게 된지 궁금하네요
=> 음, 말씀하신대로 608로 고정이 되어 있군요. 저도 처음 알았습니다.
config를 기반으로 모델을 다시 만들거면 width, height를 이미지 사이즈에 맞춘 다음에 weight를 로딩해야 할 것 같습니다. 모델을 새로 만들게 아니면 width,height는 필요가 없는걸로 보입니다.
2. opencv 실습에서 416으로 resize 하는데, multi-scale training을 한 것이니 사실은 416이 굳이 아니어도 320, 608 모두 넣어도 되는 것 아닌가요??
=> 해보진 않았는데, 320또는 608로 resize로 한 이미지를 넣어도 되지 않을까 싶습니다.
3. yolo는 하나의 anchor box에 대해서 multi-label을 classifiy 하는게 기본적인 구조인가요?
논문에는 그렇게 나와 있는데, 굳이 그렇게 까지 해서 성능향상이 크게 될지는 개인적으로 의문이긴 합니다. 그래서 논문을 구현한 여러 구현 코드들을 보면 최종에서 multi label Logistic Regression을 적용하지 않고 softmax로 적용한 코드들도 많습니다.
감사합니다.
0