작성
·
228
0
답변 1
1
안녕하십니까,
1. 학습 과정에서 매칭 전략이 IOU 0.5 이상이라고 되어 있는데, 8732개의 바운딩 박스를 NMS(IOU 0.5)를 거치고 나온 바운딩 박스들을 ground truth와의 IOU를 계산하여 0.5를 넘기지 않는 바운딩 박스들을 걸러서 학습시키는 것으로 이해를 했습니다.
=> 학습과정은 NMS를 수행하지 않습니다. NMS는 Inference시에만 수행됩니다.
NMS를 수행하지 않으면 학습 모델이 anchor box에서 내놓는 예측 bbox가 비슷한 object에 대해서 매우 많아지게 됩니다. 이를 NMS로 제거합니다.
2. 학습과정이 아닌 inferencing과정에서 본다면 ground truth가 없으니 NMS과정만 거치고 나서 결과를 내뱉는 게 맞는 것인가요?
=> 네, 맞습니다.
3. 마지막으로 질문이 있는데 바운딩 박스들의 구성요소가 class들에 대한 소프트맥스 값 + x, y, w, h로 이루어지는데 좌표는 offset이라고 하셨는데 단위가 0~1사이라고 한다면, 다른 크기에서 뽑은 것인데 그냥 바로 8732개로 합쳐버린다면 이 박스가 38*38에서 온 것인지 10*10에서 온 것인지 모르는데 알맞은 비교나 inference시 원본 사이즈로 복구되는 원리가 궁금합니다.