작성
·
158
0
spp net, fast rcnn에서 한쪽 라인에서는 vgg를 다른 라인은 region proposal을 거쳐서 특징을 추출하는게 이게 원본 이미지에서 그럴싸한 물체의 위치를 인식하고 뽑아내는거자나요..? regin proposal은 원본 이미지를 통해 위치를 선정한건데, vgg를 거쳐서 나온 다수의 채널에서 어떻게 매칭을 시키는지가 궁금합니다~!
답변 1
0
안녕하십니까
원본 이미지의 Region proposal 영역(사각형 width x height)은 VGG를 거쳐서 나온 Feature map의 영역(사각형 width x height, 채널은 모든 채널)에 Scale down하여 매핑하게 됩니다.
가령 원본 이미지 224 x 224이고 region prosal이 중심 좌표 cx, cy, width, height 에 있고, VGG 최종 feature map이 원본 이미지의 1/16 사이즈로 줄어서 14x14 이라면 feature map 에서 region proposal 매핑은 원본 이미지 픽셀의 1/16으로 매핑합니다. 즉 feature map에서의 region proposal 매핑은 cx/16, cy/16, width/16, height/16이 됩니다(물론 offset 보정 계수는 존재합니다.)
감사합니다.