작성
·
225
0
질문이 2개 있습니다.
1. 첫 번째 질문은 기존의 Spatial Pyramid Pooling은 Feature Map에서 위치 정보를 같이 가져가기 위해 분할한 후 Max Pooling을 적용하는 것으로 이해했습니다. 이를 RCNN에서는 Feature Map 내부의 Feature에 Spatial Pyramid Pooling 을 적용한 것이고요. 이렇게 이해하는 것이 맞나요?
2. 두 번째 질문은 원본이미지에서 Selective Search는 따로 work하여 Feature Map에 연결시킨다고 이해했습니다. 근데 Feature Map은 이미 크기가 작아져 있는 상태이지만 Selective Search 같은 경우에는 원본 이미지에 Bounding box를 한 상태일 텐데, 어떻게 Feature Map에 Mapping(connect) 시킬 수 있는지 궁금합니다.
즉, Selective Search에서 나오는 coordinate와 Feature Map에 Mapping하는 coordinate와 다를텐데 어떻게 연결지어지나요..?
답변 1
0
안녕하십니까,
1. 첫 번째 질문은 기존의 Spatial Pyramid Pooling은 Feature Map에서 위치 정보를 같이 가져가기 위해 분할한 후 Max Pooling을 적용하는 것으로 이해했습니다. 이를 RCNN에서는 Feature Map 내부의 Feature에 Spatial Pyramid Pooling 을 적용한 것이고요. 이렇게 이해하는 것이 맞나요?
=> 음, RCNN은 아니고, Fast-RCNN입니다. 서로 다른 Feature Map 사이즈를 하나의 벡터 형태로 맞추기 위해서 Spatial Pyramid Pooling형태로 MaxPooling을 적용해서 ROI Pooling을 적용한 것입니다.
2. 즉, Selective Search에서 나오는 coordinate와 Feature Map에 Mapping하는 coordinate와 다를텐데 어떻게 연결지어지나요..?
=> 이건, feature map 사이즈로 줄어드는 사이즈만큼 Selective search에서 나오는 coordinate를 같은 비율로 줄여서 매핑하게 됩니다.