SPP-Net에서 궁금증

Question

질문이 2개 있습니다.

1. 첫 번째 질문은 기존의 Spatial Pyramid Pooling은 Feature Map에서 위치 정보를 같이 가져가기 위해 분할한 후 Max Pooling을 적용하는 것으로 이해했습니다. 이를 RCNN에서는 Feature Map 내부의 Feature에 Spatial Pyramid Pooling 을 적용한 것이고요. 이렇게 이해하는 것이 맞나요?

2. 두 번째 질문은 원본이미지에서 Selective Search는 따로 work하여 Feature Map에 연결시킨다고 이해했습니다. 근데 Feature Map은 이미 크기가 작아져 있는 상태이지만 Selective Search 같은 경우에는 원본 이미지에 Bounding box를 한 상태일 텐데, 어떻게 Feature Map에 Mapping(connect) 시킬 수 있는지 궁금합니다.

즉, Selective Search에서 나오는 coordinate와 Feature Map에 Mapping하는 coordinate와 다를텐데 어떻게 연결지어지나요..?

Answer

안녕하십니까,

1. 첫 번째 질문은 기존의 Spatial Pyramid Pooling은 Feature Map에서 위치 정보를 같이 가져가기 위해 분할한 후 Max Pooling을 적용하는 것으로 이해했습니다. 이를 RCNN에서는 Feature Map 내부의 Feature에 Spatial Pyramid Pooling 을 적용한 것이고요. 이렇게 이해하는 것이 맞나요?

=> 음, RCNN은 아니고, Fast-RCNN입니다. 서로 다른 Feature Map 사이즈를 하나의 벡터 형태로 맞추기 위해서 Spatial Pyramid Pooling형태로 MaxPooling을 적용해서 ROI Pooling을 적용한 것입니다.

2. 즉, Selective Search에서 나오는 coordinate와 Feature Map에 Mapping하는 coordinate와 다를텐데 어떻게 연결지어지나요..?

=> 이건, feature map 사이즈로 줄어드는 사이즈만큼 Selective search에서 나오는 coordinate를 같은 비율로 줄여서 매핑하게 됩니다.

이준우

SPP-Net에서 궁금증

이 글과 비슷한 Q&A

공식예시문제 작업형2 에러코드

에어비엔비 가격 문제 중 오브젝트 컬럼 삭제 관련 문의입니다.

7회 기출문제 원핫인코딩 관련 질문입니다.

MYSQL 맥북 오류