• 카테고리

    질문 & 답변
  • 세부 분야

    컴퓨터 비전

  • 해결 여부

    미해결

SPP-Net에서 궁금증

21.12.21 11:34 작성 조회수 167

0

질문이 2개 있습니다.

1. 첫 번째 질문은 기존의 Spatial Pyramid Pooling은 Feature Map에서 위치 정보를 같이 가져가기 위해 분할한 후 Max Pooling을 적용하는 것으로 이해했습니다. 이를 RCNN에서는 Feature Map 내부의 Feature에  Spatial Pyramid Pooling 을 적용한 것이고요. 이렇게 이해하는 것이 맞나요?

 

2. 두 번째 질문은 원본이미지에서 Selective Search는 따로 work하여 Feature Map에 연결시킨다고 이해했습니다. 근데  Feature Map은 이미 크기가 작아져 있는 상태이지만  Selective Search 같은 경우에는 원본 이미지에 Bounding box를 한 상태일 텐데, 어떻게 Feature Map에 Mapping(connect) 시킬 수 있는지 궁금합니다.

즉, Selective Search에서 나오는 coordinate와 Feature Map에 Mapping하는  coordinate와 다를텐데 어떻게 연결지어지나요..?

답변 1

답변을 작성해보세요.

0

안녕하십니까, 

1. 첫 번째 질문은 기존의 Spatial Pyramid Pooling은 Feature Map에서 위치 정보를 같이 가져가기 위해 분할한 후 Max Pooling을 적용하는 것으로 이해했습니다. 이를 RCNN에서는 Feature Map 내부의 Feature에  Spatial Pyramid Pooling 을 적용한 것이고요. 이렇게 이해하는 것이 맞나요?

=> 음, RCNN은 아니고, Fast-RCNN입니다. 서로 다른 Feature Map 사이즈를 하나의 벡터 형태로 맞추기 위해서 Spatial Pyramid Pooling형태로 MaxPooling을 적용해서 ROI Pooling을 적용한 것입니다. 

2. 즉, Selective Search에서 나오는 coordinate와 Feature Map에 Mapping하는  coordinate와 다를텐데 어떻게 연결지어지나요..?

=> 이건, feature map 사이즈로 줄어드는 사이즈만큼 Selective search에서 나오는 coordinate를 같은 비율로 줄여서 매핑하게 됩니다.