• 카테고리

    질문 & 답변
  • 세부 분야

    컴퓨터 비전

  • 해결 여부

    미해결

fast RCNN에서 ROI pooling 할 때

21.11.18 15:35 작성 조회수 243

0

안녕하세요. fast rcnn에서 궁금한 점이 있습니다.

roi pooling을 2x2로 쪼개서 4개 영역에서 max pooling을 한다고 가정했을때

백본에서 마지막 feature map가 7x7로 나왔고

원래 이미지에서 selective search된 영역이 매우 작은 영역이라  feature map로 roi projection했더니

feature map에서 2x1 또는 1x1인 한 픽셀로 대응되면 이 작은 영역을 어떻게 4개로 쪼개서 roi pooling 하나요?

아니면 입력이미지가 너무 작으면 아예 feature map자체가 3x3이 나와버릴 수 도 있지 않습니까?

이럴때는 또 어떻게 roi projection을 하는건지요? 왠만한 roi가 모두 같은 영역으로 프로젝션되버릴텐데....

아님 이런 경우는 가정하지 않고 이럴때는 이미지 사이즈를 더 키워서 feature map가 14x14처럼 좀 크게 출력되도록 해서

처리해야 하는건가요?

답변 1

답변을 작성해보세요.

1

안녕하십니까, 

Selective Search된 ROI 영역이 작아서 ROI Pooling이 어려울때는 이미지 보간법등을 적용해서 ROI 영역을 키워 줍니다. Max Pooling을 적용할 수 있을 정도의 사이즈로 ROI를 키워주는 방식을 적용합니다. 

감사합니다.