• 카테고리

    질문 & 답변
  • 세부 분야

    컴퓨터 비전

  • 해결 여부

    미해결

ROI Pooling 이후 과정 및 Region Proposal에 대한 질문

21.08.11 23:37 작성 조회수 105

0

1. 14:25 강의자료를 예시로 ROI Pooling 이후 N x N Pooling된 (N x N x 512) 결과가 3개가 나오는데, 그렇다면 이후에 결과 데이터 각각을 Flatten 한 후 FC layer에 넣어주어 학습을 진행시키는, 즉 FC layer에 넣어주는 데이터가 3개라고 보면 되는건가요?

2. Feature Map에서 Selective search 결과를 맵핑시켜준다고 하였는데, 그렇다면 regression에 필요한 원본 이미지에 대한 GT Box도 Feature Map에 맵핑시켜준 후, Feature Map에 맵핑된 Selective search Box와 GT Box의 좌표 비교를 통해 regression이 진행되는 것인가요?

세세하게 알 필요까지 없는 부분을 질문드리는게 아닌가 죄송합니다ㅠㅠ

답변 1

답변을 작성해보세요.

0

1. 14:25 강의자료를 예시로 ROI Pooling 이후 N x N Pooling된 (N x N x 512) 결과가 3개가 나오는데, 그렇다면 이후에 결과 데이터 각각을 Flatten 한 후 FC layer에 넣어주어 학습을 진행시키는, 즉 FC layer에 넣어주는 데이터가 3개라고 보면 되는건가요?

=> ROI Pooling 이후 N x N Pooling된 (N x N x 512) 결과가 3개가 나온다는 개념이 조금 명확하게 할 필요가 있습니다.  

ROI Pooling은 pool_size(보통 7x7) x 채널수로 만들어지는 Tensor를 오브젝트가 있을 만한 영역(여기서는 3개라고 가정하고)만큼의 갯수만큼의 차원으로 가집니다. 그러니까, 3개 오브젝트 x 7 x 7 x 채널수  크기의 Tensor를 가지고 이걸 Flatten한 후 FC Layer에 넣어줍니다.  결과가 3개가 나온다는 개념과는 좀 다를 수 있습니다. 

2. Feature Map에서 Selective search 결과를 맵핑시켜준다고 하였는데, 그렇다면 regression에 필요한 원본 이미지에 대한 GT Box도 Feature Map에 맵핑시켜준 후, Feature Map에 맵핑된 Selective search Box와 GT Box의 좌표 비교를 통해 regression이 진행되는 것인가요?

=> 음, fast rcnn 구현체가 인터넷상에 존재하지 않아서 확실하게 답변 드릴 수는 없지만, 말씀하신대로 GT box를 feature map에 매핑 후 regression을 진행했을 것 같습니다.