앵커박스

Question

RPN을 이용하면 픽셀단위가 아니라 feature 맵의 한 점(?) 을 중심으로 9개의 앵커박스가 형성되고, 그 앵커박스에 object이 있는지 detection 하는건가요? 만약 그렇다면 이미 9개으 앵커박스는 모양과 크기가 정해져있고, 중심도 정해져있으니 bb box regression 이 필요한가요?

dooleyz3525 · Answer

아하 어찌보면 anchor box를 통해 초기값세팅(?)을 한다고 생각하면 될까요? => 네, 맞습니다. 그리고 RPN에서 classification 을 담담하는 부분은 18개의 채널로 이루어져 있는데, 여기에는 9개의 앵커박스(에 해당하는 물체)가 존재할 확률/존재하지 않을 확률이 들어가는 건가요? => 네 맞습니다. 그리고 16이라는 숫자는 어디서 튀어나온건가요? ㅜㅜ => 16이 강의에 몇분 몇초에 나오는 건지 말씀해 주십시요

JACKIE CHAN · Answer

그리고 16이라는 숫자는 어디서 튀어나온건가요? ㅜㅜ 결국 VGG든 뭐든 사용해서 나온 피쳐맵의 가로x세로x앵커박스의 수 가 전체 앵커박스의 수 아닌가요?

JACKIE CHAN · Answer

아하 어찌보면 anchor box를 통해 초기값세팅(?)을 한다고 생각하면 될까요? 그리고 RPN에서 classification 을 담담하는 부분은 18개의 채널로 이루어져 있는데, 여기에는 9개의 앵커박스(에 해당하는 물체)가 존재할 확률/존재하지 않을 확률이 들어가는 건가요?

dooleyz3525 · Answer

안녕하십니까, RPN을 이용하면 픽셀단위가 아니라 feature 맵의 한 점(?) 을 중심으로 9개의 앵커박스가 형성되고, 그 앵커박스에 object이 있는지 detection 하는건가요? => 네 맞습니다. 만약 그렇다면 이미 9개으 앵커박스는 모양과 크기가 정해져있고, 중심도 정해져있으니 bb box regression 이 필요한가요? => RPN에서 Ground Truth와 가장 근접한 anchor box(Ground truth와 겹치는 IOU가 0.7 이상인)를 계속 학습 하면서 해당 영역에, 즉 anchor box별로 object가 있는지, 있다면 거리 차이는 얼마나 되는지를 학습하기 위해서 bounding box regression을 수행합니다. 감사합니다.