작성
·
262
1
안녕하세요. 교수님.
즐거운 한가위 보내고 계신지요?
연휴에 질문드려 죄송합니다.
Fast RCNN의 이해 02 - Anchor Box를 활용한 RPN 구성에서
RPN Bounding Box Regression은 Anchor Box를 Reference로 이용하여,
Ground truth와 예측 Bbox의 중심좌표 x, y 그리고 w, h의 차이가 Anchor box와 Ground Truth간의 중심좌표 x, y, w, h의 차이가 최대한 동일하게 예측될 수 있도록 해야한다고 하셨습니다.
제가 이해하기로는 IOU가 가장 높은 Anchor box가 결국 예측 Bbox가 되는거라고 이해하고 있었는데,
그렇다면 Anchor box와 예측 Bbox가 동일한것이 아닌지 궁금합니다.
그리고 Anchor box와 예측 Bbox가 만약 다르다면 Ground truth와 예측 Bbox 차이에 참조하게 되는 Anchorbox는 어떠한 Anchor Box를 참조하는지도 궁금합니다.
성심어린 강의에 다시한번 감사드립니다.
답변 1
0
안녕하세요, 인프런 AI 인턴이에요. 질문에 답변드리겠습니다.
Anchor box와 예측 Bbox는 서로 다른 개념입니다.
Anchor box는 미리 정의된 다양한 크기와 비율을 가지는, 이미지에서 객체를 찾기 위한 사각형 영역을 말합니다. 이러한 Anchor box들은 이미지 내에서 일정한 위치에 박스를 생성하고, 그 박스에 대해 객체의 존재 여부와 객체의 경계 박스를 예측하게 됩니다.
그리고 예측 Bbox는 실제 객체의 경계 상자를 예측한 값입니다. 여기서 경계 상자의 중심 좌표와 너비, 높이를 예측하게 됩니다.
따라서 Anchor box와 예측 Bbox는 다른 개념이지만, 예측 Bbox는 Anchor box와 관련이 있습니다. 예측 Bbox는 가장 높은 IOU를 가지는 Anchor box를 참조하여 예측하게 됩니다.
해당 Anchor box는 IOU 값이 최대가 되는 Ground truth와 중심 좌표, 너비, 높이의 차이가 최소화되도록 선택됩니다.
이렇게 선택된 Anchor box와 Ground truth 사이의 차이를 학습을 통해 예측 Bbox를 통해 보정하면서, 객체의 경계 상자를 정확하게 예측하게 됩니다.
질문에 대한 답변이 도움이 되셨는지요. 추가로 궁금한 점이 있으면 말씀해주세요. 즐거운 연휴 보내세요~요.
앵커박스와 BBoX에 대해 명쾌하게 이해되었습니다. 감사합니다.