작성
·
216
0
'Region Proposal 방식에 기반한 object detection - RCNN'
슬라이드에서 bounding box regression 을 진행하는 것을 볼 수 있는데,
region proposal 을 적용하면 해당 영역의 bounding box는 고정이므로 바로 annotation의 bounding box와 비교하여 regression 하면 되지 않나요?? 해당 슬라이드에서는 obj에 따라 x1,y1,x2,y2에 여러 값으로 나오는 것으로 표현되어 여쭈어봅니다!
아니면 해당 region 내에서 obj1, obj2, ... 의 위치를 한번 더 regression 하는 것인지요??
답변 4
0
0
0
감사합니다!
이해하기로는 object 가 있을 것으로 예상되는 regions(bounding boxes) 의 경우, r-cnn의 classification 을 통해 물체가 있을 가능성이 높을 때 해당 regions를 그대로 활용하는 것이 아니라,
object 가 있을 것으로 예상되는 regions(bounding boxes) 에서 다시 한번 위치를 알기 위한 regression 이 이루어진다는 말씀이시지요??
0
안녕하십니까,
오브젝트 detection이 classification 대비 대표적인 어려운점이
1. 이미지 내에 여러개의 오브젝트가 있으며 이들을 모두 detect 해야함.
2. 오브젝트가 이미지내에 어떤 위치에 있는지 찾아야 함.
3. 이미지내에 동일한 오브젝트가 여러개 있을시 이들을 모두 찾고 위치까지 찾아야 함.
일반적으로 region proposal을 적용하지 않고, 이미지 내에서 ground truth bounding box를 기반으로 아무리 회귀 loss함수를 잘 만들어서 Detect를 하려고 해도 잘 안됩니다.
특히 여러개의 오브젝트가 한 이미지에 있을 때 아무리 loss함수를 잘 만들어도 딥러닝에서 이를 정확히 찾아내기가 어렵습니다. 서로 다른 이미지에는 여러개의 서로 다른 오브젝트들이 서로 다른 위치에 놓여 있기 때문에 loss 함수가 쉽게 수렴해서 최적으로 오브젝트 detect를 해주기 어렵습니다.
그래서 object가 있을 만한 위치를 먼저 찾아줍니다. 이 오브젝트가 있을 만한 힌트를 먼저 가진 다음에 (즉 딥러닝 학습시 오브젝트에 대한 제약 조건을 강화해서) 이를 기반으로 bounding box regression등의 학습을 진행하여 성능을 향상 시킵니다.