• 카테고리

    질문 & 답변
  • 세부 분야

    컴퓨터 비전

  • 해결 여부

    미해결

object Localization

22.04.06 18:15 작성 조회수 162

0

안녕하세요!!

제가 이해한 게 맞는지 몰라서 질문 남깁니다!!

 

object Localization은 원본 이미지에서 하나의 object만 Detect한다

그래서 Feature Extrator를 거친 최종 Feature map은 하나의 요소만 갖게 되고,

bounding box regression도 Feature map의 하나의 요소에 맞게 생기게 된다.

 

object Detection의 경우 원본 이미지에서 여러 개의 object를 Detect한다

그래서 Feature Extrator를 거친 최종 Feature map은 여러 개의 요소를 갖게 되고,

bounding box regression도 Feature map의 여러 요소에 맞게 생기게 되는데

이때 object Localization과 같은 로직으로 학습 시키게 되면 엉뚱한 곳에 bounding box가 만들어지게 된다.

 

이렇게 이해했는데 맞는 건가요?

 

답변 1

답변을 작성해보세요.

0

안녕하십니까, 

1. object Localization은 원본 이미지에서 하나의 object만 Detect한다

그래서 Feature Extrator를 거친 최종 Feature map은 하나의 요소만 갖게 되고,

bounding box regression도 Feature map의 하나의 요소에 맞게 생기게 된다.

 => 음, 최종 Feature map에 하나의 요소만 갖지는 않습니다. 

그러니까 feature map은 그냥 이미지에 대한 특성을 가지고 있습니다. 

그 뒤에 bounding box로 feature map에 매핑된 정보를 학습하여 오브젝트를 학습/예측합니다. 

그래서 bounding box regression은 object localization의 경우 매핑이 한개만 있으므로 하나의 오브젝트만 학습하게 됩니다. 

2. object Detection의 경우 원본 이미지에서 여러 개의 object를 Detect한다

그래서 Feature Extrator를 거친 최종 Feature map은 여러 개의 요소를 갖게 되고,

bounding box regression도 Feature map의 여러 요소에 맞게 생기게 되는데

이때 object Localization과 같은 로직으로 학습 시키게 되면 엉뚱한 곳에 bounding box가 만들어지게 된다.

=> 네. 전반적으로 맞게 이해하셨습니다. 한개의 오브젝트가 학습하는 경우와 다르게 두개 이상의 오브젝트를 학습하게 되면 기존 object localization의 방식대로는 잘 학습이 되지 않습니다. 예측도 엉뚱한 곳에 bounding box가 만들어 집니다.