인프런 커뮤니티 질문&답변

Hong님의 프로필 이미지
Hong

작성한 질문수

[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

SSD의 이해 03 - SSD 네트웍 구조와 Multi Scale Feature Map/Anchor box의 활용

4:20에 대한 질문입니다.

작성

·

185

1

20+1+4 에 대해서 상세하게 알고 싶어서 질문 올립니다. 

백 그라운드에 대해서 잘 모릅니다 ㅠ 그래서 +1이 왜 되는지 와 4에 대해서는 저평가? 라고만 들리는데, 이에 대해서 다시 한번 말씀해주시면 감사하겠습니다.

답변 1

0

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

20개는 pascal voc의 클래스 갯수 입니다.  그런데 object detection의 경우는 background object라는 개념을 가지고 있는데, 이것은 Detect할 object가 아닌 object를 의미 합니다.

가령 이미지에 개와 고양이, 나무,  웅덩이가 있는데, Ground truth 정보는 개와 고양이만 가지고 있습니다. 즉 개와 고양이를 Detect하는 경우 나머지 오브젝트들 예를 들어 나무와 웅덩이는 background가 됩니다. 그래서 20+1 이 됩니다.

4의 경우는 예측 좌표값입니다. xmin, ymin, xmax, ymax가 됩니다.

Hong님의 프로필 이미지
Hong

작성한 질문수

질문하기