인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

인프런 커뮤니티 질문&답변

gaeun na님의 프로필 이미지
gaeun na

작성한 질문수

TensorFlow Object Detection API 가이드 Part1 - 코드 10줄 수정으로 물체검출하기

Non-Maximum Suppression (NMS)

yolo annotation 문의

작성

·

306

0

ppt 2p,
YOLO 모델의 최종 output
' SxSx(5*B+C)(5:x,y,w,h,confidence)'
가 무슨 의미인가요?
이해가 잘 되지 않습니다

답변 1

0

AISchool님의 프로필 이미지
AISchool
지식공유자

네. 안녕하세요~. 반갑습니다.

'SxSx(5*B+C)(5:x,y,w,h,confidence)'

에서 각각은 다음을 의미합니다.

S  : 나눈 Cell의 개수. 예를 들어 7

B : Cell 1개에서 예측할 Boundig Box의 개수. 예를 들어 Cell당 2개씩 예측해서 2개

C : 예측할 class의 개수 (예를 들어, pascal voc 데이터셋의 경우 (강아지,고양이,사람,....) 해서 총 20개)

x : 예측할 Bounding box의 center x좌표

y : 예측할 Bounding box의 center y좌표

w : 예측할 Bounding box의 width

h : 예측할 Bounding box의 height

cofidence : 예측한 Bounding box의 확신의 정도

를 각각 의미합니다.

즉, 위 형태의 값들으 다 곱해서(X는 곱하기를 의미합니다.) 긴 하나의 벡터로 만들고 (예를 들어, 7*7*(5*2+20)=1470) 이게 YOLO 모델의 최종 Fully Connected Layer의 Output이 됩니다.

감사합니다.

gaeun na님의 프로필 이미지
gaeun na

작성한 질문수

질문하기