인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

인프런 커뮤니티 질문&답변

JH S님의 프로필 이미지
JH S

작성한 질문수

[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

Yolo Version1 - X Y W H 좌표값에 대한 질문

작성

·

873

0

안녕하세요 교수님. 

먼저 감사 인사 드리고 싶습니다.

정말 질 높은 수업, 좋은 가격으로 들을 수 있어 저에게 너무나 큰 행복입니다. 

좋은 강의 만들어 주셔서 정말 감사합니다. 

항상 궁금했던 내용인데, 마침 수업 내용에 있어서 질문드립니다.

Yolo version1에서는 Anchor Box의 개념을 사용하지 않는다고 배웠습니다. 

강의해주신 자료의 오른쪽 하단에 보면 'x,y,w,h : GT box와 후보 Box(Anchor?)간 offset 좌표'

라고 적혀있는데.....

x y w h는 그냥 하나의 Grid Cell에서 예측되는 Bounding Box의 좌표값 아닌가요??

자료에 적어주신 설명은 Anchor라는 개념이 사용되었을때만 적용할 수 있는 Offset 값 아닌가요?

시간되실 때 답변해주시면 정말 감사하겠습니다. 

강의 정말 잘 보고 있습니다. 

항상 정말 감사합니다. 

답변 1

1

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

강의에 만족하신다니 저도 기쁩니다. 감사합니다.

YOLO V1은 Anchor box하고 유사한 후보 box를 사용합니다. 하지만 V1은 Anchor box에 기반한 Detection이라기 보다는 각 개별 Grid cell 에 기반한 Detection이라고 볼수 있습니다. 개별 Grid의 중심점을 기반으로 2개의 후보 box를 bounding box를 통해 예측해 나가는 것입니다.

7x7 형태의 Grid Cell 마다 중심점 만으로는 오보젝트의 형태를 제대로 예측하기 어렵습니다. 후보 bounding box와 같이 일정한 bounding box 형태가 일단 있어야 합니다. 그리고 이 후보 bounding box와 Ground Truth bounding box 간의 offset값을 학습할 수 있어야 합니다. 결국은 학습된 offset값에 기반해서 새로운 이미지 오브젝트의 offset을 예측하는 것입니다.  anchor box도 이와 비슷한 방식이지만, V1은 많은 anchor box가 기준이 되는 게 아니라 개별 Grid가 기준이 되어서 후보 bounding box와 GT Bounding box의 offset을 학습하기 때문에 anchor box 기반 예측이라고 간주하기 어렵기 때문에 그런 말씀을 드린것이었습니다.

감사합니다.

JH S님의 프로필 이미지
JH S

작성한 질문수

질문하기