인프런 커뮤니티 질문&답변

김선호님의 프로필 이미지
김선호

작성한 질문수

YOLO 구현으로 배우는 딥러닝 논문 구현 with TensorFlow 2.0

YOLO 모델 리뷰

reshape 한 후 7*7*30

작성

·

215

0

안녕하세요^^
 
다름이 아니라 모델 마지막 단계에서 reshape 후에 1*1*30 안에 어떻게 바운딩 박스의 정보가 들어있는지(?) 바운딩박스가 들어있다는 논리를 어떻게 만들었는지가 궁금합니다.

 

바운딩 박스 2개를 그린다는건 앞에서도 설명이 있었는데 모델에 대한 설명에서는 기존 cnn처럼 진행되는 것 같아서요. 어떻게 바운딩 박스 2개가 그려진다는건지도 궁금합니다.

답변 1

0

AISchool님의 프로필 이미지
AISchool
지식공유자

안녕하세요~. 반갑습니다.

YOLO도 일반적인 Image Classificaiton 등을 위한 딥러닝 모델과 마찬가지로 Supervised Learning으로 학습하는 형태입니다.

따라서 정답 Bounding Box를 학습과정에서 제공하고 이와 오차를 줄이는 방향으로 학습을 진행하게 되므로 정답 Bounding box와 오차가 작아지는 방향으로 충분히 업데이트된 파라미터를 이용하면 마지막에 prediction값에 정답과 유사한 바운딩 박스 정보가 예측되게 됩니다.

좋은 하루되세요~.

감사합니다.

김선호님의 프로필 이미지
김선호
질문자

답변 감사합니다^^

그럼 그라디언트 기준으로 박스 위치를 예측하는 건가요??

 

reshape을 한 후에는 하나의 이미지형태가 되는 건가요?

dense층은 컨볼루션층에서 뽑아진 특징들을 통해서 각 카테고리의 확률을 계산하는 연산이 이뤄진다고 알고 있는데 어떻게 이미지형태 다시 만들어지는지 궁금해서요ㅜㅜ

AISchool님의 프로필 이미지
AISchool
지식공유자

안녕하세요~.

YOLO가 예측하는 것은 [x_center, y_cetner, bounding_box_width, bounding_box_height] 벡터입니다. 예를 들어 이미지가 [500,500] 크기의 가로세로 길이 이미지였는데 YOLO가 예측한 vector가 [50,50,25,25]라면 좌측 상단에 25x25 크기의 bounding box를 만들 수 있을 것입니다.

감사합니다.

김선호님의 프로필 이미지
김선호

작성한 질문수

질문하기