강의

멘토링

로드맵

Cộng đồng Hỏi & Đáp của Inflearn

Hình ảnh hồ sơ của cksdn50077392
cksdn50077392

câu hỏi đã được viết

[Bản sửa đổi] Hướng dẫn hoàn chỉnh về Deep Learning Computer Vision

Faster RCNN의 이해 01 - Anchor Box

앵커박스

Viết

·

434

0

RPN을 이용하면 픽셀단위가 아니라 feature 맵의 한 점(?) 을 중심으로 9개의 앵커박스가 형성되고, 그 앵커박스에 object이 있는지 detection 하는건가요?

만약 그렇다면 이미 9개으 앵커박스는 모양과 크기가 정해져있고, 중심도 정해져있으니 bb box regression 이 필요한가요?

tensorflow컴퓨터-비전python머신러닝 배워볼래요? 딥러닝keras

Câu trả lời 4

0

dooleyz3525님의 프로필 이미지
dooleyz3525
Người chia sẻ kiến thức

아하 어찌보면 anchor box를 통해 초기값세팅(?)을 한다고 생각하면 될까요?

=> 네, 맞습니다.

그리고 RPN에서 classification 을 담담하는 부분은 18개의 채널로 이루어져 있는데, 여기에는 9개의 앵커박스(에 해당하는 물체)가 존재할 확률/존재하지 않을 확률이 들어가는 건가요?

=> 네 맞습니다.

그리고 16이라는 숫자는 어디서 튀어나온건가요? ㅜㅜ

=> 16이 강의에 몇분 몇초에 나오는 건지 말씀해 주십시요

JACKIE CHAN님의 프로필 이미지
JACKIE CHAN
Người đặt câu hỏi

800x600 이미지가 16으로 나누어져 scale down 된다고 하셨는데,

피쳐맵의 h 와 w 이 어떻게 16으로 나누어져 구해지는 건가요?

0

JACKIE CHAN님의 프로필 이미지
JACKIE CHAN
Người đặt câu hỏi

그리고 16이라는 숫자는 어디서 튀어나온건가요? ㅜㅜ

결국 VGG든 뭐든 사용해서 나온 피쳐맵의 가로x세로x앵커박스의 수 가 전체 앵커박스의 수 아닌가요?

0

JACKIE CHAN님의 프로필 이미지
JACKIE CHAN
Người đặt câu hỏi

아하 어찌보면 anchor box를 통해 초기값세팅(?)을 한다고 생각하면 될까요?

그리고 RPN에서 classification 을 담담하는 부분은 18개의 채널로 이루어져 있는데, 여기에는 9개의 앵커박스(에 해당하는 물체)가 존재할 확률/존재하지 않을 확률이 들어가는 건가요?

0

dooleyz3525님의 프로필 이미지
dooleyz3525
Người chia sẻ kiến thức

안녕하십니까,

RPN을 이용하면 픽셀단위가 아니라 feature 맵의 한 점(?) 을 중심으로 9개의 앵커박스가 형성되고, 그 앵커박스에 object이 있는지 detection 하는건가요?

=> 네 맞습니다.

만약 그렇다면 이미 9개으 앵커박스는 모양과 크기가 정해져있고, 중심도 정해져있으니 bb box regression 이 필요한가요?

=> RPN에서 Ground Truth와 가장 근접한 anchor box(Ground truth와 겹치는 IOU가 0.7 이상인)를 계속 학습 하면서 해당 영역에, 즉 anchor box별로 object가 있는지, 있다면 거리 차이는 얼마나 되는지를 학습하기 위해서 bounding box regression을 수행합니다.

감사합니다.

Hình ảnh hồ sơ của cksdn50077392
cksdn50077392

câu hỏi đã được viết

Đặt câu hỏi