인프런 커뮤니티 질문&답변

김남욱님의 프로필 이미지
김남욱

작성한 질문수

[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

Faster RCNN의 이해 03 - RPN과 Faster RCNN Training 및 성능 비교

Anchor Box의 IOU값 관련 및 여러 질문

작성

·

136

0

1. GT Box와 Anchor Box의 IOU값을 통해 Positive, Negative를 나눈다고 하셨는데, 해당 과정은 Feature Map이 아닌 원본 이미지에서 Anchor Box와 GT Box사이에서 얻어진 IOU값으로 결정이 되는 것인가요?

2. 또 제가 이해한 바로는 가장 좋은 Positive Anchor Box를 기준으로 하여 GT Box와 최대한 동일한 예측 BBox를 얻는 것이 목표다 라고 이해하였는데 맞는지 궁금합니다. 만약 맞다면 예측BBox의 초기좌표 및 w, h 값이 어떻게 설정되는 것인지 궁금합니다.

3. 또한 강의 커리큘럼에서 RCNN, SSD, YOLO 등 여러 모델이 있는데 순차적으로 듣는 것이 좋은지, 아니면 자신에게 필요하고 맞는 모델부터 우선적으로 들어도 괜찮은지 궁금합니다.

 

답변 1

0

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까, 

1. GT Box와 Anchor Box의 IOU값을 통해 Positive, Negative를 나눈다고 하셨는데, 해당 과정은 Feature Map이 아닌 원본 이미지에서 Anchor Box와 GT Box사이에서 얻어진 IOU값으로 결정이 되는 것인가요?

=> 네, 맞습니다. 원본 이미지의(정확하게는 입력 Network 크기) GT box와 Anchor box 사이에서 얻어진 iou값으로 결정됩니다. 

2. 또 제가 이해한 바로는 가장 좋은 Positive Anchor Box를 기준으로 하여 GT Box와 최대한 동일한 예측 BBox를 얻는 것이 목표다 라고 이해하였는데 맞는지 궁금합니다. 만약 맞다면 예측BBox의 초기좌표 및 w, h 값이 어떻게 설정되는 것인지 궁금합니다.

=> 네, 맞습니다. 그리고 초기 좌표, w,h는 random 값입니다. 이후 loss 를 최소화하는 방식으로 예측 bbox의 값이 계속 update됩니다. 

3. 또한 강의 커리큘럼에서 RCNN, SSD, YOLO 등 여러 모델이 있는데 순차적으로 듣는 것이 좋은지, 아니면 자신에게 필요하고 맞는 모델부터 우선적으로 들어도 괜찮은지 궁금합니다.

=> 음, 이건 개인 취향이 있어서 제가 뭐라고 말씀드리지 못할것 같습니다. 지금 거의 rcnn 이론을 다 들으신것 같은데,  나머지 부분은 순차적으로 들으시는게 어떨까 싶습니다. SSD를 스킵하고 Yolo를 들으셔도 되지만 제가 설명을 SSD를 들었다고 가정하고 Yolo를 설명하는 부분이 있습니다. 감안하시면 될 것 같습니다. 

김남욱님의 프로필 이미지
김남욱

작성한 질문수

질문하기