작성
·
136
0
1. GT Box와 Anchor Box의 IOU값을 통해 Positive, Negative를 나눈다고 하셨는데, 해당 과정은 Feature Map이 아닌 원본 이미지에서 Anchor Box와 GT Box사이에서 얻어진 IOU값으로 결정이 되는 것인가요?
2. 또 제가 이해한 바로는 가장 좋은 Positive Anchor Box를 기준으로 하여 GT Box와 최대한 동일한 예측 BBox를 얻는 것이 목표다 라고 이해하였는데 맞는지 궁금합니다. 만약 맞다면 예측BBox의 초기좌표 및 w, h 값이 어떻게 설정되는 것인지 궁금합니다.
3. 또한 강의 커리큘럼에서 RCNN, SSD, YOLO 등 여러 모델이 있는데 순차적으로 듣는 것이 좋은지, 아니면 자신에게 필요하고 맞는 모델부터 우선적으로 들어도 괜찮은지 궁금합니다.
답변 1
0
안녕하십니까,
1. GT Box와 Anchor Box의 IOU값을 통해 Positive, Negative를 나눈다고 하셨는데, 해당 과정은 Feature Map이 아닌 원본 이미지에서 Anchor Box와 GT Box사이에서 얻어진 IOU값으로 결정이 되는 것인가요?
=> 네, 맞습니다. 원본 이미지의(정확하게는 입력 Network 크기) GT box와 Anchor box 사이에서 얻어진 iou값으로 결정됩니다.
2. 또 제가 이해한 바로는 가장 좋은 Positive Anchor Box를 기준으로 하여 GT Box와 최대한 동일한 예측 BBox를 얻는 것이 목표다 라고 이해하였는데 맞는지 궁금합니다. 만약 맞다면 예측BBox의 초기좌표 및 w, h 값이 어떻게 설정되는 것인지 궁금합니다.
=> 네, 맞습니다. 그리고 초기 좌표, w,h는 random 값입니다. 이후 loss 를 최소화하는 방식으로 예측 bbox의 값이 계속 update됩니다.
3. 또한 강의 커리큘럼에서 RCNN, SSD, YOLO 등 여러 모델이 있는데 순차적으로 듣는 것이 좋은지, 아니면 자신에게 필요하고 맞는 모델부터 우선적으로 들어도 괜찮은지 궁금합니다.
=> 음, 이건 개인 취향이 있어서 제가 뭐라고 말씀드리지 못할것 같습니다. 지금 거의 rcnn 이론을 다 들으신것 같은데, 나머지 부분은 순차적으로 들으시는게 어떨까 싶습니다. SSD를 스킵하고 Yolo를 들으셔도 되지만 제가 설명을 SSD를 들었다고 가정하고 Yolo를 설명하는 부분이 있습니다. 감안하시면 될 것 같습니다.