BB regression 관련(wrt Retinanet)
219
작성한 질문수 5
안녕하세요 선생님, 질문이 있습니다.
Retinanet paper 보면서 공부중인데요,
앵커박스 이용한 좌표값 학습 부분에서,
아래와 같이 오프셋을 출력한다고 하는데,
(맨 밑 스크린샷)
그렇다는 말은
a. t가 gt와 iou가 0.7 넘는 앵커박스와의 xywh오프셋(학습시 사용하는 고정값)
b. t^ 가 모델이 예측한 값(처음은 랜덤값)
이므로 학습시에 t - t^의 차이를 regression하는 것으로 이해했는데 맞나요?
이게 맞다면 학습이 끝나 infernence시에는 나온 오프셋에 해당 앵커박스 좌표값을 반영해서 bb 예측값을 얻게 되는 건가요?
상기와 같이 학습한다면 학습시 앵커박스 좌표값이 자연스럽게 라벨에 녹아들어있어서 이렇게 이해하고 넘어가려고 하는데,,
확인 부탁드리겠습니다!
답변 2
0
안녕하십니까,
1.
a. t가 gt와 iou가 0.7 넘는 앵커박스와의 xywh오프셋(학습시 사용하는 고정값)
b. t^ 가 모델이 예측한 값(처음은 랜덤값)
이므로 학습시에 t - t^의 차이를 regression하는 것으로 이해했는데 맞나요?
=> 거의 맞습니다. 먼저 iou 0.7는 가변적입니다. Retinanet Default는 0.5 입니다. 학습시에 t - t^ 만큼을 Smooth L1 Loss에 기반하여 regression합니다.
2. 상기와 같이 학습한다면 학습시 앵커박스 좌표값이 자연스럽게 라벨에 녹아들어있어서 이렇게 이해하고
=> 음, 자연스럽게 라벨에 녹아들어 이해하지 못했습니다. anchor box classification은 focal loss로 별도로 진행합니다. 이걸 모르셔서 질문하신건 아닌것 같습니다만 암튼 classification은 bb box regression과 별도로 진행합니다.
감사합니다.
강의 환경설정 질문
0
36
2
Custom Dataset에서의 polygon 정보 관련
0
81
3
cvat.ai 보안 수준이 궁금합니다
0
77
2
캐클 nucleus 챌린지 runpod 실습 코드 에러 질문드립니다.
0
93
3
추론 결과의 Precision(또는 mAP) 평가 방법
0
81
2
mmdetection mask rcnn inferenct 실습 시 runpod 템플릿 관해서 질문드립니다.
0
56
2
runpod에서 google drive 연결 시 오류 발생
0
106
2
로드맵 선택
0
64
1
mmcv
0
55
2
Anchor box의 Positive 처리 위치
0
59
2
해당 강의 runpod 적용 후 에러 제보드립니다
0
83
2
run pod credit 관련 제보
0
92
2
mmdetection 2.x과 3.x 호환 관련 표기
0
75
2
mm_faster_rcnn_train_kitti.ipynb 실행 오류
0
93
3
질문 드립니다.
0
74
3
mm_faster_rcnn_train_coco_bccd 실행 오류 질문드립니다.
0
75
1
강사님께 수정을 제안드리고 싶은 것이 있습니다.
0
91
1
google automl efficientdet 다운로드 및 설치 오류
0
71
1
이상 탐지에 사용할 비전 기술 조언 부탁드립니다.
0
100
2
OpenCV 관련 질문드립니다.
0
68
2
mmcv 설치관련해서 문의드려요
0
324
3
강의 구성 관련해서 질문이 있습니다
1
133
2
모델 변환 성능 질문드립니다.
0
119
1
NMS 로직 문의 드려요
0
109
2





