해결된 질문
작성
·
559
0
안녕하세요 강사님,
강사님의 강의를 통해서 Yolov5를 Custom Dataset 에 적용시켜봤습니다. Custom dataset은 약 120개의 이미지이고 Training 60/ Valid 30/ Testing 30 객체가 하나뿐인 이미지들입니다 (로고 탐지). Roc_Auc score를 계산했을 때 0.96정도가 나와서 좋은 성능을 보인다고 보고 있습니다.
해결되지 않는 의문이 있습니다. 위의 Training/Valid/Testing은 모두 Ground Truth를 Cvat을 이용해서 annotating 해주고, export한 데이터 입니다. 그러므로 Inference후에 생성되는 txt 파일 5번째 줄에 confidence score가 계산 되어 나온다고 생각합니다 (GT와 예측 BB의 IOU * 해당 클래스일 확률 (100%).
그런데 Test 세트가 아닌 새로운 이미지 (GT가 없는)에 대한 Confidence score는 어떻게 계산되어 나오는 걸까요? 해당 객체일 *확률* 이라고 보고 있지만, IOU가 있을 수 없는 상황인데,,, (클래스일 확률은 100%겠죠, 객체가 하나이니) 이 점이 풀리지를 않고 있습니다.
감사합니다.
답변 2
1
안녕하십니까
Inference 시에 필요한것은 단 하나 이미지 뿐입니다. 우리가 많은 이미지와 Ground Truth 데이터를 기반으로 Deep learning 모델을 그렇게 학습 시켰기 때문입니다.
학습 시에는 Confidence score를 학습하기 위해서 IOU를 사용했습니다. 이렇게 Confidence score는 Yolo 모델을 head layer에서 학습되었는데, 정확히 얘기하자면 confidence score자체가 학습이 된게 아니라 confidence score를 만들기 위한 모델 예측 식(가중치 기반의 식)이 학습된 것입니다.
이렇게 모델에서 가중치기반의 예측식이 학습을 통해서 만들어지면, 모델의 입력으로 이미지를 입력하면 이미지 오브젝트별로 confidence score를 모델의 해당 예측 식에 기반하여 계산해 주는 것입니다.
감사합니다.
0
생각해보니 간단하게 적용시켜보면, Video Inference의 경우에 inference되는 box들의 score들이 어떻게 계산되는건지에 질문이라고 할 수 있겠네요!