• 카테고리

    질문 & 답변
  • 세부 분야

    컴퓨터 비전

  • 해결 여부

    미해결

바운딩 박스가 한 사람에게 여러개 잡히는 경우

21.12.08 23:40 작성 조회수 240

0

선생님 안녕하세요, 선생님덕에 어렵게만 느껴지던 cv를 조금씩 배우고 있어서 정말 감사드립니다.

제가 mask rcnn이나 mmdetection을 통한 segmentation을 다른 이미지를 넣어서 해봤는데요,

2모델 다 한 사람만 있는 여러 사진들에서 한 사람에 대해 서너개의 바운딩박스가 생기더라고요.

(다 사람으로 예측하긴 하는데 accuracy는 갈수록 낮아지게 생깁니다.)

한명이 앞에 있고, 뒤에 또 사람이 겹쳐져 있는거다 이런 식으로 인식한 걸까요?

 

이런게 이례적인 경우인가요?

일반적인 경우라면 어떻게 하면 더 나은 결과가 나올 수 있을까요? 그냥 threshold를 높이면 되는 걸까요?

사진에 나오는 사람이 대체적으로 한명이고, 사람을 찾는 거라면 range(1)로만 하면 되는 걸까요?

그럼 자동으로 가장 accuracy가 높은거 하나만 나오는 건가요? 

 

답변 1

답변을 작성해보세요.

1

안녕하십니까,

일반적으로 한사람에 대해서 서너개의 바운딩 박스가 생긴다면, 원인은 크게

1. 학습 데이터가 부족

2. 학습 시 epoch를 짧게 설정. 

이 중 1번인 경우가 더 많습니다. 학습 데이터 량이 많더라도 해당 instance나 클래스로는 학습 데이터가 없을 수 있습니다. 가령 전체 만장의 이미지와 annotation이 있더라도 10개의 클래스를 학습시 특정 1개는 학습 이미지가 몇십장 수준이라면 학습이 제대로 되지 않을 수 있습니다. 

다시 한번 위 내용 확인해 주시고, 내용 업데이트 부탁드립니다. 

감사합니다.