• 카테고리

    질문 & 답변
  • 세부 분야

    컴퓨터 비전

  • 해결 여부

    미해결

(Box Co-ordinates + Objectness Score + Class Scores)

22.02.10 11:17 작성 조회수 132

0

컨볼루션 레이어를 통과한 prediction데이터중 

85개의 데이터가

bbox정보, Score, classes라는  논리가 무엇일까요??ㅜㅜ

답변 2

·

답변을 작성해보세요.

0

zebok님의 프로필

zebok

질문자

2022.02.11

85개의 데이터로 매핑되는 것은 이해가 됩니다~

그런데, 학습이 진행이 되고 결과값(가중치들이)으로 나온 데이터들이 박스정보, 클랙스 확률 정보로 추론이 되는지가 궁금합니다.

.view(batch_size, grid_size * grid_size * num_anchors, bbox_attrs)
이런식으로 reshpe만 해줬을 뿐인데 위의 정보로 추론이 된다는게 너무 궁금해서요..ㅠㅠ

 

 

dense층과 같은 원리라고 생각하면 될까요??

네, dense와 비슷한 원리로 생각하면 될 것 같습니다. 

batch, grid size * grid_size * num_anchor 차원으로 bbox정보, class정보등이 들어가 있으니까, 해당 정보를 추출하는 과정이라고 보시면 됩니다. 

0

안녕하십니까, 

음, 이해가 안되시는 부분을 상세하게 말씀해 주시면 좋을 것 같습니다만. 

85개가 bbox정보, score, class정보로 어떻게 매핑되는지를 물어보시는 건지요? 그렇다면

먼저 coco 데이터 세트를 기준으로 할 때 

coco는 object의 클래스 유형이 80개가 있습니다. 

그래서 85개 중에 80개는 개별 클래스 id 0 부터 79까지의 클래스 예측 확률이 들어가 있습니다. 이들 80개 중에 가장 큰 값으로 클래스를 예측합니다. 

그리고 bbox는 오브젝트 bbox의 좌표(중심 x,y좌표, 너비, 높이)는  4개 값으로 표현됩니다.  

마지막 score는 오브젝트일 확률을 의미하며 이는 1개 값으로 표현됩니다. 

그래서 총 85개 입니다. 

첨부로 만약 pascal voc 데이터를 이용한다면 pascal voc는 총 20개의 클래스가 있으므로 총 25개로 출력됩니다. 

감사합니다.