- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
- 먼저 유사한 질문이 있었는지 검색해보세요.
- 서로 예의를 지키며 존중하는 문화를 만들어가요.
- 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.
설명을 보면 yolo v1은 입력 이미지를 SxS 그리드로 나눠 각 셀이 하나의 object를 detect하는것 같은데 뒤쪽 구조에서 보면
feature map이 flatten된 후 그냥 reshape이 되어 7x7이 나왔습니다. 결국 입력 이미지를 7x7로 나눈게 아니라 feature map을
7x7로 나눠 detect하는 것 같은데... 입력이미지의 그리드와 마지막 reshape된 그리드가 매핑된다 생각하면 될까요 ?