YOLOv1(2) 모델 + GoogLeNet~~ 관련 질문
강의 잘 듣고 있습니다.
해당 강좌에서 1:50쯤에 나오는 모델의 구성을 보면 마지막 단에 7x7x1024의 Feature map을 Flatten한 뒤 Linear layer를 거친 후 다시 7x7x30으로 변환되는 것으로 보이네요.
조금 찾아보니 1,470을 출력으로하는 Linear layer를 거친 후 다시 7x7x30으로 재구성하더군요.
헷갈리는 점은 Flatten과 Linear layer과정에서 공간적인 정보가 소실된 것 같은데 이를 7x7x30으로 바꾸어도 괜찮은가요?
Feturemap[0][0]에 있는 30의 특징값은 앞에서 해석한 것과 같이 원본 이미지의 (1,1) Cell에 있는 30개의 특징값과 동일하다고 생각하면 될까요?
답변 1
0
안녕하세요.
좋은 질문입니다.
Flatten은 reshape이라서 정보 소실은 없고 linear는 정보 소실보다는 연산 과정을 한 번 더 거쳤다고 보시면 됩니다.
30의 의미는 말씀하신게 맞습니다!
감사합니다.
[긴급요청] 28강 동영상 전체에 오디오가 잘못들어가있습니다.
0
12
1
17강 강의 마지막 부분에서 헷갈리는 부분이 있습니다.
0
23
0
14강의 예시 데이터를 통한 답을 구하는 과정에서의 문의
0
25
1
강의 자료 열람 요청이 안되네요
0
18
1
예측에 사용하는 경제지표의 활용에 대해
1
32
2
강의 자료를 어디서 확인 할 수 있나요?
1
44
3
실습 코드
0
33
2
MMDetection 버전 이슈
0
58
2
[업로드오류] 강의 내용과 제목 불일치
0
46
2
강의자료 누락
0
36
1
섹션22 퀴즈 질문
0
58
1
import torch가 안되는 경우는 어떻게 하나요?
0
57
1
소리가 겹쳐서 들려요
0
65
2
카메라달린 자동차가 특정물체를 계속 따라가는 주행을 하게하기위한 학습으로 Yolo4를 이용해야하는 학교 과제가 있어서 질문드립니다.
0
82
2
질문하나 있습니당
0
129
1
강의자료
0
141
2
Yolov6 실습 에러
0
209
2
yolo anchor box 질문
0
353
2
yolov4 bifpn
1
304
2
평가 지표 실습(4) IoU와 mAP 질문
0
380
2
평가 지표 실습 (3) PR curve와 mAP 질문
0
301
1
프레임워크
0
436
1
transductive learning & inductive learning
1
465
1
YOLOv4 Receptive field관련 질문
1
373
1





