작성
·
180
0
안녕하세요
ResNet part 강의를 듣다가 질문 드립니다.
1x1이 연산량과 parameter에서 이득을 가지는데 왜 ResNet의
층이 낮을때는 사용을 하지 않았나요??(50층 이하)
낮은층 에서부터 1x1를 쓰는게 좋지 않나요?
VGG에서 1x1 를 쓰지 않았기 때문에 그랬을까요
답변 1
0
안녕하십니까,
Resnet에서 층이 많아지면 weight parameter가 더 많아지게 되면서 학습 성능이 저하되는 문제 등이 발생하면서 차원축소 용도로 1x1 Conv를 적용하여 weight parameter 수를 낮추게 된 것입니다.
층이 많지 않는 Resnet의 경우 왜 1x1 Conv를 적용하지 않았는지 정확하게는 모르겠지만, 아마도 층이 낮을 경우 Resnet에서 1X1 Conv를 적용하지 않아도 성능이 좀 더 나았기 때문아닌가로 추정합니다.
감사합니다.