작성
·
248
0
안녕하세요 선생님. 강의 듣던 도중 텐서 사이즈에 대해 궁금한 점이 있어서 질문드립니다.
가장 먼저 인풋으로 들어오는 이미지가 (224, 224, 3)이고
이게 con1을 거쳐서 (112, 112, 64)가 되고,
maxpooling을 거쳐 (56, 56, 64)가 된다고 이해했는데 여기서 feature map의 개수를 보면 3개 , 64개, 64개로 한번도 256개가 되는 순간이 없는 것 같은데,
이게 어떻게 residual connection으로 (56, 56, 256)과 add가 되는지 모르겠습니다.
답변 1
2
안녕하십니까,
음, 이걸 설명하는걸 제가 빼먹은 것 같군요. conv block 만드는 맨 마지막 정도의 코드를 보시면 shortcut을 만드는 부분이 있습니다. 여기에서 256 filter를 적용해서 만듭니다. 제가 conv block 만들때 앞에서 conv stride 2로 feature map 사이즈를 줄이는 부분만 identity_block 만드는 부분하고 차이가 나는 부분이라고 했는데, 여기 shortcut 만드는 부분도 identity block과의 차이가 있습니다.
조만간 시간을 봐서 해당 부분에 대해서 영상을 수정하도록 하겠습니다.
감사합니다.