inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

딥러닝 CNN 완벽 가이드 - TFKeras 버전

안녕하세요 선생님! resnet 질문있습니다.

215

이승현

작성한 질문수 10

0

먼저, 좋은 강의 제공해주셔서 감사합니다ㅎㅎ

질문 글이 매끄럽지 않을 수도 있다는 점 미리 죄송하다는 말씀 드립니다ㅜ

 

 

질문이 있는데요,

 

이론상, identity block 을 input data가 거치면, output data도 input data와 큰 차이가 없도록 하는게 identity block 이라 알고 있는데요, 그렇다면 identity block을 쌓는게 어떤의미가 있는건지 잘 모르겠습니다.

가령, 50층의 일반적인 Convolution layer가 있는 model-1이 있고,  (25층의 Conv layer + 25층의 identity layer)가 있는 model-2가 있다면, 어차피 identity의 input과 output은 완전히 똑같지는 않더라도 거의 비슷할테니 딱히 25층의 identity layer는 큰 역할을 하지 않고 model-2의 identity layer는 그냥 없는것으로  생각할 수 있는 것 아닌가요...?

단지 identity block을 쌓는 것만으로 model의 성능을 어떻게 올릴 수 있는 건지 잘 이해가 되지 않습니다. 

물론, 가령 어떤 100개의 layer를 가진 모델이 degradation problem이 발생했고, 이를 해결하려 50개의 identity layer를 기존의 conv layer 50개와 교체한다면, degradation problem은 완화될거라고는 생각됩니다. 하지만, 그렇게 50개의 identity layer로 교체한 100 layer model이, 그냥 일반적인 50개의 conv layer 모델과의 성능차이가 유의미할것인지는 판단이 잘 되지 않습니다ㅜㅜ

 

왜냐하면,

 

개념적으로 layer를 통과하면서 feature를 뽑아내고 층이 쌓일 수록 점점 더 고도화된 feature들이 뽑히면서 classification 성능을 올리는 거라고 한다면, identity block은 input과 output이 비슷할테니 feature의 성능(?)에 별다른 영향을 미치지 않는 것 아닌가? 하는 의문이 있기 때문입니다

 

 identity block은 feature에 큰 영향을 미치지 않을 것 같은데, 어떻게 identity block을 쌓는 것으로 모델의 성능이 좋아질 수 있는건가요?? 

 

 

kaggle 머신러닝 배워볼래요? 딥러닝 tensorflow keras cnn

답변 1

1

권 철민

안녕하십니까, 

identity block을 개념적으로 이해 시켜드리기 위해서 제가 설명드린 부분이 약간 오해가 있을 수 있겠군요. 

제가 설명드린 identity block을 문맥상으로만 이해한다면 지적하신 부분이 맞습니다. 

하지만 identity block을 자세히 보시면 skip connection과 CNN 레이어로 이뤄져 있습니다. Skip connection만 가지고 있지 않기 때문에 CNN 레이어에서 학습이 되고 있습니다. 

다만 앞에서 말씀하신대로 

이론상, identity block 을 input data가 거치면, output data도 input data와 큰 차이가 없도록 하는게 identity block 이기 때문에 이렇게 학습을 시켜서 성능이 향상되는 메커니즘 자체는 저도 신기할 뿐입니다.

분명한건 학습이 됩니다.  

0

이승현

감사합니다 선생님!

resize 질문

0

60

1

20251212 Kaggle 런타임에 scikit-learn 설치 실패 트러블 슈팅

0

87

1

Loss와 매트릭 관계

0

78

2

Boston 코랩 실습

0

173

2

배치 정규화의 이해와 적용 2 강의 질문

0

145

2

Augmentation원본에 적용해서 데이터 갯수 자체를 늘리는 행위는 의미가있나요?

0

153

2

Conv함수 안에 activation 을 넣지 않는 이유가 뭔지 궁금합니다.

0

214

2

소프트맥스 관련 질문입니다

0

215

1

강의 관련 질문입니다

0

162

2

residual block과 identity block의 차이

0

203

2

옵티마이저와 경사하강법의 차이가 궁금합니다.

1

253

1

실습 환경

0

173

2

입력 이미지 크기

0

259

2

데이터 증강

0

209

2

albumentations ShiftScaleRotate

0

212

1

Model Input Size 관련

0

296

1

마지막에 bird -> frog 말고도 deer -> frog 도 잘못된것 아닌가요??

0

207

1

일반적인 질문 (kaggle notebook사용)

0

278

2

실무에서 Augmentation 적용 시

0

349

2

안녕하세요 교수님

0

237

1

가중치 초기화(Weight Initialization) 질문입니다.

0

333

1

테스트 데이터셋 predict의 'NoneType' object has no attribute 'shape' 오류

0

414

1

학습이 이상하게 됩니다.

2

1043

2

boston import가 안됩니다

0

233

1