inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

딥러닝 CNN 완벽 가이드 - TFKeras 버전

활성화 함수(Activation Function)의 이해

reul 기울기 소멸

318

박우성

작성한 질문수 10

0

항상 질문에 답변 잘해주셔서 감사합니다 선생님!
이번 질문은 Reul가 0이하일때는 기울기값들이 바로 0 으로 수렴하게 되는데 이는 vannishing gradient로 왜 해당 되지않는건가요?

딥러닝 kaggle tensorflow 머신러닝 배워볼래요? keras cnn

답변 1

1

권 철민

안녕하십니까, 

일반적으로 vanishing gradient는 sigmoid와 같은 activation의 경우 발생할 수 있는데, sigmoid의 경우 +로 큰 값이나 -로 큰값은 미분값이 0이 되기 쉽기 때문입니다. 

relu값은 경우는 입력값 x > 0일 경우 x가 되고 이를 미분하면 1이 되기 대문에 vanishing gradient 발생을 억제할 수 있습니다. 다만 적어주신대로 x <=0 일 경우는 0 이 되어 버리기 때문에  gradient가 0 가 되고 해당 neuron이 학습하지 못하게 됩니다. 이게 전반적으로는 큰 문제는 아닙니다. 중요한것은 전반적인 gradient값이 어떻게 되는가이기 때문입니다. 단지 이게 문제가 될 수 있는 그런 딥러닝 문제라면 Leaky Relu 등을 활용해서 적용할 수 있습니다. 

감사합니다. 

0

박우성

감사합니다!

resize 질문

0

60

1

20251212 Kaggle 런타임에 scikit-learn 설치 실패 트러블 슈팅

0

86

1

Loss와 매트릭 관계

0

75

2

Boston 코랩 실습

0

170

2

배치 정규화의 이해와 적용 2 강의 질문

0

143

2

Augmentation원본에 적용해서 데이터 갯수 자체를 늘리는 행위는 의미가있나요?

0

151

2

Conv함수 안에 activation 을 넣지 않는 이유가 뭔지 궁금합니다.

0

212

2

소프트맥스 관련 질문입니다

0

215

1

강의 관련 질문입니다

0

161

2

residual block과 identity block의 차이

0

199

2

옵티마이저와 경사하강법의 차이가 궁금합니다.

1

251

1

실습 환경

0

171

2

입력 이미지 크기

0

256

2

데이터 증강

0

203

2

albumentations ShiftScaleRotate

0

211

1

Model Input Size 관련

0

293

1

마지막에 bird -> frog 말고도 deer -> frog 도 잘못된것 아닌가요??

0

206

1

일반적인 질문 (kaggle notebook사용)

0

276

2

실무에서 Augmentation 적용 시

0

346

2

안녕하세요 교수님

0

235

1

가중치 초기화(Weight Initialization) 질문입니다.

0

332

1

테스트 데이터셋 predict의 'NoneType' object has no attribute 'shape' 오류

0

412

1

학습이 이상하게 됩니다.

2

1040

2

boston import가 안됩니다

0

230

1