inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

딥러닝 CNN 완벽 가이드 - TFKeras 버전

Cosine Decay와 Cosine Decay Restart 기법 이해

초기에 큰 LR 의 적용할시 오버피팅 문제

353

돌머리

작성한 질문수 7

0

안녕하세요  선생님

초기에 LR을 크게 할 때 왜 overfitting인지 잘 이해가 가지 않습니다.

초기에 큰 LR을 적용할시 Weight의 급격한 변화로  지역 최적해에 빠져 과적합 가능성이 있다고 언급하십니다. (2:00~3:35쯤 설명)

그런데, 제 생각에는 지역최적해에 빠져 나오지 못 하는 경우, 충분한 학습을 하지 못하고 수렴 한 것이라 overfitting 보다는 under fitting이라고 생각되는데,  왜 overfitting인지 잘 모르겠습니다 .

항상 즐거운 강의 감사합니다 :) 

keras 딥러닝 tensorflow 머신러닝 배워볼래요? kaggle cnn

답변 1

1

권 철민

안녕하십니까, 

overfitting이 입에 붙어서...혼선을 드린것 같습니다. 성능이 저하되는 것을 overfitting으로 부주의하게 연결한 것 같습니다. 

learning rate가 크면 최소점으로 수렴하지 않고 발산을 해버리거나 최소점을 쉽게 지나쳐버릴 확률이 높습니다. learning rate가 크면 지역 최적해를 벗어날 가능성이 더 높아서 underfitting이라기 보다는 overshooting 개념으로 보는게 더 맞는것 같습니다. 

아뭏튼 learning rate가 크면 overfitting이 쉽게 된다는 얘기는 맞지 않습니다. 오히려 learning rate가 작으면 overfitting이 더 되기 쉽습니다. 

해당 영상은 적당한 시점에 다시 편집하도록 하겠습니다. 

감사합니다. 

0

돌머리

감사합니다 :) 

resize 질문

0

51

1

20251212 Kaggle 런타임에 scikit-learn 설치 실패 트러블 슈팅

0

76

1

Loss와 매트릭 관계

0

62

2

Boston 코랩 실습

0

164

2

배치 정규화의 이해와 적용 2 강의 질문

0

136

2

Augmentation원본에 적용해서 데이터 갯수 자체를 늘리는 행위는 의미가있나요?

0

145

2

Conv함수 안에 activation 을 넣지 않는 이유가 뭔지 궁금합니다.

0

206

2

소프트맥스 관련 질문입니다

0

208

1

강의 관련 질문입니다

0

151

2

residual block과 identity block의 차이

0

190

2

옵티마이저와 경사하강법의 차이가 궁금합니다.

1

240

1

실습 환경

0

165

2

입력 이미지 크기

0

244

2

데이터 증강

0

196

2

albumentations ShiftScaleRotate

0

207

1

Model Input Size 관련

0

281

1

마지막에 bird -> frog 말고도 deer -> frog 도 잘못된것 아닌가요??

0

204

1

일반적인 질문 (kaggle notebook사용)

0

272

2

실무에서 Augmentation 적용 시

0

338

2

안녕하세요 교수님

0

231

1

가중치 초기화(Weight Initialization) 질문입니다.

0

327

1

테스트 데이터셋 predict의 'NoneType' object has no attribute 'shape' 오류

0

409

1

학습이 이상하게 됩니다.

2

1036

2

boston import가 안됩니다

0

229

1