inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

딥러닝 CNN 완벽 가이드 - TFKeras 버전

옵티마이저(Optimizer)의 이해 - Momentum, AdaGrad

SGD 지그재그 질문드립니다.

263

shumiro

작성한 질문수 4

0

안녕하세요. 강사님
옵티마이저의 이해 - Momentum, AdaGrad 챕터 중
Momentum의 효과에서 local minima가 loss 값이 작은 목표 지점인 것은 알겠는데 그쪽으로 갈때 SGD가 왜 지그재그로 움직이는지
직관적으로 잘 이해가 안됩니다. 교재의 그림에서 X Y 좌표와 등고선이 뜻하는 건 무엇인가요. 그리고 강의 11:43 쯤에 말씀하신 y축으로 갈때 Loss가 크게 감소한다고 말씀하셨는데 왜 그런지 그 이유도 궁금합니다.
 

tensorflow kaggle keras 머신러닝 배워볼래요? 딥러닝 cnn

답변 1

0

권 철민

안녕하십니까, 

그림을 보시면 두개의 변수 축, X축, Y축이 있을 때 최소점에 도달하기 위해서는 X축의 오른쪽 방향성으로 움직이는 게 중요합니다. 그림이 2차원 평면이라 약간 상상력을 발휘할 필요는 있습니다만, Y축의 경우 Scale이 X축 보다 더 큽니다( 그러니까, X축 값보다 상대적으로 큰 값들이 위치합니다). 그러다 보니까, Loss를 줄이려면 작은 X축 값보다는 큰 Y축값을 변경하는 게 더 효율성이 좋습니다. 

그래서 Y축 방향성으로 계속 Gradient가 업데이트 될 수 있어서 오른쪽으로 잘 이동하지 못하고 위아래 이동하는 경향성이 더 많다는 의미 입니다. 

감사합니다.   

resize 질문

0

60

1

20251212 Kaggle 런타임에 scikit-learn 설치 실패 트러블 슈팅

0

87

1

Loss와 매트릭 관계

0

78

2

Boston 코랩 실습

0

173

2

배치 정규화의 이해와 적용 2 강의 질문

0

145

2

Augmentation원본에 적용해서 데이터 갯수 자체를 늘리는 행위는 의미가있나요?

0

153

2

Conv함수 안에 activation 을 넣지 않는 이유가 뭔지 궁금합니다.

0

214

2

소프트맥스 관련 질문입니다

0

215

1

강의 관련 질문입니다

0

162

2

residual block과 identity block의 차이

0

203

2

옵티마이저와 경사하강법의 차이가 궁금합니다.

1

253

1

실습 환경

0

173

2

입력 이미지 크기

0

259

2

데이터 증강

0

209

2

albumentations ShiftScaleRotate

0

212

1

Model Input Size 관련

0

296

1

마지막에 bird -> frog 말고도 deer -> frog 도 잘못된것 아닌가요??

0

207

1

일반적인 질문 (kaggle notebook사용)

0

278

2

실무에서 Augmentation 적용 시

0

349

2

안녕하세요 교수님

0

237

1

가중치 초기화(Weight Initialization) 질문입니다.

0

333

1

테스트 데이터셋 predict의 'NoneType' object has no attribute 'shape' 오류

0

414

1

학습이 이상하게 됩니다.

2

1043

2

boston import가 안됩니다

0

233

1