inflearn logo
강의

講義

知識共有

本当の人工知能につながるディープラーニングの概念をつかむ

確率的傾斜降下法と最適化手法

SGD + 모멘텀 등의 코드

解決済みの質問

482

kundol

投稿した質問数 3

0

안녕하세요 강사님 ㅎㅎ

강의 너무 잘 듣고 있습니다.

다름이 아니라.

15:40 에 많이 사용하는 것이

SGC + 스케줄링 또는 SGD + 모멘텀 + 스케줄링 이라고 말씀하셨는데요.

해당 부분을 코드로 나타내면 이렇게 되는게 맞을까요?

import torch
import torch.optim as optim 
# SGD + 스케줄링
optimizer = optim.SGD(model.parameters(), lr=0.01)  
# SGD + 스케줄링 + 모멘텀
optimizer = optim.SGD(model.parameters(), lr=0.01, momentum=0.9) 
scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=30, gamma=0.1) 
for epoch in range(num_epochs):
...
    for inputs, targets in train_loader:
        optimizer.zero_grad()
        outputs = model(inputs)
        loss = criterion(outputs, targets)
        loss.backward()
        optimizer.step() 
    scheduler.step()
 

 

감사합니다.

머신러닝 딥러닝 인공신경망

回答 1

0

dlbro

안녕하세요.

네 맞습니다!

 

추가적으로 말씀드리면

ADAM이랑 모멘텀+스케줄링이 지금까지 많이 쓰여져 왔는데요.

ADAM이 거의 디폴트처럼 쓰인다고 보시면 됩니다 :)

 

 

열공하세요!

작업형3 기출

0

6

1

유형2에서 데이터분할 생략 가능여부

0

7

1

9회 기출 유형3 질문

0

7

1

lgb 기초편

0

5

1

수업자료 문의

0

7

1

괄호 사용

0

8

1

작업형 2 데이터 전처리 질문

0

9

0

11회 기출 유형 작업형1 문제 3-1

0

8

0

예시문제 작업형2 (ver2023) 질문입니다

0

10

1

Data type에 따른 처리

0

6

1

Cursor 실행 문의

1

11

2

데이터 전처리 관련

0

13

2

시험에서 문제 불러오기

0

12

2

2번문제 출력값 질문

0

17

2

다중레이어 경사하강법에서 질문

0

277

2

XOR파트에서 입력표현 방식

1

297

2

경사하강법에서 다중레이어에서의 가중치를 구할 때 식이 이해가 가질 않습니다 ㅠ.ㅠ

1

377

1

경우에 따른 최적의 활성화 함수 선정하는 방법

0

446

2

전이학습 강의 중 질문이 있어서 남깁니다.

0

282

1

XOR 파트에서 질문 있습니다.

0

278

1

bias가 왜 필요한지 정확하게 모르겠습니다.

2

1188

1

LSTM 모형의 이해

1

620

1

RNN 가중치 w,u,l shape 질문

1

378

1

과적합 판단 방법에 대해 질문 드립니다.

0

2341

1