inflearn logo
강의

Course

Instructor

[Pytorch] Building Deep Learning Models Using PyTorch

Section 3 Quiz

mini-batch gradient descent 시 backpropagation에 대하여

75

hehehe

2 asked

0

mini-batch gradient descent 시 batch size 단위로 평균값을 가지고 파라미터 업데이트 한다고 설명하신 거 같습니다. 그런데 강의하시는 코드에는 forward() 다음 연속해서 .backward()가 나오고 있어 마치 매번 업데이트를 하는 것처럼 해석되는데요. 제가 어떤 부분에 오해하고 있는 것인지? 문의드립니다.

딥러닝 인공신경망 pytorch anaconda cnn

Answer 2

1

YoungJea Oh

backward() 가 하는일은 역전파(backpropagation)를 통해 각 파라미터에 대한 gradient를 계산해 gradient buffer(누적 저장소)에 넣는 것입니다. 예를 들어 batch 로 256 개 데이터의 평균값으로 미분 계산을 하고 optimizer.step() 에서 파라미터 업데이트를 하는 것을 반복합니다. 아래 인프런 AI 인턴의 답변이 정확합니다. 감사합니다.

1

communityai8509

안녕하세요, 인프런 AI 인턴입니다. hehehe님.

질문해 주신 내용에 대해 간단히 설명드리겠습니다.

mini-batch gradient descent는 네트워크의 파라미터를 매 배치마다 업데이트하는 방식입니다. 이는 모든 데이터를 한 번에 업데이트하는 것과 달리, 전체 데이터셋을 여러 미니 배치로 나눠 각 미니 배치에 대해 업데이트하는 방법입니다.

각 미니 배치에 대해 다음과 같은 과정이 진행됩니다:

  1. Forward Pass: 입력 데이터를 네트워크에 통과시켜 예측값을 계산합니다.
  2. 손실 계산: 예측값과 실제값 사이의 손실을 계산합니다.
  3. Backward Pass: .backward()를 호출하여 네트워크의 모든 파라미터에 대한 손실의 미분을 계산합니다.
  4. 파라미터 업데이트: 미리 설정한 학습률(learning rate)에 따라 계산된 기울기를 사용하여 모델의 파라미터를 업데이트합니다.

질문에서 언급하신 코드와 관련해, .backward()는 단순히 역전파(Backpropagation)를 통해 각 파라미터의 기울기를 계산하는 역할을 합니다. 이 계산 후에 optimizer.step()을 호출하여 파라미터 업데이트가 이루어지게 됩니다. 따라서, 코드 흐름에서 forwardbackward가 연속으로 나타난다고 해서 매번 파라미터를 즉각적으로 업데이트하는 것이 아닙니다. 실제 파라미터의 변화는 optimizer.step() 이후에 발생합니다.

관련해서 더 많은 정보나 구체적인 코드가 필요하시다면, 아래의 유사한 질문을 참고하시면 도움이 될 것입니다:

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

import torch가 안되는 경우는 어떻게 하나요?

0

16

1

소리가 겹쳐서 들려요

0

20

2

20강에서 파인튜닝 때 사용한 데이터가 없어졌습니다. LoRA Trainer 매개변수도 라이브러리 업그레이드로 수정되었습니다.

0

20

1

[개정판] 딥러닝 컴퓨터 비전 완벽 가이드 먼저? 구현하며 배우는 Transformer 먼저?

0

30

1

수업자료

0

23

2

전 강의와 전혀 이어지지가 않음

0

30

1

pytorch local 설치 옵션에 conda 가 없습니다.

0

38

3

pc에서는 괜찮은데 탭으로 들으니 화면확대시 화면이 까맙니다

0

22

1

강의 환경설정 질문

0

40

2

모든 자료 다운로드 누를때마다 똑같은 excel파일이 다운로드 받아짐. 노션 주소 공유되나요?

0

32

2

오토인코더+ Knn, SVC 로 해석하는경우

0

45

3

강의자료에 소스코드가 없는데요

0

49

3

강화학습저장 및 로드

0

57

1

Custom Dataset에서의 polygon 정보 관련

0

83

3

paperswithcode 서비스 종료 관련 문의

0

209

2

이미지가 출력되지 않습니다

0

209

2

IMDBDataset 파일 다운로드가 안되는데 어떻게 받을 수 있을까요?

0

292

1

the kernel appears to have died. it will restart automatically.

0

666

1

파이토치 device (gpu / cpu) 관련 질문드립니다.

0

711

1

nn.CrossEntropyLoss() method 질문

0

561

1

5분10초 경, 강의자료에 대하여 질문드립니다.

0

323

1

update 공식 관련 질문 (3분31초 경)

0

309

1

종속변수와 독립변수

0

578

1

linspace(100, 200, 10)

0

354

1