scheduler관련 질문드립니다.

From the concept of the latest deep learning technology Vision Transformer to Pytorch implementation

Vision Transformer - Training Results

2022-04-30T15:51:37.473Z

276

Jaewoo Choi

4 asked

scheduler를 업데이트시켜줄때, 배치단위로 업데이트 시킬 때의 장점과, 에폭 단위로 업데이트 시켜줄때의 장점이 궁금합니다 :)

딥러닝 컴퓨터-비전 pytorch vision-transformer

Answer 1

dlbro

2022-05-01T05:10:20.327Z

안녕하세요.

기본적으로 배치 단위로 스케줄링을 하지는 않습니다.

예를 들어 10번의 이터레이션을 기준으로 학습률이 변경된다고 하고 에폭 100, 배치 이터레이션 20으로 가정해봐요. 그러면 에폭 기준으로하면 9번의 변화가 있지만 배치 기준으로 하면 199번의 많은 변화가 생깁니다. 또한 배치 하나가 학습 되고 있다는 것은 데이터 전체를 사용하는 중이라는 의미이기 때문에 이 사이에 학습률을 변경하면 데이터마다 다른 학습률로 학습이 됩니다. 따라서 기본적으로 배치 단위로 스케줄링을 하지는 않습니다.

감사합니다 :)

Jaewoo Choi

2022-05-01T12:43:38.751Z

여기서 보면 step단위로 scheduler를 업데이트해주는데 이러한 것에 효과가 따로 있는지 궁금합니다.

dlbro

2022-05-01T13:32:40.148Z

일부만 보고 다른 분의 것을 판단하기는 어렵구요. 만약 일반적인 상황에서 배치 기준 스케줄링이라면 구동방식 상은 가능합니다만 기본적으로는 하지 않습니다. 링크 하나 남겨드릴께요!

https://pytorch.org/docs/stable/optim.html

mean attention distance

2025-03-18T07:25:16.117Z

199

안녕하세요, vit에 관심이 많은 사람입니다.

2024-07-23T12:20:35.126Z

233

positional embedding 학습이 잘 안되는 문제

2024-04-18T23:13:24.933Z

365

행렬 차원 수 질문

2023-12-15T13:33:20.313Z

315

Self Attention 질문 있습니다.

2023-12-01T08:05:56.247Z

325

Multi-Head Attention 모델 구조에서 궁금한게 있습니다.

2023-07-27T07:11:04.706Z

555

전처리 관련해서 질문이 있습니다

2023-07-25T10:28:04.936Z

362

답변에 대한 추가질문이 있습니다.

2023-07-11T10:30:03.540Z

301

헷갈리는게 몇개 있습니다ㅠㅠ

2023-07-05T16:07:48.200Z

375

Positional Encoding, KQV 질문입니다!

2023-06-16T18:32:40.332Z

623

강의 자료 슬라이드

2023-02-10T08:56:46.889Z

738

비전 트랜스포머 - 최신 모델 강의에서 positional embedding

2023-01-24T02:48:06.936Z

468

비전 트랜스포머 - 최신 모델' 강의에서 B*N*K 와 1*K*D 를 연산

2023-01-24T02:30:05.734Z

401

'어텐션 기법 - 키, 쿼리, 밸류는 무엇인가?' 강의에서 (QK^T)

2023-01-23T11:56:46.102Z

717

training

2022-11-12T04:20:42.143Z

288

Image가 입력일 때 Cross Attention 결과가 궁금합니다.

2022-09-21T23:34:39.847Z

889

Transformer의 input에 대해 질문드립니다.

2022-07-25T13:18:51.058Z

415

ViT에 대한 전반적인 질문 드립니다!

2022-05-11T16:12:15.788Z

394

Key query value관련 질문

2022-05-11T12:17:45.787Z

567

Fine tuning 관련하여 질문 드립니다.

2022-05-07T18:28:32.441Z

647

코드 질문

2022-05-06T06:46:31.211Z

316

Dh의 의미

2022-05-05T02:36:13.948Z

309

E, Epos

2022-04-04T16:10:58.740Z

304

key의 차원으로 정규화

2022-04-03T15:28:10.839Z

167