batch size 질문이 있습니다!
468
投稿した質問数 2
안녕하세요. 좋은 강의 열어주셔서 감사합니다.
batch size를 크게할 경우 학습속도가 더 빨라질것 같은데, 맞나요? batch size와 모델 성능과의 상관관계도 있을까요?
回答 1
1
안녕하세요, 인프런 AI 인턴입니다.
sec.sensor님, 질문해주셔서 감사합니다.
batch size를 크게 설정하면 GPU와 같은 하드웨어의 병렬 처리 능력을 더 효율적으로 사용하여 각 iteration(반복학습)의 처리 시간을 단축시킬 수 있습니다. 그 결과 학습 속도가 빨라질 수 있죠. 하지만 너무 큰 batch size는 메모리 오버플로우를 일으킬 수 있으며, batch size가 커짐에 따라 학습이 수렴하기까지 필요한 epoch 수가 늘어날 수도 있습니다.
모델 성능과 batch size의 상관관계는 따로 존재합니다. 큰 batch size는 일반적으로 미니배치에서의 gradient 추정이 더 안정적이 되지만, 너무 크면 모델이 지역 최소값(local minima)에 갇히거나 제한된 수의 weight 업데이트로 인해 충분하게 학습이 일어나지 않을 수 있습니다. 반면 작은 batch size는 더 많은 weight 업데이트를 가져와서 종종 학습에 있어 더 나은 일반화를 갖게 되지만, 학습 과정이 불안정해질 수 있고 과적합의 위험도 있습니다.
적절한 batch size는 특정 모델, 데이터, 학습 목표 등에 따라 다를 수 있으며, 경우에 따라 실험을 통해 적절한 값을 찾아야 합니다.
import torch가 안되는 경우는 어떻게 하나요?
0
17
1
소리가 겹쳐서 들려요
0
23
2
20강에서 파인튜닝 때 사용한 데이터가 없어졌습니다. LoRA Trainer 매개변수도 라이브러리 업그레이드로 수정되었습니다.
0
20
1
[개정판] 딥러닝 컴퓨터 비전 완벽 가이드 먼저? 구현하며 배우는 Transformer 먼저?
0
30
1
수업자료
0
24
2
전 강의와 전혀 이어지지가 않음
0
31
1
pytorch local 설치 옵션에 conda 가 없습니다.
0
38
3
pc에서는 괜찮은데 탭으로 들으니 화면확대시 화면이 까맙니다
0
22
1
강의 환경설정 질문
0
41
2
모든 자료 다운로드 누를때마다 똑같은 excel파일이 다운로드 받아짐. 노션 주소 공유되나요?
0
32
2
torchtext.data 에러
0
2026
1
파이썬 코드 다운로드 받을 수 있는 곳이 있을까요?
0
546
1
train과 test 관련해서 질문드립니다!
0
262
1
혹시 audio관련해서 stt나 tts등 pytorch 관련해서 강의 하실 수 있나요?
0
368
1
teacher_force = random.random() < teacher_forcing_ratio
0
323
1
질문드립니다.
0
267
1
context_size 질문드립니다.
0
236
1
파이썬 for 문 질문드립니다.
0
257
1
Encoder와 Decoder Embedding에서 같은 벡터공간에 임베딩되는건가요?
0
272
1
word2vec
0
383
1
RNN과 CNN을 섞는법
0
295
2
13:30쪽 사운드가 너무 깨집니다ㅠㅠ
3
229
1
NLP에 RNN을 사용하는 이유
0
270
1
실습데이터 문의 - [실습]자연어 처리에 필요한 기본 배경 지식 실습
0
228
1

