학습 데이터 가져오는 부분과 배치사이즈, iteration 에 관해 질문드립니다!!
547
작성한 질문수 10
추가로 질문 드리고 싶습니다
1.SGD시 1건의 데이터는 모든 피쳐를 포함한 1건의 데이터(RM, LSTAT의 경우 2개의 W를 가지는 2개의 열방향 데이터)인것인가요? 맞다면 1000번의 iteration시 동일한 데이터로 1000번 학습을 하는건가요? 아니면 열방향으로 순차대로 학습을 하는건가요?(예를 들면 600개의 데이터가 있다고 하면 1번부터 600번까지...)
2.미니배치에서 Batch size만큼 학습데이터를 순차적으로 학습시킬때, Batch size는 순서대로(600개의 데이터가 있다면 1~30번, 31~60번...이렇게 정직하게 가져 오는건가요?? 아니면 1, 5, 8, 11, 50, 100 과 같이 랜덤하게 선택하되, Batch size만 지키는 것인가요??
진짜 감사드립니다...강의 계속 보고 있습니다!!
답변 2
0
안녕하십니까,
잘 듣고 계시다니, 저도 기분이 좋군요.
원론적으로(맨 처음 SGD가 제안되었을 때는 성능상의 이슈로) SGD는 전체 데이터에서 단 한건의 데이터만 가지고 Gradient를 계산하는 방식입니다. 그러니까 100건의 학습 데이터라면 모든 피처를 포함한 단 한개의 데이터만을 random 하게 선택해서 가중치를 계산하고 이를 모델 전체에 가중치를 Update하는 방식입니다. 다만 이 한 건의 데이터는 iteration 마다 random 하게 다르게 선택되어 계산됩니다. 만약 1000번의 iteration 이라면 100개의 데이터 중에 1건을 선택하되, 1000번 iteration 마다 다른 데이터를 선택하게 됩니다. (물론 random 이기 때문에 1000번 iteration중 동일한 데이터가 발생할 확률은 있습니다)
질문중에 열방향이라는 의미를 잘 이해하지 못했습니다. 만약 특정 피처를 하나씩 선택하는 것을 의미하는 거라면, 그건 아니고, 전체 피처들을 선택하는 것입니다.
Mini-batch 방식으로 학습을 할 때는 학습 데이터를 원래 순서대로 가져오는 방법이 있고, 섞어서 가져오는 방법도 선택할 수 있습니다. 다만 이걸 iteration 시에 결정하는 것은 아니고, epoch를 수행 할 때마다 학습 데이터 전체를 shuffle(원본 학습 데이터를 섞음)해서 Mini-batch를 할 것인지, shuffle하지 않고(원본 학습데이터의 순서를 그대로) Mini-batch를 할 것인지 선택할 수 있습니다. 나중에 keras의 모델 학습 시 해당 기능을 수행하는 API에 대해서 말씀 드릴 것입니다.
감사합니다.
resize 질문
0
50
1
20251212 Kaggle 런타임에 scikit-learn 설치 실패 트러블 슈팅
0
75
1
Loss와 매트릭 관계
0
61
2
Boston 코랩 실습
0
162
2
배치 정규화의 이해와 적용 2 강의 질문
0
134
2
Augmentation원본에 적용해서 데이터 갯수 자체를 늘리는 행위는 의미가있나요?
0
144
2
Conv함수 안에 activation 을 넣지 않는 이유가 뭔지 궁금합니다.
0
203
2
소프트맥스 관련 질문입니다
0
208
1
강의 관련 질문입니다
0
151
2
residual block과 identity block의 차이
0
185
2
옵티마이저와 경사하강법의 차이가 궁금합니다.
1
238
1
실습 환경
0
165
2
입력 이미지 크기
0
243
2
데이터 증강
0
195
2
albumentations ShiftScaleRotate
0
205
1
Model Input Size 관련
0
279
1
마지막에 bird -> frog 말고도 deer -> frog 도 잘못된것 아닌가요??
0
204
1
일반적인 질문 (kaggle notebook사용)
0
272
2
실무에서 Augmentation 적용 시
0
337
2
안녕하세요 교수님
0
231
1
가중치 초기화(Weight Initialization) 질문입니다.
0
327
1
테스트 데이터셋 predict의 'NoneType' object has no attribute 'shape' 오류
0
407
1
학습이 이상하게 됩니다.
2
1036
2
boston import가 안됩니다
0
228
1





