Loss function 관련하여 질문드립니다.
954
5 asked
강사님 안녕하세요. test loss 및 validation loss 관련하여 질문드립니다.
train loss와 validation loss 플랏을 보고, 이 모델이 잘 학습이 되었는지 어떻게 판단해야 하는지가 궁금하여 질문드리게 되었습니다.
강의 코드를 활용하여 학습하고자 하는 데이터에 적용해 보았습니다.
같은 데이터여도, 모델을 어떻게 구성하는지에 따라 에폭에 따른 loss 값이 큰 차이를 보였습니다.
Case 1) 초기 epoch의 validation loss가 train loss보다 낮은 경우

Case 2 ) validation loss와 train loss의 차이가 큰 경우

Case 3) Validation loss가 감소하는 형태를 띄나, 크게 fluctuation 할 경우

Case 4) Validation loss가 크게 fluctuation하며, 감소하는 형태가 아닌 경우 (증가 -> 감소)

말씀드린 4가지 case 경우 모두, 최종적으로 loss 값 자체는 낮게 나왔습니다.
하지만 제가 이상적이라고 생각한 loss 곡선에는 모두 벗어나는것 같아서, 위 형태들도 학습이 잘 되었다고 판단할 수 있을지 궁금하여 질문드립니다! 감사합니다.
Answer 1
0
안녕하세요.
먼저 모델 평가 및 개선은 종합적으로 봐야하기 때문에 손실 그래프로만으로 정확한 판단은 힘듭니다. 다만 그래프로만 봤을 때 4개 모두 학습은 잘 된 것으로 보여지고요. 학습 결과는 1,2는 오버피팅이고 3,4번이 좋다고 말할 수 있겠네요.
3,4번에서 발생되는 초반 변동은 초반에 모델 학습에 필요한 데이터가 충분하지 않아서 그럴 수도 있고요. 모델 파라메터 초기값 혹는 학습률의 문제 일 수도 있습니다. 또 다른 이유가 있을 수도 있고요. 따라서 일단 학습데이터 data split 비율을 높인다거나 모델 파라메터의 initialization 기법을 적용하거나 학습률을 좀 줄여보거나 할 수 있을 것 같습니다!
감사합니다.
수업자료 제공 부탁드립니다.
0
95
2
코드가 어디에 있는지 모르겠습니다.
0
93
2
논문 구현
0
184
2
overfitting이 나는 이유가 궁금합니다.
1
169
2
분류 성능이 잘 안 나오는 이유
0
217
1
AutoEncoder 차원 질문
1
250
2
사전 학습 모델에서의 layer 변경에 대한 질문
1
218
1
7강 폴더 만들
0
259
1
4-3강 cross-validation에서의 best model 선정 기준
0
447
1
regression 문제에 대한 결과 시각화
0
213
1
early stopping 코드 문의
0
325
1
예측 그래프
0
353
1
데이터 불균형
1
364
1
8강 전이 학습 질문
0
395
2
data의 gpu처리 질문
0
240
1
nn.Linear(1024, 10) 관련 질문드립니다.
0
287
1
학습과 평가시 Loss 함수가 다른 이유
0
249
1
전처리 관련해서 질문 있습니다.
0
224
1
데이터 엔지니어의 역량을 기르려면 어떻게 해야할까요?
0
933
2
역전파 내용 중 미분 관련 질문 드립니다
1
282
1
8강 전이학습에서 kernel size 관련 질문 드립니다.
1
956
1
이미지분류-합성곱신경망(CNN) 피쳐맵 질문입니다.
1
585
1
14강 데이터 불균형 RandomRotation
1
481
1
3장 데이터 불러오기에서 LinearTensor를 정의하는 이유가 궁금합니다.
1
324
1

