작성
·
1.3K
0
안녕하세요 선생님, YOLO모델 train관련 궁금증이 있습니다.
1. YOLO모델의 파일 크기는 보통 240메가바이트인데, 학습하는 데이터의 양의 수용 범위가 있나요? 있다면 어느정도 될까요?
극단적인 예를 들어, 1000만장 이상의 이미지를 학습하게 되면 과적합 현상이 될거같습니다.
2. 계속해서 데이터를 많이 추가하고 싶다면 모델을 크기를 늘려야 하나요? 모델의 크기를 늘리기 위해서는 어떻게 해야 하나요?
3. 학습시키기에 적당한 프레임이 있을까요?(사진이 웬만큼 연속적이면 괜찮은지)
답변 1
1
안녕하십니까,
1. 한계는 없지 않을까 싶습니다. 많으면 많을 수록 좋을 것 같습니다. 학습 데이터가 많다고 과적합이 되지는 않습니다. 다만 일정 수정에서 최적으로 수렴되어서 더 이상 학습 데이터를 넣어도 성능이 안나올 수는 있습니다. 꽤 높은 품질의 성능을 원한다면 이미지 갯수는 클래스별로 최소 몇천장 이상은 있어야 한다고 합니다.
그런데 이게 이미지 개수도 중요하지만 얼마나 다양하게 이미지들이 존재하는가가 더 중요할 수 있습니다. 왜냐하면 테스트 하려는 이미지는 학습 이미지 보다 대체로 다양한 환경과 상황에 있는 이미지들을 검출하는 경우가 있을 수 있습니다. 예를 들어 학습은 정면 얼굴로 했으나 테스트는 비스듬하거나 측면 얼굴로 한다면 예측 성능은 이미지 개수가 아무리 많아도 떨어질수 밖에 없습니다.
2. 질문을 잘 이해하지 못했습니다. 모델의 크기를 늘린다는 말이 어떤 건지요? 데이터는 학습 된 모델에 계속 추가해서 학습 시키 실 수 있습니다. 1000장으로 학습된 모델이 가지는 weight를 다시 재 로딩한 모델로 추가적인 100장을 더 학습 시킬 수 있습니다. 단 이경우에 1100장으로 재 학습하는 경우보다 성능이 약간 떨어질 수는 있습니다.
3. 프레임이라는게 동영상의 FPS를 얘기하시는 건지요? 만일 그렇다면 FPS는 이미지 학습과는 관계가 없습니다.
감사합니다.