keras-yolo 모델 학습관련 질문
223
작성한 질문수 2
안녕하세요 선생님
먼저 좋은 강의 정말 감사합니다.
저는 [yolo raccoon custom 강의]를 보고 keras-yolo에 제 데이터에 custom하는 작업을 진행 중인데요.
문제는 제 데이터 양 때문인지 한 1epoch 당 3시간 정도가 걸립니다.
저는 aws 를 사용하고 있는데 이게 오래 학습을 시키면 저절로 서버다운이 되고... 중간에 학습모델 저장이 쉽지가 않습니다.
그래서 2epoch씩 학습시키고 저장하고 -> 저장된 모델을 로드해서 다시 2epoch 학습하고
이런 방식으로 노동을 하고자 하는데 그 방법을 여쭈어보고 싶습니다.
여기서 저장된 모델 이름은 trained_weight_stage_1.h5 입니다. fine-tune은 할 엄두도 못내고 있구요...
1. 2epoch 학습한 trained_weight_stage_1.h5 를 yolo.h5 자리에 넣고 학습시키면 되는 걸까요?
2. 어느정도 학습한 모델을 이어서 그다음 코드인 fine-tune 단계만 진행하려면 어떻게 해야할까요?
답변 3
0
음, 이미지 사이즈가 200x200은 좀 작은 것 같습니다.
yolo default image size 가 416x416 이니, 그정도 쯤으로 맞추시면 어떨까 싶습니다.
loss의 절대값은 크게 신경쓰지 않으시는게 좋을 것 같습니다.
0
지금 제가 다시 소스코드를 보니, create_model() 인자로 weights_path로 checkpoint된 weight를 넣으면 될 것도 같습니다만, 함 시도해 보시는건 어떨지요?
0
넵 시도해보고 다시 말씀드리겠습니다. 정말 감사합니다.
우선 이미지 사이즈가 1000 * 1000 였고, 이를 200 * 200 으로 줄여서 학습하니 시간이 2시간 정도로 줄었고, 또한 원래 학습데이터가 30000개 정도인데 10000개로 줄이니 1시간에서 1시간 반으로 또 줄었습니다.
제가 원하는 class 수는 15개 정도인데 학습시간을 줄이기위해 class 수를 줄이거나, 학습 이미지수를 더 줄이는 방향으로 시도를 해볼예정입니다.
답변 다시 한번 감사드립니다.
0
선생님 혹시 라쿤 데이터셋 학습할 때 loss가 10점대였던걸로 기억하고, 이 정도면 학습이 잘 되었다 말하기엔 부족하다고 말씀하셨는데 loss가 몇 정도는 되어야 좋다고 평가할 수 있을까요?
0
안녕하십니까,
1 epoch당 3시간이면 거의 학습이 어려우실것 같습니다만, GPU를 사용하시는데도 그러신건가요?
학습 데이터량이 몇개나 되시길래, 데이터 량을 좀 줄여 보시는건 어떠신지요? 혹 이미지 사이즈 크기를 크게 가져가신건지요?
그래서 2epoch씩 학습시키고 저장하고 -> 저장된 모델을 로드해서 다시 2epoch 학습하고.....
=> 이렇게는 학습이 진행되기 어려울것 같습니다만, 아래 답변 드립니다.
1. 2epoch 학습한 trained_weight_stage_1.h5 를 yolo.h5 자리에 넣고 학습시키면 되는 걸까요?
=> 이 방식은 저도 확신이 없습니다, 소스코드를 보면 그렇게 적용하기는 어려울 것 같습니다. 소스코드 자체를 변경해야 할 것 같습니다만, 변경해도 된다고 보장하기는 어려울 것 같습니다.
2. 어느정도 학습한 모델을 이어서 그다음 코드인 fine-tune 단계만 진행하려면 어떻게 해야할까요?
=> 지금 단계에서는 fine tuning은 안하시는 게 좋을 것 같습니다.
요약 드리면 학습 데이터 량을 줄여서 1epoch당 20분 내로 수행 될 수 있도록 해보신 후 성능을 보시는게 좋을 것 같습니다. 일단 이렇게 해보시고, 추후 어떻게 진행할 지 다시 의논하시는게 어떨지요?
강의 환경설정 질문
0
35
2
Custom Dataset에서의 polygon 정보 관련
0
79
3
cvat.ai 보안 수준이 궁금합니다
0
77
2
캐클 nucleus 챌린지 runpod 실습 코드 에러 질문드립니다.
0
93
3
추론 결과의 Precision(또는 mAP) 평가 방법
0
80
2
mmdetection mask rcnn inferenct 실습 시 runpod 템플릿 관해서 질문드립니다.
0
56
2
runpod에서 google drive 연결 시 오류 발생
0
104
2
로드맵 선택
0
64
1
mmcv
0
54
2
Anchor box의 Positive 처리 위치
0
59
2
해당 강의 runpod 적용 후 에러 제보드립니다
0
82
2
run pod credit 관련 제보
0
92
2
mmdetection 2.x과 3.x 호환 관련 표기
0
74
2
mm_faster_rcnn_train_kitti.ipynb 실행 오류
0
93
3
질문 드립니다.
0
73
3
mm_faster_rcnn_train_coco_bccd 실행 오류 질문드립니다.
0
75
1
강사님께 수정을 제안드리고 싶은 것이 있습니다.
0
91
1
google automl efficientdet 다운로드 및 설치 오류
0
71
1
이상 탐지에 사용할 비전 기술 조언 부탁드립니다.
0
100
2
OpenCV 관련 질문드립니다.
0
67
2
mmcv 설치관련해서 문의드려요
0
324
3
강의 구성 관련해서 질문이 있습니다
1
130
2
모델 변환 성능 질문드립니다.
0
119
1
NMS 로직 문의 드려요
0
108
2





