Keras_YOLO cpu inference error
안녕하세요 강사님.
저번에 친절하게 올려주신 답변을 보고 따라하는 중에 또 질문을 올리네요!!
Keras-yolo를 데스크탑 gpu로 train해서 만든 .h5파일을
노트북 cpu로 inference 과정 중 문제가 생겼습니다.
모델 로드는 제대로 되었는데, Yolo의 detect_image()를 사용하여 inference 중 아레와 같은 에러가 발생하였습니다!
혹시 cpu에서 keras-YOLO는 사용이 불가능한 것일까요?
-------------- 모델 학습
25회 학습 + validation 2회 진행 중 한번 끊겨서 중간 저장된 model_stage_1.h5로
5회 학습 + 5회 validation 진행한 결과입니다.
train_yolo(pretrained_path, annotation_path,classes_path, anchors_path, log_dir,trained_model_name, b_size, epochs_cnt)
pretrained_path: C:/JupyterNotebook/ClothClassified/model_data/cloth_stage_1.h5
Create Tiny YOLOv3 model with 6 anchors and 14 classes.
Load weights C:/JupyterNotebook/ClothClassified/model_data/cloth_stage_1.h5.
Freeze the first 42 layers of total 44 layers.
Train on 28938 samples, val on 3215 samples, with batch size 2.
Epoch 1/5
14469/14469 [==============================] - 2273s 157ms/step - loss: 17.7330 - val_loss: nan
WARNING:tensorflow:From C:\Users\min96\anaconda3\envs\tf115\lib\site-packages\keras\callbacks\tensorboard_v1.py:343: The name tf.Summary is deprecated. Please use tf.compat.v1.Summary instead.
Epoch 2/5
14469/14469 [==============================] - 2078s 144ms/step - loss: 17.6376 - val_loss: nan
Epoch 3/5
14469/14469 [==============================] - 2094s 145ms/step - loss: 17.5342 - val_loss: nan
Epoch 4/5
14469/14469 [==============================] - 2049s 142ms/step - loss: 17.6445 - val_loss: nan
Epoch 5/5
14469/14469 [==============================] - 2042s 141ms/step - loss: 17.6296 - val_loss: nan
Unfreeze all of the layers.
Train on 28938 samples, val on 3215 samples, with batch size 2.
Epoch 6/10
14469/14469 [==============================] - 2111s 146ms/step - loss: 14.0190 - val_loss: 5.6780
Epoch 7/10
14469/14469 [==============================] - 2111s 146ms/step - loss: 11.0151 - val_loss: 4.3427
Epoch 8/10
14469/14469 [==============================] - 2114s 146ms/step - loss: 9.7026 - val_loss: 7.6887
Epoch 9/10
14469/14469 [==============================] - 2115s 146ms/step - loss: 9.0433 - val_loss: 2.4560
Epoch 10/10
14469/14469 [==============================] - 2105s 146ms/step - loss: 8.5110 - val_loss: 7.9146
------------- 모델 로드
cloth_tiny_yolo = YOLO(model_path=pretrained_path, anchors_path=anchors_path, classes_path=classes_path)
C:/JupyterNotebook/model_data/cloth_final.h5 model, anchors, and classes loaded.
----------------------- train
detected_img = yolo.detect_image(img) plt.imshow(detected_img)
답변 1
1
안녕하십니까,
CPU에서는 Grouped Convolution이 지원이 안되서 발생하는 문제 같습니다.
Keras Yolo3 코드의 어디에서 Grouped Convolution이 사용되는지 찾아봤는데, 명확하지 않은것 같습니다. 오류 메시지에서는 49번 convolution node 만들때 사용되었다고 하는데,..... 음, 49번 convolution node만들때 사용되지 않은 것 같은데...
암튼 CPU에서는 Keras Yolo가 문제가 있는것 같습니다.
감사합니다.
강의 환경설정 질문
0
38
2
Custom Dataset에서의 polygon 정보 관련
0
83
3
cvat.ai 보안 수준이 궁금합니다
0
78
2
캐클 nucleus 챌린지 runpod 실습 코드 에러 질문드립니다.
0
94
3
추론 결과의 Precision(또는 mAP) 평가 방법
0
83
2
mmdetection mask rcnn inferenct 실습 시 runpod 템플릿 관해서 질문드립니다.
0
58
2
runpod에서 google drive 연결 시 오류 발생
0
106
2
로드맵 선택
0
65
1
mmcv
0
56
2
Anchor box의 Positive 처리 위치
0
60
2
해당 강의 runpod 적용 후 에러 제보드립니다
0
84
2
run pod credit 관련 제보
0
95
2
mmdetection 2.x과 3.x 호환 관련 표기
0
76
2
mm_faster_rcnn_train_kitti.ipynb 실행 오류
0
94
3
질문 드립니다.
0
75
3
mm_faster_rcnn_train_coco_bccd 실행 오류 질문드립니다.
0
77
1
강사님께 수정을 제안드리고 싶은 것이 있습니다.
0
92
1
google automl efficientdet 다운로드 및 설치 오류
0
72
1
이상 탐지에 사용할 비전 기술 조언 부탁드립니다.
0
101
2
OpenCV 관련 질문드립니다.
0
70
2
mmcv 설치관련해서 문의드려요
0
329
3
강의 구성 관련해서 질문이 있습니다
1
135
2
모델 변환 성능 질문드립니다.
0
122
1
NMS 로직 문의 드려요
0
112
2





