인프런 커뮤니티 질문&답변

H-J S님의 프로필 이미지
H-J S

작성한 질문수

[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

raccoon 이미지 디텍션 트레이닝 결과가 너무 안좋은데 GPU성능 차가 있나요??

작성

·

245

0

Val_loss값이 강의와 다르게 너무 크게나오고 줄지를 않습니다. (4000~6000)

실행 - 결과파일  모두  정상적으로 나왔는데 디텍션 결과가 너무 좋지않네요

디텍션 정확도가 0.3~5 정도로  1/3 정도만 디텍션 됩니다 .. 

env :  [conda] conda 4.8.5 [cudatoolkit] 10.0.130 [cudnn] 7.6.0 [python] Python 3.7.6 [tensorflow-gpu] 1.13.1

[keras] 2.2.4

C:\Users\admin\anaconda3\lib\site-packages\keras\engine\saving.py:1140: UserWarning: Skipping loading of weights for layer conv2d_1 due to mismatch in shape ((3, 3, 3, 32) vs (64, 32, 3, 3)).

  weight_values[i].shape))

C:\Users\admin\anaconda3\lib\site-packages\keras\engine\saving.py:1140: UserWarning: Skipping loading of weights for layer batch_normalization_1 due to mismatch in shape ((32,) vs (64,)).

  weight_values[i].shape))

C:\Users\admin\anaconda3\lib\site-packages\keras\engine\saving.py:1140: UserWarning: Skipping loading of weights for layer conv2d_2 due to mismatch in shape ((3, 3, 32, 64) vs (32, 64, 1, 1)).

  weight_values[i].shape))

C:\Users\admin\anaconda3\lib\site-packages\keras\engine\saving.py:1140: UserWarning: Skipping loading of weights for layer batch_normalization_2 due to mismatch in shape ((64,) vs (32,)).

  weight_values[i].shape))

C:\Users\admin\anaconda3\lib\site-packages\keras\engine\saving.py:1140: UserWarning: Skipping loading of weights for layer conv2d_3 due to mismatch in shape ((1, 1, 64, 32) vs (64, 32, 3, 3)).

  weight_values[i].shape))

C:\Users\admin\anaconda3\lib\site-packages\keras\engine\saving.py:1140: UserWarning: Skipping loading of weights for layer batch_normalization_3 due to mismatch in shape ((32,) vs (64,)).

  weight_values[i].shape))

C:\Users\admin\anaconda3\lib\site-packages\keras\engine\saving.py:1140: UserWarning: Skipping loading of weights for layer conv2d_4 due to mismatch in shape ((3, 3, 32, 64) vs (128, 64, 3, 3)).

  weight_values[i].shape))

Load weights \Users\admin\Desktop\DLCV\Detection\yolo\keras-yolo3\model_data\yolo.h5.

Freeze the first 249 layers of total 252 layers.

Train on 180 samples, val on 20 samples, with batch size 4.

Epoch 1/50

45/45 [==============================] - 14s 303ms/step - loss: 3209.1600 - val_loss: 6300.4242

Epoch 2/50

45/45 [==============================] - 9s 202ms/step - loss: 707.9817 - val_loss: 5987.8038

Epoch 3/50

45/45 [==============================] - 10s 222ms/step - loss: 404.0721 - val_loss: 5872.5174

Epoch 4/50

45/45 [==============================] - 8s 187ms/step - loss: 300.0009 - val_loss: 5676.1661

Epoch 5/50

45/45 [==============================] - 10s 223ms/step - loss: 197.5603 - val_loss: 5666.7763

Epoch 6/50

45/45 [==============================] - 10s 222ms/step - loss: 172.6001 - val_loss: 5630.2007

Epoch 7/50

45/45 [==============================] - 10s 219ms/step - loss: 134.5537 - val_loss: 5487.8045

Epoch 8/50

45/45 [==============================] - 10s 221ms/step - loss: 116.2651 - val_loss: 5530.3334

Epoch 9/50

45/45 [==============================] - 10s 223ms/step - loss: 99.5342 - val_loss: 5492.4720

Epoch 10/50

45/45 [==============================] - 10s 220ms/step - loss: 87.7493 - val_loss: 5519.4808

Epoch 11/50

45/45 [==============================] - 10s 221ms/step - loss: 76.5280 - val_loss: 5482.3372

Epoch 12/50

45/45 [==============================] - 10s 221ms/step - loss: 71.2550 - val_loss: 5427.8594

Epoch 13/50

45/45 [==============================] - 10s 219ms/step - loss: 62.9793 - val_loss: 5439.6515

Epoch 14/50

45/45 [==============================] - 10s 221ms/step - loss: 59.4915 - val_loss: 5349.3237

Epoch 15/50

45/45 [==============================] - 10s 222ms/step - loss: 63.2302 - val_loss: 5422.8351

Epoch 16/50

45/45 [==============================] - 10s 218ms/step - loss: 58.4533 - val_loss: 5349.4282

                                                                                 .

                                                                                 .

                                                                                 .

                                                                                 .

Epoch 00080: ReduceLROnPlateau reducing learning rate to 1.0000000116860975e-08.

Epoch 81/100

45/45 [==============================] - 24s 540ms/step - loss: 18.5613 - val_loss: 18.1559

Epoch 82/100

45/45 [==============================] - 24s 540ms/step - loss: 18.7043 - val_loss: 18.2448

Epoch 83/100

45/45 [==============================] - 24s 540ms/step - loss: 19.6548 - val_loss: 18.2508

Epoch 00083: ReduceLROnPlateau reducing learning rate to 9.999999939225292e-10.

Epoch 84/100

45/45 [==============================] - 24s 541ms/step - loss: 18.9384 - val_loss: 18.8026

Epoch 85/100

45/45 [==============================] - 25s 547ms/step - loss: 18.6985 - val_loss: 17.7818

Epoch 86/100

45/45 [==============================] - 25s 566ms/step - loss: 18.9661 - val_loss: 19.2374

Epoch 00086: ReduceLROnPlateau reducing learning rate to 9.999999717180686e-11.

Epoch 87/100

45/45 [==============================] - 25s 547ms/step - loss: 18.8628 - val_loss: 18.9642

Epoch 00087: early stopping

답변 2

0

H-J S님의 프로필 이미지
H-J S
질문자

답변 감사드립니다.

디렉토리만 변경해서 실습하고 있습니다.

  C:\Users\admin\anaconda3\lib\site-packages\keras\engine\saving.py:1140: UserWarning: Skipping loading of weights for layer conv2d_1 due to mismatch in shape ((3, 3, 3, 32) vs (64, 32, 3, 3)).weight_values[i].shape))

이 error는 해결했는데 val_loss값이 엄청 크게나오는 것은 알수가없네요 ㅠ 일단 강의먼저 다들어보고 차차해결하겠습니다~

0

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

validation loss가 정말 크게 나오는 군요. GPU 하드웨어에 따라서 예측 성능이 저하되는 경우는 일어나지 않을 것이지만, cuda나 cudnn 버전이 안맞아서 문제가 있을 수는 있습니다.  하지만 현재 [cudatoolkit] 10.0.130 [cudnn] 7.6.0 사용하고 계시는 것 같으며 cudnn 7.6에서 큰 문제는 없어 보입니다.

윈도우 환경에 맞게 디렉토리 관련해서 소스 코드만 변경하신 건가요? 소스 코드를 알수 없으니 제가 도와드리는 게 한계가 있을 것 같습니다. 

윈도우 환경 때문에 실습이 영향을 받으신다면 제 github에서 colab용 소스코드를 다운로드 받으신 후 코랩에서 실습 코드를 수행해 보시는 것은 어떠신지요?

아래에서 다운 받으실 수 있습니다.

https://github.com/chulminkw/DLCV/blob/master/DLCV_Colab_SrcCode_20200905.zip

H-J S님의 프로필 이미지
H-J S

작성한 질문수

질문하기