인프런 커뮤니티 질문&답변

김동욱님의 프로필 이미지
김동욱

작성한 질문수

[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

Keras-Retina Note 실행 오류

작성

·

254

0

KerasRenina_이미지와_영상_Detection에서 원본 이미지를 Object Detection 후에 시각화 표시.를 수행하면 다음과 같은 오류가 발생합니다.
커널을 다시 재기동하고 해도 동일한 올 ㅠ

image shape: (633, 806, 3) resized image size: (800, 1019, 3) scale: 1.263823064770932
---------------------------------------------------------------------------
UnknownError                              Traceback (most recent call last)
<ipython-input-10-f100b465891f> in <module>
     14 # 이미지에 대해 Object Detection 수행.
     15 start = time.time()
---> 16 boxes, scores, labels = retina_model.predict_on_batch(np.expand_dims(image, axis=0))
     17 print(boxes.shape, scores.shape, labels.shape)
     18 print("processing time: ", time.time() - start)

~/.conda/envs/tf115/lib/python3.6/site-packages/keras/engine/training.py in predict_on_batch(self, x)
   1578             ins = x
   1579         self._make_predict_function()
-> 1580         outputs = self.predict_function(ins)
   1581         return unpack_singleton(outputs)
   1582 

~/.conda/envs/tf115/lib/python3.6/site-packages/tensorflow_core/python/keras/backend.py in __call__(self, inputs)
   3474 
   3475     fetched = self._callable_fn(*array_vals,
-> 3476                                 run_metadata=self.run_metadata)
   3477     self._call_fetch_callbacks(fetched[-len(self._fetches):])
   3478     output_structure = nest.pack_sequence_as(

~/.conda/envs/tf115/lib/python3.6/site-packages/tensorflow_core/python/client/session.py in __call__(self, *args, **kwargs)
   1470         ret = tf_session.TF_SessionRunCallable(self._session._session,
   1471                                                self._handle, args,
-> 1472                                                run_metadata_ptr)
   1473         if run_metadata:
   1474           proto_data = tf_session.TF_GetBuffer(run_metadata_ptr)

UnknownError: 2 root error(s) found.
  (0) Unknown: Failed to get convolution algorithm. This is probably because cuDNN failed to initialize, so try looking to see if a warning log message was printed above.
	 [[{{node conv1/convolution}}]]
	 [[filtered_detections/map/while/Switch_1/_1877]]
  (1) Unknown: Failed to get convolution algorithm. This is probably because cuDNN failed to initialize, so try looking to see if a warning log message was printed above.
	 [[{{node conv1/convolution}}]]
0 successful operations.
0 derived errors ignored.

답변 8

0

권 철민님의 프로필 이미지
권 철민
지식공유자

해결되었다니 다행입니다.

0

김동욱님의 프로필 이미지
김동욱
질문자

해결했습니다. cuda는 이미 10.0 버전이었고 좀더 최신버전으로 가기에는 드라이버 업데이트에 문제가 있어서 해당 cuda버전에 대응하는 가장 최신버전 cuDNN(7405 )로 올렸더니 작동합니다. 감사합니다.

0

김동욱님의 프로필 이미지
김동욱
질문자

네  cuda 10으로 다시 시도해보겠습니다. centos7 입니다. 

감사합니다.

0

권 철민님의 프로필 이미지
권 철민
지식공유자

Cuda 9 가 tensorflow 버전이 좀 높은 경우 잘 호환이 안되는 경우가 많습니다 cuda 10으로 설치 함 재 시도 부탁드립니다 저도 다른 방법이 있는지 찾아보겠습니다

리눅스는 유분투인가요?

0

김동욱님의 프로필 이미지
김동욱
질문자

네 환경을 리눅스 서버에 동일하게 세팅하고 학습중입니다(1080TI ). CUDA 10으로 설치하다가 잘 안되서 https://www.tensorflow.org/install/source#tested_build_configurations

검색중에 발견된 이 문서를 보고 각기 7, 9로 설치했습니다.

KerasRetina이전에는 문제가 없었구요. 해당 노트 부터는 처음 실행 부터 안되었습니다. 

0

권 철민님의 프로필 이미지
권 철민
지식공유자

Gcp gpu 서버는 cuda 가 10 일텐데 다른 gpu 서버인가요?

그리고 정상적으로 되다가 안되는 건가요? 아님 처음부터 해당 함수가 안되는 건가요?

0

김동욱님의 프로필 이미지
김동욱
질문자

tensorflow 버전은 1.15.2 입니다. cuDNN은 7, CUDA는 9입니다. 재기동 하고 다시 시도했는데 동일한 오류가 발생합니다. 또 확인해야할 부분이 있을 까요?

감사합니다.

0

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

처음보는 에러군요. cuDNN 이나 CUDA 문제인것도 같습니다.

먼저 tensorflow 버전이 1.15인지 다시 확인해 주시고, 맞으면 이번엔 서버를 재기동 하시고 다시 한번 수행 부탁드립니다. 상황 업데이트 부탁드려요

감사합니다.

김동욱님의 프로필 이미지
김동욱

작성한 질문수

질문하기