• 카테고리

    질문 & 답변
  • 세부 분야

    컴퓨터 비전

  • 해결 여부

    미해결

train 오류

22.07.10 22:07 작성 조회수 435

0

안녕하세요 교수님.

실습 코드(python3 train.py --img 640 --batch 16 --epochs 3 --data coco128.yaml --weights yolov3.pt --nosave) 수행 중 아래와 같은 오류가 발생햬습니다. 어떻게 하면 오류를 해결 할 수 있을지 궁금합니다.

현재 코랩 환경이 아닌 우둔투 local 환경에서 수행하고 있습니다.

 

RuntimeError: Unable to find a valid cuDNN algorithm to run convolution
Exception ignored in: <bound method _MultiProcessingDataLoaderIter.__del__ of <torch.utils.data.dataloader._MultiProcessingDataLoaderIter object at 0x7f22b6b32588>>
Traceback (most recent call last):
  File "/home/haneul/.local/lib/python3.6/site-packages/torch/utils/data/dataloader.py", line 1328, in __del__
  File "/home/haneul/.local/lib/python3.6/site-packages/torch/utils/data/dataloader.py", line 1262, in _shutdown_workers
AttributeError: 'NoneType' object has no attribute 'python_exit_status'
Exception ignored in: <bound method _MultiProcessingDataLoaderIter.__del__ of <torch.utils.data.dataloader._MultiProcessingDataLoaderIter object at 0x7f235350fc18>>
Traceback (most recent call last):
  File "/home/haneul/.local/lib/python3.6/site-packages/torch/utils/data/dataloader.py", line 1328, in __del__
  File "/home/haneul/.local/lib/python3.6/site-packages/torch/utils/data/dataloader.py", line 1262, in _shutdown_workers
AttributeError: 'NoneType' object has no attribute 'python_exit_status

 

답변 2

·

답변을 작성해보세요.

0

Dong Kim님의 프로필

Dong Kim

2022.07.25

저도 우분투에 그래픽카드 2개 연동헤서 사용하고있는데 같은오류가 나서 찾아보니 --workers 0 옵션을 주면 오류가 사라졌습니다.

workers가 cpu코어 개수 같은데 gpu연결되어서 오류가 나는건지 자세한건 모르겠습니다.

오 해결이 되었다니 다행입니다 

0

안녕하십니까, 

개별 환경에서 오류 메시지를 제가 잡기는 매우 어렵습니다. 

오류 메시지로만 봐서는 cuDNN의 버전이 제대로 설치가 안된걸로 보입니다만, 

mmdetection 실습코드는 잘되고 yolo는 안되는 건가요?