• 카테고리

    질문 & 답변
  • 세부 분야

    컴퓨터 비전

  • 해결 여부

    미해결

TNSE

21.11.05 15:39 작성 조회수 592

0

 
안녕하세요 강의 너무 잘들었습니다. 제가 전강의에서한 TNSE를 여기서 접목해 보려고 하는데 잘 안되어서 질문드립니다. 제가보기엔 별 다른게 없는거 같은데 RuntimeError: CUDA error: CUBLAS_STATUS_INVALID_VALUE when calling `cublasSgemm( handle, opa, opb, m, n, k, &alpha, a, lda, b, ldb, &beta, c, ldc)`
이런 에러가 떠서 혹시 아신다면 답변해주시면 감사하겠습니다. 아니면 제가 어떻게 해야하는지 가르쳐주셔도 감사할거 같습니다

답변 2

·

답변을 작성해보세요.

0

스크린샷만으로 정확히 판단할 수 없지만 model 안에 fc 정의 하셨나요? 원래 코드라면 model.fc가 없어서 마지막 레이어를 Identity로 바꿔 주시려면 model.mlp_head를 바꿔주셔야 할 것 같아요. 결론적으로 마지막 부분에서 nn.Linear의 아웃값이 안 맞는 것으로 보이네요.

신상님의 프로필

신상

질문자

2021.11.08

답변감사합니다. ㅠㅠ 귀찮게 해드려서 죄송합니다.  아웃값이 안맞는다는게 어떤건지 구체적으로 설명 해주실수 있나요?? 일단  mlp head부분을 바꿔도 에러는 그대로 뜹니다 ㅠㅠ

mlp_head.fc로 하신 것 같아요. mlp_head로 바꾸시고 그 다음 모델 파일 가셔서 forward부분 라인 마다 사이즈를 체크해보시고 모델에서 나온 아웃풋이랑 아웃풋 나오고 나서 수행하시려는 데이터 사이즈랑 비교해보세요!

0

안녕하세요. 신상님 :)

 

어느 피쳐를  따서 쓰시나요?  어느 부분에서 에러가 나는지 모르겠지만 배치 사이즈를 줄여 보시거나 만약 nn.Linear 부분에서 오류가 나면 인풋, 아웃풋 디멘젼이 nn.Linear랑 맞는지 확인해 보시겠어요?

신상님의 프로필

신상

질문자

2021.11.07

사이즈는  cifar10이랑 같은 사이즈고 저도 처음엔 gpu메모리 문제인가 해서 batch사이즈도 줄여보고 

인풋 아웃풋 디멘젼도 다 맞춰봤는데 같은오류가 뜨네요,..ㅠ 사진 첨부하겠습니다.