인프런 커뮤니티 질문&답변
TNSE
작성
·
669
0
안녕하세요 강의 너무 잘들었습니다. 제가 전강의에서한 TNSE를 여기서 접목해 보려고 하는데 잘 안되어서 질문드립니다. 제가보기엔 별 다른게 없는거 같은데 RuntimeError: CUDA error: CUBLAS_STATUS_INVALID_VALUE when calling `cublasSgemm( handle, opa, opb, m, n, k, &alpha, a, lda, b, ldb, &beta, c, ldc)`
이런 에러가 떠서 혹시 아신다면 답변해주시면 감사하겠습니다. 아니면 제가 어떻게 해야하는지 가르쳐주셔도 감사할거 같습니다
답변 2
0
딥러닝호형
지식공유자
스크린샷만으로 정확히 판단할 수 없지만 model 안에 fc 정의 하셨나요? 원래 코드라면 model.fc가 없어서 마지막 레이어를 Identity로 바꿔 주시려면 model.mlp_head를 바꿔주셔야 할 것 같아요. 결론적으로 마지막 부분에서 nn.Linear의 아웃값이 안 맞는 것으로 보이네요.
딥러닝호형
지식공유자
mlp_head.fc로 하신 것 같아요. mlp_head로 바꾸시고 그 다음 모델 파일 가셔서 forward부분 라인 마다 사이즈를 체크해보시고 모델에서 나온 아웃풋이랑 아웃풋 나오고 나서 수행하시려는 데이터 사이즈랑 비교해보세요!






답변감사합니다. ㅠㅠ 귀찮게 해드려서 죄송합니다. 아웃값이 안맞는다는게 어떤건지 구체적으로 설명 해주실수 있나요?? 일단 mlp head부분을 바꿔도 에러는 그대로 뜹니다 ㅠㅠ