강의

멘토링

커뮤니티

Cộng đồng Hỏi & Đáp của Inflearn

Hình ảnh hồ sơ của intermedieval36042
intermedieval36042

câu hỏi đã được viết

Bootcamp Học Sâu và PyTorch cho Người Mới Bắt Đầu (Dễ Dàng! Từ Cơ Bản đến Transformer Cốt Lõi của ChatGPT) [Phân Tích/Khoa Học Dữ Liệu Phần 3]

섹션 다양한 Optimizer 정리하기 중 딥러닝으로 Regression 문제 적용해보기 (House Price Kaggle 문제) 강의에서 오류가 발생합니다.

Viết

·

145

0

섹션 다양한 Optimizer 정리하기 중 딥러닝으로 Regression 문제 적용해보기 (House Price Kaggle 문제) 강의에서 오류가 발생합니다.

강의에 나오는 code 중 아래 부분을 실행하면 RuntimeError 가 발생합니다.

 

이 부분이 문제라고 나옵니다. --> loss = torch.sqrt(loss_function(y_minibatch_pred, y_minibatch))

RuntimeError: The size of tensor a (1460) must match the size of tensor b (256) at non-singleton dimension 1

 

- 아 래 -

for index in range(nb_epochs):

indices = torch.randperm(X_train_tensor.size(0))

x_batch_list = torch.index_select(X_train_tensor, 0, index=indices)

y_batch_list = torch.index_select(y_train_tensor, 0, index=indices)

x_batch_list = x_batch_list.split(minibatch_size, 0)

y_batch_list = y_batch_list.split(minibatch_size, 0)

epoch_loss = list()

for x_minibatch, y_minibatch in zip(x_batch_list, y_batch_list):

y_minibatch_pred = model(x_minibatch)

loss = torch.sqrt(loss_function(y_minibatch_pred, y_minibatch))

epoch_loss.append(loss)

optimizer.zero_grad()

loss.backward()

potimizer.step()

if index % 100 == 0:

print(index, sum(epoch_loss) / len(epoch_loss))

 

머신러닝딥러닝인공신경망pytorchvision-transformer

Câu trả lời 1

0

안녕하세요, 인프런 AI 인턴입니다.

박종성님께서 질문하신 RuntimeError는 y_minibatch_predy_minibatch의 크기가 맞지 않아 발생한 문제입니다. 이 문제는 주로 배치 크기와 데이터의 차원이 맞지 않을 경우에 발생할 수 있습니다. 일반적으로 회귀 문제에서는 예측값 y_minibatch_pred와 실제값 y_minibatch의 크기가 동일해야 합니다.

해결 방법

  1. 데이터 차원을 확인하세요: y_minibatch_predy_minibatch의 차원을 출력하여 실제로 어떤 차이가 있는지 확인해보세요. 이때 y_minibatch_pred.size()y_minibatch.size()를 통해 배치 크기와 각 텐서의 차원을 확인할 수 있습니다.

  2. 미니배치 크기 수정: minibatch_size가 너무 크거나 지나치게 작다면 split로 나눈 후의 배치가 1460보다 크거나 작을 수 있습니다. 배치 사이즈가 처음부터 전체 데이터 크기로 적절한지 설정을 확인해보세요.

  3. 모델의 출력 수정: 예측값이 batch_size 길이의 1차원 텐서로 제공되도록 모델을 수정해야 합니다. 이는 회귀 문제이기 때문에 출력 차원이 맞춰져야 합니다.

문제 해결을 위해 더 많은 조언이 필요하다면, 전체 에러 메세지모델 선언 부분을 함께 공유해주시면 더 나은 도움을 드릴 수 있습니다.

관련된 강의 Q&A에서도 비슷한 질문이 있었던 것 같습니다. 아래는 관련된 질문 링크입니다:

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

Hình ảnh hồ sơ của intermedieval36042
intermedieval36042

câu hỏi đã được viết

Đặt câu hỏi