model 선언할떄 .to(device) 하는 이유가 궁금해요
5201
작성한 질문수 5
model = VanillaRNN(input ~~~, device = device).to(device) 에서
괄호 안에 디바이스를 gpu로 선언해줬는데
밖에 to(device)를 하는 이유가 궁금해요
그리고 out.shape[0]은 출력값인거 알겠는데
원래 out은 형태가 어떻게 생겼는지 궁금해요
답변 1
0
안녕하세요.
텐서 연산 시에 모든 텐서가 동일한 operation(전부 cpu나 전부 gpu)을 사용해야 합니다.
따라서 밖에 .to(device)는 모델 파라메터에 대해 gpu을 사용할 수 있도록 하는 것이고 내부에 넣은 .to(device)는 모델 파라메터가 아닌 h0를 gpu용 텐서를 만드려는 용도입니다.
(h0은 모델 파라메터가 아니므로 밖에 .to(device)에 영향을 받지 않습니다.)
h0 = torch.zeros(self.num_layers, x.size()[0], self.hidden_size).to(self.device)
그리고 out의 형태가 궁금하시면 바로 윗줄에 print(out.shape)를 넣어서 확인하시면 되요!
감사합니다.
수업자료 제공 부탁드립니다.
0
96
2
코드가 어디에 있는지 모르겠습니다.
0
95
2
논문 구현
0
188
2
overfitting이 나는 이유가 궁금합니다.
1
171
2
분류 성능이 잘 안 나오는 이유
0
219
1
AutoEncoder 차원 질문
1
252
2
사전 학습 모델에서의 layer 변경에 대한 질문
1
222
1
7강 폴더 만들
0
261
1
4-3강 cross-validation에서의 best model 선정 기준
0
450
1
regression 문제에 대한 결과 시각화
0
215
1
Loss function 관련하여 질문드립니다.
0
958
1
early stopping 코드 문의
0
327
1
예측 그래프
0
355
1
데이터 불균형
1
365
1
8강 전이 학습 질문
0
398
2
data의 gpu처리 질문
0
242
1
nn.Linear(1024, 10) 관련 질문드립니다.
0
289
1
학습과 평가시 Loss 함수가 다른 이유
0
249
1
전처리 관련해서 질문 있습니다.
0
226
1
데이터 엔지니어의 역량을 기르려면 어떻게 해야할까요?
0
935
2
역전파 내용 중 미분 관련 질문 드립니다
1
282
1
8강 전이학습에서 kernel size 관련 질문 드립니다.
1
960
1
이미지분류-합성곱신경망(CNN) 피쳐맵 질문입니다.
1
587
1
14강 데이터 불균형 RandomRotation
1
482
1





