LSTM fc 코드 관련 문의
311
작성한 질문수 7
안녕하세요.
LSTM 모델 구축할 때,
self.fc = nn.Linear(hidden_size*sequence_length,1) 이부분에서 hidden_szie와 sequence_length를 곱해준 이유가 무엇인지 궁금합니다.
답변 1
0
안녕하세요.
lstm은 각 시퀀스 마다 아웃풋을 뽑아내게 됩니다.
여기서 마지막 시퀀스의 결과만 사용할 지 (n to 1) 전체를 사용할지 (n to n)를 정하시면 됩니다.
우리 코드에서는 전체 아웃풋을 concatenate하여 사용하게 설계되어 있습니다.
즉, (hidden_size, sequence_length)의 크기를 가진 피쳐가 나오게 됩니다.
그 다음 hidden_size*sequence_length의 크기인 벡터를 reshape을 이용하여 만들어서 fc에 넣게 됩니다.
각 라인마다 torch.Size를 확인해 보세요 :)
out, _ = self.lstm(x, (h0, c0)) # output, (hn, cn): torch.Size([20, 5, 8])
out = out.reshape(out.shape[0], -1) :torch.Size([20, 40])
out = self.fc(out): torch.Size([20, 1])
감사합니다.
수업자료 제공 부탁드립니다.
0
118
2
코드가 어디에 있는지 모르겠습니다.
0
117
2
논문 구현
0
209
2
overfitting이 나는 이유가 궁금합니다.
1
185
2
분류 성능이 잘 안 나오는 이유
0
226
1
AutoEncoder 차원 질문
1
260
2
사전 학습 모델에서의 layer 변경에 대한 질문
1
227
1
7강 폴더 만들
0
268
1
4-3강 cross-validation에서의 best model 선정 기준
0
462
1
regression 문제에 대한 결과 시각화
0
220
1
Loss function 관련하여 질문드립니다.
0
973
1
early stopping 코드 문의
0
333
1
예측 그래프
0
364
1
데이터 불균형
1
368
1
8강 전이 학습 질문
0
409
2
data의 gpu처리 질문
0
248
1
nn.Linear(1024, 10) 관련 질문드립니다.
0
297
1
학습과 평가시 Loss 함수가 다른 이유
0
256
1
전처리 관련해서 질문 있습니다.
0
232
1
데이터 엔지니어의 역량을 기르려면 어떻게 해야할까요?
0
950
2
역전파 내용 중 미분 관련 질문 드립니다
1
285
1
8강 전이학습에서 kernel size 관련 질문 드립니다.
1
969
1
이미지분류-합성곱신경망(CNN) 피쳐맵 질문입니다.
1
594
1
14강 데이터 불균형 RandomRotation
1
488
1





