inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[파이토치] 실전 인공지능으로 이어지는 딥러닝 - 기초부터 논문 구현까지

인공지능은 특징을 잘 추려내고 있을까? - t-SNE(t-Stochastic Neighbor Embedding)

파이토치책 코드오류 질문

937

김남욱

작성한 질문수 63

0

안녕하세요 항상 좋은 강의 감사드립니다. 출간하신 파이토치 책과 함께 학습 중에 오류가 있어서 질문드립니다.

강의와 다르게 책에는 CIFAR10 이미지에 맞도록   model.conv1 = nn.Conv2d(364, kernel_size=3, stride=1, padding=1) 코드를 넣어주신 것 같은데,

이후에 나와있는model.load_state_dict(torch.load("/models/cifar10_resnet18.pth")) 코드를 구동하였을 때,

RuntimeError: Error(s) in loading state_dict for ResNet: Missing key(s) in state_dict: "conv1.bias". size mismatch for conv1.weight: copying a param with shape torch.Size([64, 3, 7, 7]) from checkpoint, the shape in current model is torch.Size([64, 3, 3, 3]).

이러한 오류가 발생합니다.

보기에는 로드한 모델 파라미터가 7x7의 Conv1 커널 사이즈에 맞춰저있는 것 같은데 맞는지 궁금합니다. 또한 Conv1 선언시 bias=False 도 같이 넣어줘야 하는 것인지 궁금합니다.

우선은 오류로 인해 model.conv1 선언 없이 강의 코드대로 했을 경우에는 정상적으로 작동하였습니다.

 

또한 추가 질문으로, 학습된 모델에 대해서 model.fc 를 항등함수로 바꾸어 주기에 model.fc = nn.Linear(num_ftrs, 10) 코드는 사실상 사용안하여도 되는 것처럼 보이는데 맞는지 궁금합니다!!!

 

머신러닝 배워볼래요? 딥러닝 python 인공신경망 pytorch

답변 1

0

딥러닝호형

안녕하세요. 

책과 강의는 코드가 다른 부분들이 있기 때문에 책에 대한 질문을 하실 경우에는 책에서 제공하는 파일명 알려주시면 감사하겠습니다! 일단 책과 강의 코드 모두 확인하였습니다.

 

1. 책 코드 10.2 t-SNE, PCA.ipynb 파일에서는 오류가 확인되지 않습니다.

2. 강의 코드 13강 Visualization.ipynb 파일도 오류가 확인되지 않습니다.

혹시 책과 강의 코드 및 모델 파일을  혼용해서 사용하셨는지 확인 부탁드립니다. 

3. 클래스1000개를 가진 이미지넷으로 사전학습한 resnet을 사용하였기 때문에 model.fc = nn.Linear(num_ftrs, 10)을 사용하여 클래스 10개로 바꿔주셔야만 우리가 CIFAR10으로 만든 모델을 불러올 수 있습니다.

 

감사합니다!

수업자료 제공 부탁드립니다.

0

118

2

코드가 어디에 있는지 모르겠습니다.

0

117

2

논문 구현

0

209

2

overfitting이 나는 이유가 궁금합니다.

1

185

2

분류 성능이 잘 안 나오는 이유

0

227

1

AutoEncoder 차원 질문

1

260

2

사전 학습 모델에서의 layer 변경에 대한 질문

1

227

1

7강 폴더 만들

0

268

1

4-3강 cross-validation에서의 best model 선정 기준

0

462

1

regression 문제에 대한 결과 시각화

0

220

1

Loss function 관련하여 질문드립니다.

0

974

1

early stopping 코드 문의

0

333

1

예측 그래프

0

364

1

데이터 불균형

1

368

1

8강 전이 학습 질문

0

409

2

data의 gpu처리 질문

0

248

1

nn.Linear(1024, 10) 관련 질문드립니다.

0

297

1

학습과 평가시 Loss 함수가 다른 이유

0

256

1

전처리 관련해서 질문 있습니다.

0

232

1

데이터 엔지니어의 역량을 기르려면 어떻게 해야할까요?

0

950

2

역전파 내용 중 미분 관련 질문 드립니다

1

285

1

8강 전이학습에서 kernel size 관련 질문 드립니다.

1

969

1

이미지분류-합성곱신경망(CNN) 피쳐맵 질문입니다.

1

594

1

14강 데이터 불균형 RandomRotation

1

488

1