제발 도와주세요ㅜㅠ

Question


import numpy as np
from keras.models import Sequential
from keras.layers import Dense, Dropout, Flatten, LSTM
from keras.layers import BatchNormalization
from keras.initializers import he_normal
!pip install np_utils
import np_utils
from tensorflow.keras.utils import to_categorical
from google.colab import drive

drive.mount('/content/drive')

[train_x, train_y, test_x, test_y] = np.load('/content/drive/MyDrive/LSTM_disaster_prediction_data.npy', allow_pickle = True)

X_train = train_x.astype('float32')
X_test = test_x.astype('float32')

X_train = np.transpose(X_train,(0,2,1))
X_test = np.transpose(X_test,(0,2,1))

y_train = to_categorical(train_y, num_classes=num_classes)
y_test = to_categorical(test_y, num_classes=num_classes)

num_classes = y_train.shape[1]

model = Sequential()
model.add(LSTM(units = 4, return_sequences = True, input_shape = (168, 12)))
model.add(LSTM(units = 1, return_sequences= True))
model.add(BatchNormalization())
model.add(Dense(64,activation = 'relu', kernel_initializer = 'he_normal'))
model.add(Dropout(0.25))
model.add(Dense(num_classes, activation = 'softmax'))

model.summary()

model.compile(loss = 'categorical_crossentropy', optimizer = 'adam', metrics = ['accuracy'])

model.fit(X_train, y_train, epochs = 5, batch_size = 16, verbose = 1, validation_data=(X_test, y_test))

test_loss, test_accuracy = model.evaluate(X_test, y_test)

print('검증결과')
print('test loss = ', test_loss)
print('test accuracy = ', test_accuracy)

ValueError: Shapes (None, 3) and (None, 168, 3) are incompatible

이렇게 뜨는데 어떻게 고쳐야할지 모르겠어요 ㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠ

Answer

안녕하세요, 인프런 AI 인턴입니다.
민준님, 제공해 주신 코드를 확인해보니 num_classes 변수가 사용되기 전에 선언되어야 하는 문제가 있습니다. num_classes는 to_categorical 함수를 호출하기 전에 선언되어야 하는데, 현재 코드 상으로는 그 함수 호출 이후에 선언되고 있습니다. 다음과 같이 코드를 수정해보시겠어요?

...
# num_classes 정의를 to_categorical 사용 전으로 이동
num_classes = np.max(train_y) + 1

y_train = to_categorical(train_y, num_classes=num_classes)
y_test = to_categorical(test_y, num_classes=num_classes)
...

이렇게 수정하시면 y_train과 y_test의 원-핫 인코딩이 올바르게 이루어질 것입니다. 또한, 모델의 마지막 LSTM 레이어에서 return_sequences를 True로 할 경우 마지막 타임 스텝의 출력이 아닌 모든 타임 스템의 출력을 반환하게 되는데, 이렇게 하면 Dense 레이어의 입력 차원과 맞지 않아 에러가 발생합니다. return_sequences를 False로 변경해서 마지막 타임 스텝만 반환하도록 해야할 것 같습니다. 아래와 같이 수정해 보세요.

...
model.add(LSTM(units = 4, return_sequences = True, input_shape = (168, 12)))
model.add(LSTM(units = 1, return_sequences = False))  # 여기를 수정
model.add(BatchNormalization())
...

이렇게 코드를 수정하신 후 다시 실행하시면 문제를 해결하실 수 있을 것입니다.

민준

제발 도와주세요ㅜㅠ

이 글과 비슷한 Q&A

test data 의 loss 계산식 문의

2D pose estimation model

tiny kitti 데이터로 MMDectection Train 실습에서 클래스 id 질문

Section14 관련 질문요청드립니다.