Wprowadzanie kolejności warstw jest niekompatybilne z błędem warstwa: kształty w LSTM

Dec 22 2020

Nie mam doświadczenia w sieciach neuronowych i chcę ich używać do porównywania z innymi metodami uczenia maszynowego. Mam wielowymiarowe dane szeregów czasowych o zakresie około dwóch lat. Chcę przewidzieć „y” na kilka następnych dni w oparciu o inne zmienne przy użyciu LSTM. Ostatni dzień moich danych to 2020-07-31.

df.tail()

              y   holidays  day_of_month    day_of_week month   quarter
   Date                     
 2020-07-27 32500      0      27                 0        7        3
 2020-07-28 33280      0      28                 1        7        3
 2020-07-29 31110      0      29                 2        7        3
 2020-07-30 37720      0      30                 3        7        3
 2020-07-31 32240      0      31                 4        7        3

Aby wytrenować model LSTM, podzieliłem również dane na dane pociągowe i testowe.

from sklearn.model_selection import train_test_split
split_date = '2020-07-27' #to predict the next 4 days
df_train = df.loc[df.index <= split_date].copy()
df_test = df.loc[df.index > split_date].copy()
X1=df_train[['day_of_month','day_of_week','month','quarter','holidays']]
y1=df_train['y']
X2=df_test[['day_of_month','day_of_week','month','quarter','holidays']]
y2=df_test['y']

X_train, y_train =X1, y1
X_test, y_test = X2,y2

Ponieważ pracuję z LSTM, potrzebne jest pewne skalowanie:

scaler = MinMaxScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

A teraz trudna część: model.

num_units=50
activation_function = 'sigmoid'
optimizer = 'adam'
loss_function = 'mean_squared_error'
batch_size = 10
num_epochs = 100

 # Initialize the RNN
regressor = Sequential()

 # Adding the input layer and the LSTM layer
regressor.add(LSTM(units = num_units, return_sequences=True ,activation = activation_function, 
input_shape=(X_train.shape[1], 1)))

 # Adding the output layer
regressor.add(Dense(units = 1))

 # Compiling the RNN
regressor.compile(optimizer = optimizer, loss = loss_function)

# Using the training set to train the model
regressor.fit(X_train_scaled, y_train, batch_size = batch_size, epochs = num_epochs)

Jednak pojawia się następujący błąd:

ValueError: Input 0 of layer sequential_11 is incompatible with the layer: expected ndim=3, found 
ndim=2. Full shape received: [None, 5]

Nie rozumiem, jak dobieramy parametry lub kształt danych wejściowych. Widziałem kilka filmów i przeczytałem kilka stron Github i wydaje się, że każdy uruchamia LSTM w inny sposób, co jeszcze bardziej utrudnia wdrożenie. Poprzedni błąd prawdopodobnie pochodzi z kształtu, ale poza tym wszystko inne jest w porządku? Jak mogę to naprawić, aby działało? Dzięki

EDYCJA: To podobne pytanie nie rozwiązuje mojego problemu. Stamtąd wypróbowałem rozwiązanie

x_train = X_train_scaled.reshape(-1, 1, 5)
x_test  = X_test_scaled.reshape(-1, 1, 5)

(Moje X_test i y_test mają tylko jedną kolumnę). Wydaje się, że rozwiązanie również nie działa. Teraz pojawia się ten błąd:

ValueError: Input 0 is incompatible with layer sequential_22: expected shape= 
(None, None, 1), found shape=[None, 1, 5]

Odpowiedzi

2 YoanB.M.Sc Dec 22 2020 at 21:18

WEJŚCIE:

Problem polega na tym, że model spodziewasz się wprowadzenia kształtu 3D, (batch, sequence, features)ale w X_trainrzeczywistości jest to wycinek ramki danych, więc tablica 2D:

X1=df_train[['day_of_month','day_of_week','month','quarter','holidays']]
X_train, y_train =X1, y1

Zakładam, że twoje kolumny mają być twoimi funkcjami, więc to, co zwykle robisz, to "układanie plasterków" swojego df, aby X_trainwyglądać mniej więcej tak:

Oto fikcyjny zestaw danych 2D w kształcie (15,5):

data = np.zeros((15,5))

array([[0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.]])

Możesz zmienić jego kształt, aby dodać wymiar wsadowy, na przykład (15,1,5):

data = data[:,np.newaxis,:] 

array([[[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]]])

Te same dane, ale przedstawione w inny sposób. Teraz w tym przykładzie, batch = 15i sequence = 1, nie wiem co jest długością sekwencji w Twoim przypadku, ale może to być cokolwiek.

MODEL :

Teraz w swoim modelu, keras input_shapespodziewaj się (batch, sequence, features), kiedy zdasz to:

input_shape=(X_train.shape[1], 1)

Oto, co widzi model: (None, Sequence = X_train.shape[1] , num_features = 1) Nonedotyczy wymiaru partii. Nie sądzę, że właśnie to próbujesz zrobić, więc po zmianie kształtu powinieneś również poprawić, input_shapeaby dopasować nową tablicę.

Wprowadzanie kolejności warstw jest niekompatybilne z błędem warstwa: kształty w LSTM

Odpowiedzi

Opis problemu:

Tworzenie zestawu danych okna:

Model LSTM

Kod: