Die Eingabe der Layersequenz ist nicht mit dem Layer: Shapes-Fehler in LSTM kompatibel

Dec 22 2020

Ich bin neu in neuronalen Netzen und möchte sie verwenden, um sie mit anderen Methoden des maschinellen Lernens zu vergleichen. Ich habe multivariate Zeitreihendaten mit einem Bereich von ungefähr zwei Jahren. Ich möchte 'y' für die nächsten Tage basierend auf den anderen Variablen unter Verwendung von LSTM vorhersagen. Der letzte Tag meiner Daten ist der 31.07.2020.

df.tail()

              y   holidays  day_of_month    day_of_week month   quarter
   Date                     
 2020-07-27 32500      0      27                 0        7        3
 2020-07-28 33280      0      28                 1        7        3
 2020-07-29 31110      0      29                 2        7        3
 2020-07-30 37720      0      30                 3        7        3
 2020-07-31 32240      0      31                 4        7        3

Um das LSTM-Modell zu trainieren, habe ich die Daten auch in Zug- und Testdaten aufgeteilt.

from sklearn.model_selection import train_test_split
split_date = '2020-07-27' #to predict the next 4 days
df_train = df.loc[df.index <= split_date].copy()
df_test = df.loc[df.index > split_date].copy()
X1=df_train[['day_of_month','day_of_week','month','quarter','holidays']]
y1=df_train['y']
X2=df_test[['day_of_month','day_of_week','month','quarter','holidays']]
y2=df_test['y']

X_train, y_train =X1, y1
X_test, y_test = X2,y2

Da ich mit LSTM arbeite, ist eine gewisse Skalierung erforderlich:

scaler = MinMaxScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

Nun zum schwierigen Teil: dem Modell.

num_units=50
activation_function = 'sigmoid'
optimizer = 'adam'
loss_function = 'mean_squared_error'
batch_size = 10
num_epochs = 100

 # Initialize the RNN
regressor = Sequential()

 # Adding the input layer and the LSTM layer
regressor.add(LSTM(units = num_units, return_sequences=True ,activation = activation_function, 
input_shape=(X_train.shape[1], 1)))

 # Adding the output layer
regressor.add(Dense(units = 1))

 # Compiling the RNN
regressor.compile(optimizer = optimizer, loss = loss_function)

# Using the training set to train the model
regressor.fit(X_train_scaled, y_train, batch_size = batch_size, epochs = num_epochs)

Ich erhalte jedoch den folgenden Fehler:

ValueError: Input 0 of layer sequential_11 is incompatible with the layer: expected ndim=3, found 
ndim=2. Full shape received: [None, 5]

Ich verstehe nicht, wie wir die Parameter oder die Form der Eingabe auswählen. Ich habe einige Videos gesehen und einige Github-Seiten gelesen, und jeder scheint LSTM auf eine andere Art und Weise auszuführen, was die Implementierung noch schwieriger macht. Der vorherige Fehler kommt wahrscheinlich von der Form, aber ansonsten ist alles andere richtig? Und wie kann ich das beheben, um zu funktionieren? Vielen Dank

EDIT: Diese ähnliche Frage löst mein Problem nicht. Ich habe die Lösung von dort versucht

x_train = X_train_scaled.reshape(-1, 1, 5)
x_test  = X_test_scaled.reshape(-1, 1, 5)

(Mein X_test und y_test haben nur eine Spalte). Und die Lösung scheint auch nicht zu funktionieren. Ich erhalte jetzt diesen Fehler:

ValueError: Input 0 is incompatible with layer sequential_22: expected shape= 
(None, None, 1), found shape=[None, 1, 5]

Antworten

2 YoanB.M.Sc Dec 22 2020 at 21:18

EINGANG:

Das Problem ist, dass Sie beim Modell eine 3D-Eingabe der Form erwarten, (batch, sequence, features)aber X_traintatsächlich ein Teil des Datenrahmens ist, also ein 2D-Array:

X1=df_train[['day_of_month','day_of_week','month','quarter','holidays']]
X_train, y_train =X1, y1

Ich gehe davon aus, dass Ihre Spalten Ihre Features sein sollen. Normalerweise würden Sie also "Slices" Ihres df stapeln, damit Sie ungefähr so X_trainaussehen:

Hier ist ein Dummy-2D-Datensatz der Form (15,5):

data = np.zeros((15,5))

array([[0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.]])

Sie können es umformen, um eine Stapeldimension hinzuzufügen, zum Beispiel (15,1,5):

data = data[:,np.newaxis,:] 

array([[[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]]])

Gleiche Daten, aber anders dargestellt. Nun, in diesem Beispiel, batch = 15und sequence = 1ich weiß nicht, wie lang die Sequenz in Ihrem Fall ist, aber es kann alles sein.

MODELL:

keras input_shapeErwarten (batch, sequence, features)Sie jetzt in Ihrem Modell , wenn Sie dies bestehen:

input_shape=(X_train.shape[1], 1)

Folgendes sieht Ihr Modell: Dies gilt (None, Sequence = X_train.shape[1] , num_features = 1) Nonefür die Batch-Dimension. Ich denke nicht, dass Sie dies versuchen, sobald Sie sich umgeformt haben, sollten Sie auch korrigieren input_shape, um mit dem neuen Array übereinzustimmen.

1 mujjiga Dec 24 2020 at 21:27

Es ist ein multivariates Regressionsproblem, das Sie mit LSTM lösen. Bevor Sie in den Code springen, lassen Sie uns sehen, was es bedeutet

Problemstellung:

Sie haben tagelang 5Funktion holidays, day_of_month, day_of_week,month,quarterpro Tagk
Für jeden Tag n möchten Sie angesichts der Merkmale der letzten 'm' Tage yden nTag des Tages vorhersagen

Fensterdatensatz erstellen:

Wir müssen zunächst entscheiden, wie viele Tage wir unserem Modell zuführen möchten. Dies wird als Sequenzlänge bezeichnet (in diesem Beispiel können wir sie auf 3 festlegen).
Wir müssen die Tage der Sequenzlänge aufteilen, um den Zug- und Testdatensatz zu erstellen. Dies erfolgt mithilfe eines Schiebefensters, bei dem die Fenstergröße der Sequenzlänge entspricht.
Wie Sie sehen können, sind für die letzten pDatensätze keine Vorhersagen verfügbar, bei denen pes sich um die Sequenzlänge handelt.
Wir werden die Fenster-Dataset-Erstellung mit der timeseries_dataset_from_arrayMethode durchführen.
Für weitere Informationen folgen Sie den offiziellen tf- Dokumenten .

LSTM-Modell

Das Bild, was wir erreichen wollen, ist unten dargestellt:

Für jedes Abrollen der LSTM-Zelle übergeben wir die 5 Merkmale des Tages und rollen uns in der mZeit ab, in der msich die Sequenzlänge befindet. Wir sagen yden letzten Tag voraus .

Die Eingabe der Layersequenz ist nicht mit dem Layer: Shapes-Fehler in LSTM kompatibel

Antworten

Problemstellung:

Fensterdatensatz erstellen:

LSTM-Modell

Code: