A entrada da camada sequencial é incompatível com a camada: erro de formas em LSTM

Dec 22 2020

Eu sou novo em redes neurais e quero usá-las para comparar com outros métodos de aprendizado de máquina. Tenho dados de série temporal multivariada com um intervalo de aproximadamente dois anos. Eu quero prever 'y' para os próximos dias com base nas outras variáveis usando LSTM. O último dia de meus dados é 2020-07-31.

df.tail()

              y   holidays  day_of_month    day_of_week month   quarter
   Date                     
 2020-07-27 32500      0      27                 0        7        3
 2020-07-28 33280      0      28                 1        7        3
 2020-07-29 31110      0      29                 2        7        3
 2020-07-30 37720      0      30                 3        7        3
 2020-07-31 32240      0      31                 4        7        3

Para treinar o modelo LSTM, também divido os dados em dados de treinamento e teste.

from sklearn.model_selection import train_test_split
split_date = '2020-07-27' #to predict the next 4 days
df_train = df.loc[df.index <= split_date].copy()
df_test = df.loc[df.index > split_date].copy()
X1=df_train[['day_of_month','day_of_week','month','quarter','holidays']]
y1=df_train['y']
X2=df_test[['day_of_month','day_of_week','month','quarter','holidays']]
y2=df_test['y']

X_train, y_train =X1, y1
X_test, y_test = X2,y2

Como estou trabalhando com LSTM, é necessário algum dimensionamento:

scaler = MinMaxScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

Agora, na parte difícil: o modelo.

num_units=50
activation_function = 'sigmoid'
optimizer = 'adam'
loss_function = 'mean_squared_error'
batch_size = 10
num_epochs = 100

 # Initialize the RNN
regressor = Sequential()

 # Adding the input layer and the LSTM layer
regressor.add(LSTM(units = num_units, return_sequences=True ,activation = activation_function, 
input_shape=(X_train.shape[1], 1)))

 # Adding the output layer
regressor.add(Dense(units = 1))

 # Compiling the RNN
regressor.compile(optimizer = optimizer, loss = loss_function)

# Using the training set to train the model
regressor.fit(X_train_scaled, y_train, batch_size = batch_size, epochs = num_epochs)

No entanto, recebo o seguinte erro:

ValueError: Input 0 of layer sequential_11 is incompatible with the layer: expected ndim=3, found 
ndim=2. Full shape received: [None, 5]

Não entendo como escolhemos os parâmetros ou a forma da entrada. Eu vi alguns vídeos e li algumas páginas do Github e todo mundo parece rodar LSTM de uma maneira diferente, o que torna ainda mais difícil de implementar. O erro anterior provavelmente está vindo da forma, mas fora isso, está tudo certo? E como posso consertar isso para funcionar? Obrigado

EDIT: Esta questão semelhante não resolve o meu problema .. Tentei a solução a partir daí

x_train = X_train_scaled.reshape(-1, 1, 5)
x_test  = X_test_scaled.reshape(-1, 1, 5)

(Meu X_test e y_test têm apenas uma coluna). E a solução também parece não funcionar. Eu recebo este erro agora:

ValueError: Input 0 is incompatible with layer sequential_22: expected shape= 
(None, None, 1), found shape=[None, 1, 5]

Respostas

2 YoanB.M.Sc Dec 22 2020 at 21:18

ENTRADA:

O problema é que você modela espera uma entrada 3D de forma, (batch, sequence, features)mas X_trainna verdade você é uma fatia do quadro de dados, então uma matriz 2D:

X1=df_train[['day_of_month','day_of_week','month','quarter','holidays']]
X_train, y_train =X1, y1

Suponho que suas colunas sejam seus recursos, então o que você normalmente faria é "empilhar fatias" de seu df para que você se X_trainpareça com isso:

Aqui está um conjunto de dados 2D fictício de forma (15,5):

data = np.zeros((15,5))

array([[0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.]])

Você pode remodelá-lo para adicionar uma dimensão de lote, por exemplo (15,1,5):

data = data[:,np.newaxis,:] 

array([[[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]]])

Mesmos dados, mas apresentados de forma diferente. Agora, neste exemplo, batch = 15e sequence = 1, não sei qual é o comprimento da sequência no seu caso, mas pode ser qualquer coisa.

MODELO :

Agora em seu modelo, keras input_shapeespere (batch, sequence, features), quando você passar isso:

input_shape=(X_train.shape[1], 1)

Isso é o que seu modelo vê: (None, Sequence = X_train.shape[1] , num_features = 1) Noneé para a dimensão do lote. Não acho que é isso que você está tentando fazer, então, depois de remodelar, você também deve corrigir input_shapepara corresponder à nova matriz.

1 mujjiga Dec 24 2020 at 21:27

É um problema de regressão multivariada que você está resolvendo usando LSTM. Antes de entrar no código, vamos realmente ver o que isso significa

Declaração do problema:

Você tem 5recurso holidays, day_of_month, day_of_week,month,quarterpor dia por kdias
Para qualquer dia n, dadas as características de, digamos, últimos 'm' dias, você deseja prever o ydo ndia

Criando conjunto de dados da janela:

Nós primeiro precisamos decidir o número de dias que queremos alimentar para nosso modelo. Isso é chamado de comprimento de sequência (vamos fixá-lo em 3 para este exemplo).
Temos que dividir os dias de duração da sequência para criar o trem e o conjunto de dados de teste. Isso é feito usando uma janela deslizante onde o tamanho da janela é o comprimento da sequência.
Como você pode ver, não há previsões disponíveis pelos últimos pregistros onde pé o comprimento da sequência.
Faremos as criações do dataset da janela usando o timeseries_dataset_from_arraymétodo.
Para informações mais avançadas, siga os documentos oficiais do tf .

Modelo LSTM

Portanto, o que queremos alcançar é mostrado abaixo:

Para cada desdobramento de célula LSTM, passamos as 5 características do dia e desdobramos no mtempo, onde mé o comprimento da sequência. Estamos prevendo o fim ydo último dia.

A entrada da camada sequencial é incompatível com a camada: erro de formas em LSTM

Respostas

Declaração do problema:

Criando conjunto de dados da janela:

Modelo LSTM

Código: