Ввод последовательности слоев несовместим с ошибкой слоя: формы в LSTM

Dec 22 2020

Я новичок в нейронных сетях и хочу использовать их для сравнения с другими методами машинного обучения. У меня есть данные многомерного временного ряда с диапазоном примерно двух лет. Я хочу предсказать «y» на следующие несколько дней на основе других переменных, используя LSTM. Последний день моих данных - 31.07.2020.

df.tail()

              y   holidays  day_of_month    day_of_week month   quarter
   Date                     
 2020-07-27 32500      0      27                 0        7        3
 2020-07-28 33280      0      28                 1        7        3
 2020-07-29 31110      0      29                 2        7        3
 2020-07-30 37720      0      30                 3        7        3
 2020-07-31 32240      0      31                 4        7        3

Чтобы обучить модель LSTM, я также разделил данные на обучающие и тестовые данные.

from sklearn.model_selection import train_test_split
split_date = '2020-07-27' #to predict the next 4 days
df_train = df.loc[df.index <= split_date].copy()
df_test = df.loc[df.index > split_date].copy()
X1=df_train[['day_of_month','day_of_week','month','quarter','holidays']]
y1=df_train['y']
X2=df_test[['day_of_month','day_of_week','month','quarter','holidays']]
y2=df_test['y']

X_train, y_train =X1, y1
X_test, y_test = X2,y2

Поскольку я работаю с LSTM, необходимо некоторое масштабирование:

scaler = MinMaxScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

Теперь о сложной части: модели.

num_units=50
activation_function = 'sigmoid'
optimizer = 'adam'
loss_function = 'mean_squared_error'
batch_size = 10
num_epochs = 100

 # Initialize the RNN
regressor = Sequential()

 # Adding the input layer and the LSTM layer
regressor.add(LSTM(units = num_units, return_sequences=True ,activation = activation_function, 
input_shape=(X_train.shape[1], 1)))

 # Adding the output layer
regressor.add(Dense(units = 1))

 # Compiling the RNN
regressor.compile(optimizer = optimizer, loss = loss_function)

# Using the training set to train the model
regressor.fit(X_train_scaled, y_train, batch_size = batch_size, epochs = num_epochs)

Однако я получаю следующую ошибку:

ValueError: Input 0 of layer sequential_11 is incompatible with the layer: expected ndim=3, found 
ndim=2. Full shape received: [None, 5]

Я не понимаю, как мы выбираем параметры или форму ввода. Я видел несколько видеороликов и читал некоторые страницы Github, и, похоже, каждый запускает LSTM по-своему, что еще больше затрудняет его реализацию. Предыдущая ошибка, вероятно, связана с формой, но все остальное правильно? И как это исправить, чтобы работало? Спасибо

РЕДАКТИРОВАТЬ: этот аналогичный вопрос не решает мою проблему .. Я пробовал решение оттуда

x_train = X_train_scaled.reshape(-1, 1, 5)
x_test  = X_test_scaled.reshape(-1, 1, 5)

(Мои X_test и y_test имеют только один столбец). И решение тоже, похоже, не работает. Теперь я получаю эту ошибку:

ValueError: Input 0 is incompatible with layer sequential_22: expected shape= 
(None, None, 1), found shape=[None, 1, 5]

Ответы

2 YoanB.M.Sc Dec 22 2020 at 21:18

ВХОД:

Проблема в том, что вы ожидаете 3D-ввод формы, (batch, sequence, features)но на X_trainсамом деле это часть фрейма данных, поэтому 2D-массив:

X1=df_train[['day_of_month','day_of_week','month','quarter','holidays']]
X_train, y_train =X1, y1

Я предполагаю, что ваши столбцы должны быть вашими функциями, поэтому вы обычно будете «складывать фрагменты» вашего df, чтобы вы X_trainвыглядели примерно так:

Вот фиктивный набор 2D-данных формы (15,5):

data = np.zeros((15,5))

array([[0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.]])

Вы можете изменить его форму, чтобы добавить размер партии, например (15,1,5):

data = data[:,np.newaxis,:] 

array([[[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]],

       [[0., 0., 0., 0., 0.]]])

Те же данные, но представлены в другом виде. Теперь в этом примере, batch = 15и sequence = 1я не знаю, какова длина последовательности в вашем случае, но это может быть что угодно.

МОДЕЛЬ:

Теперь в вашей модели keras input_shapeожидайте (batch, sequence, features), когда вы передадите это:

input_shape=(X_train.shape[1], 1)

Это то, что вы видите в модели: (None, Sequence = X_train.shape[1] , num_features = 1) Noneразмер партии. Я не думаю, что это то, что вы пытаетесь сделать, поэтому после того, как вы изменили форму, вам также следует исправить, input_shapeчтобы он соответствовал новому массиву.

1 mujjiga Dec 24 2020 at 21:27

Это задача многомерной регрессии, которую вы решаете с помощью LSTM. Прежде чем переходить к коду, давайте посмотрим, что это значит

Постановка задачи:

У вас есть 5функция holidays, day_of_month, day_of_week,month,quarterв день в течение kнескольких дней
В любой день п, учитывая особенность говорят последние «м» дней вы хотите , чтобы предсказать yв nй день

Создание набора данных окна:

Сначала нам нужно решить, сколько дней мы хотим скормить нашей модели. Это называется длиной последовательности (в этом примере зафиксируем ее равной 3).
Мы должны разделить дни длины последовательности, чтобы создать набор данных для поезда и тестирования. Это делается с помощью скользящего окна, где размер окна - это длина последовательности.
Как видите, нет доступных прогнозов по последним pзаписям, где p- длина последовательности.
Мы будем создавать оконные наборы данных, используя timeseries_dataset_from_arrayметод.
Для получения дополнительных сведений следуйте официальным документам tf .

Модель LSTM

Итак, наглядное изображение того, чего мы хотим достичь, показано ниже:

Для каждого развертывания ячейки LSTM мы передаем 5 функций дня и развертываем во mвремени, где m- длина последовательности. Мы предсказываем yпоследний день.

Ввод последовательности слоев несовместим с ошибкой слоя: формы в LSTM

Ответы

Постановка задачи:

Создание набора данных окна:

Модель LSTM

Код: