Керас - Прогнозирование регрессии с использованием MPL
В этой главе давайте напишем простую ANN на основе MPL для прогнозирования регрессии. До сих пор мы делали только прогноз на основе классификации. Теперь мы попытаемся предсказать следующее возможное значение, проанализировав предыдущие (непрерывные) значения и их влияющие факторы.
MPL регрессии может быть представлен следующим образом -
Основные особенности модели следующие:
Входной слой состоит из (13,) значений.
Первый уровень, Dense, состоит из 64 модулей и функции активации relu с «нормальным» инициализатором ядра.
Второй уровень, Dense, состоит из 64 блоков и функции активации relu.
Выходной слой Dense состоит из 1 единицы.
Использовать mse как функция потерь.
Использовать RMSprop как оптимизатор.
Использовать accuracy как метрики.
Используйте 128 в качестве размера партии.
Используйте 500 как эпохи.
Step 1 − Import the modules
Импортируем необходимые модули.
import keras
from keras.datasets import boston_housing
from keras.models import Sequential
from keras.layers import Dense
from keras.optimizers import RMSprop
from keras.callbacks import EarlyStopping
from sklearn import preprocessing
from sklearn.preprocessing import scale
Step 2 − Load data
Давайте импортируем набор данных о жилищном строительстве Бостона.
(x_train, y_train), (x_test, y_test) = boston_housing.load_data()
Вот,
boston_housing- это набор данных, предоставленный Керасом. Он представляет собой сборник информации о жилье в районе Бостона, каждый из которых имеет 13 функций.
Step 3 − Process the data
Давайте изменим набор данных в соответствии с нашей моделью, чтобы мы могли использовать нашу модель. Данные можно изменить с помощью кода ниже -
x_train_scaled = preprocessing.scale(x_train)
scaler = preprocessing.StandardScaler().fit(x_train)
x_test_scaled = scaler.transform(x_test)
Здесь мы нормализовали данные обучения, используя sklearn.preprocessing.scale функция. preprocessing.StandardScaler().fit функция возвращает скаляр с нормализованным средним и стандартным отклонением обучающих данных, который мы можем применить к тестовым данным, используя scalar.transformфункция. Это также нормализует тестовые данные с теми же настройками, что и данные для обучения.
Step 4 − Create the model
Создадим актуальную модель.
model = Sequential()
model.add(Dense(64, kernel_initializer = 'normal', activation = 'relu',
input_shape = (13,)))
model.add(Dense(64, activation = 'relu')) model.add(Dense(1))
Step 5 − Compile the model
Скомпилируем модель, используя выбранную функцию потерь, оптимизатор и метрики.
model.compile(
loss = 'mse',
optimizer = RMSprop(),
metrics = ['mean_absolute_error']
)
Step 6 − Train the model
Обучим модель, используя fit() метод.
history = model.fit(
x_train_scaled, y_train,
batch_size=128,
epochs = 500,
verbose = 1,
validation_split = 0.2,
callbacks = [EarlyStopping(monitor = 'val_loss', patience = 20)]
)
Здесь мы использовали функцию обратного вызова, EarlyStopping. Цель этого обратного вызова - отслеживать значение потерь в течение каждой эпохи и сравнивать его со значением потерь за предыдущую эпоху, чтобы найти улучшение в обучении. Если нет улучшения дляpatience раз, то весь процесс будет остановлен.
Запуск приложения даст следующую информацию в качестве вывода -
Train on 323 samples, validate on 81 samples Epoch 1/500 2019-09-24 01:07:03.889046: I
tensorflow/core/platform/cpu_feature_guard.cc:142]
Your CPU supports instructions that this
TensorFlow binary was not co mpiled to use: AVX2 323/323
[==============================] - 0s 515us/step - loss: 562.3129
- mean_absolute_error: 21.8575 - val_loss: 621.6523 - val_mean_absolute_erro
r: 23.1730 Epoch 2/500
323/323 [==============================] - 0s 11us/step - loss: 545.1666
- mean_absolute_error: 21.4887 - val_loss: 605.1341 - val_mean_absolute_error
: 22.8293 Epoch 3/500
323/323 [==============================] - 0s 12us/step - loss: 528.9944
- mean_absolute_error: 21.1328 - val_loss: 588.6594 - val_mean_absolute_error
: 22.4799 Epoch 4/500
323/323 [==============================] - 0s 12us/step - loss: 512.2739
- mean_absolute_error: 20.7658 - val_loss: 570.3772 - val_mean_absolute_error
: 22.0853 Epoch 5/500
323/323 [==============================] - 0s 9us/step - loss: 493.9775
- mean_absolute_error: 20.3506 - val_loss: 550.9548 - val_mean_absolute_error: 21.6547
..........
..........
..........
Epoch 143/500
323/323 [==============================] - 0s 15us/step - loss: 8.1004
- mean_absolute_error: 2.0002 - val_loss: 14.6286 - val_mean_absolute_error:
2. 5904 Epoch 144/500
323/323 [==============================] - 0s 19us/step - loss: 8.0300
- mean_absolute_error: 1.9683 - val_loss: 14.5949 - val_mean_absolute_error:
2. 5843 Epoch 145/500
323/323 [==============================] - 0s 12us/step - loss: 7.8704
- mean_absolute_error: 1.9313 - val_loss: 14.3770 - val_mean_absolute_error: 2. 4996
Step 7 − Evaluate the model
Оценим модель на тестовых данных.
score = model.evaluate(x_test_scaled, y_test, verbose = 0)
print('Test loss:', score[0])
print('Test accuracy:', score[1])
Выполнение приведенного выше кода выведет следующую информацию -
Test loss: 21.928471583946077 Test accuracy: 2.9599233234629914
Step 8 − Predict
Наконец, сделайте прогноз, используя тестовые данные, как показано ниже -
prediction = model.predict(x_test_scaled)
print(prediction.flatten())
print(y_test)
Вывод вышеуказанного приложения выглядит следующим образом -
[ 7.5612316 17.583357 21.09344 31.859276 25.055613 18.673872 26.600405 22.403967 19.060272 22.264952
17.4191 17.00466 15.58924 41.624374 20.220217 18.985565 26.419338 19.837091 19.946192 36.43445
12.278508 16.330965 20.701359 14.345301 21.741161 25.050423 31.046402 27.738455 9.959419 20.93039
20.069063 14.518344 33.20235 24.735163 18.7274 9.148898 15.781284 18.556862 18.692865 26.045074
27.954073 28.106823 15.272034 40.879818 29.33896 23.714525 26.427515 16.483374 22.518442 22.425386
33.94826 18.831465 13.2501955 15.537227 34.639984 27.468002 13.474407 48.134598 34.39617
22.8503124.042334 17.747198 14.7837715 18.187277 23.655672 22.364983 13.858193 22.710032 14.371148
7.1272087 35.960033 28.247292 25.3014 14.477208 25.306196 17.891165 20.193708 23.585173 34.690193
12.200583 20.102983 38.45882 14.741723 14.408362 17.67158 18.418497 21.151712 21.157492 22.693687
29.809034 19.366991 20.072294 25.880817 40.814568 34.64087 19.43741 36.2591 50.73806 26.968863 43.91787
32.54908 20.248306 ] [ 7.2 18.8 19. 27. 22.2 24.5 31.2 22.9 20.5 23.2 18.6 14.5 17.8 50. 20.8 24.3 24.2
19.8 19.1 22.7 12. 10.2 20. 18.5 20.9 23. 27.5 30.1 9.5 22. 21.2 14.1 33.1 23.4 20.1 7.4 15.4 23.8 20.1
24.5 33. 28.4 14.1 46.7 32.5 29.6 28.4 19.8 20.2 25. 35.4 20.3 9.7 14.5 34.9 26.6 7.2 50. 32.4 21.6 29.8
13.1 27.5 21.2 23.1 21.9 13. 23.2 8.1 5.6 21.7 29.6 19.6 7. 26.4 18.9 20.9 28.1 35.4 10.2 24.3 43.1 17.6
15.4 16.2 27.1 21.4 21.5 22.4 25. 16.6 18.6 22. 42.8 35.1 21.5 36. 21.9 24.1 50. 26.7 25. ]
Выходные данные обоих массивов имеют разницу примерно в 10-30%, и это указывает на то, что наша модель предсказывает разумный диапазон.