Keras-MPL을 사용한 회귀 예측
이 장에서는 회귀 예측을 수행하기 위해 간단한 MPL 기반 ANN을 작성해 보겠습니다. 지금까지는 분류 기반 예측 만 수행했습니다. 이제 이전 (연속) 값과 그 영향 요인을 분석하여 다음 가능한 값을 예측하려고합니다.
회귀 MPL은 다음과 같이 나타낼 수 있습니다.
모델의 핵심 기능은 다음과 같습니다.
입력 레이어는 (13,) 값으로 구성됩니다.
첫 번째 계층 인 Dense 는 64 개의 유닛과 'normal'커널 이니셜 라이저가있는 'relu'활성화 함수로 구성됩니다.
두 번째 레이어 인 Dense 는 64 개의 유닛과 'relu'활성화 기능으로 구성됩니다.
출력 레이어, Dense 는 1 개의 단위로 구성됩니다.
사용하다 mse 손실 함수로.
사용하다 RMSprop Optimizer로.
사용하다 accuracy 메트릭으로.
128을 배치 크기로 사용하십시오.
Epoch로 500을 사용합니다.
Step 1 − Import the modules
필요한 모듈을 가져 오겠습니다.
import keras
from keras.datasets import boston_housing
from keras.models import Sequential
from keras.layers import Dense
from keras.optimizers import RMSprop
from keras.callbacks import EarlyStopping
from sklearn import preprocessing
from sklearn.preprocessing import scale
Step 2 − Load data
보스턴 주택 데이터 셋을 가져 오겠습니다.
(x_train, y_train), (x_test, y_test) = boston_housing.load_data()
여기,
boston_housingKeras에서 제공하는 데이터 세트입니다. 보스턴 지역의 주택 정보 모음을 나타내며 각각 13 개의 기능이 있습니다.
Step 3 − Process the data
모델에 따라 데이터 세트를 변경하여 모델에 입력 할 수 있습니다. 데이터는 아래 코드를 사용하여 변경할 수 있습니다-
x_train_scaled = preprocessing.scale(x_train)
scaler = preprocessing.StandardScaler().fit(x_train)
x_test_scaled = scaler.transform(x_test)
여기에서는 다음을 사용하여 훈련 데이터를 정규화했습니다. sklearn.preprocessing.scale 함수. preprocessing.StandardScaler().fit 함수는 훈련 데이터의 정규화 된 평균과 표준 편차가있는 스칼라를 반환합니다.이를 사용하여 테스트 데이터에 적용 할 수 있습니다. scalar.transform함수. 이렇게하면 학습 데이터와 동일한 설정으로 테스트 데이터도 정규화됩니다.
Step 4 − Create the model
실제 모델을 만들어 보겠습니다.
model = Sequential()
model.add(Dense(64, kernel_initializer = 'normal', activation = 'relu',
input_shape = (13,)))
model.add(Dense(64, activation = 'relu')) model.add(Dense(1))
Step 5 − Compile the model
선택한 손실 함수, 최적화 프로그램 및 메트릭을 사용하여 모델을 컴파일 해 보겠습니다.
model.compile(
loss = 'mse',
optimizer = RMSprop(),
metrics = ['mean_absolute_error']
)
Step 6 − Train the model
다음을 사용하여 모델을 훈련 시키십시오. fit() 방법.
history = model.fit(
x_train_scaled, y_train,
batch_size=128,
epochs = 500,
verbose = 1,
validation_split = 0.2,
callbacks = [EarlyStopping(monitor = 'val_loss', patience = 20)]
)
여기에서는 콜백 함수를 사용했습니다. EarlyStopping. 이 콜백의 목적은 각 Epoch 동안 손실 값을 모니터링하고 이전 Epoch 손실 값과 비교하여 훈련의 개선점을 찾는 것입니다. 개선이없는 경우patience 시간이 지나면 전체 프로세스가 중지됩니다.
응용 프로그램을 실행하면 아래 정보가 출력으로 제공됩니다.
Train on 323 samples, validate on 81 samples Epoch 1/500 2019-09-24 01:07:03.889046: I
tensorflow/core/platform/cpu_feature_guard.cc:142]
Your CPU supports instructions that this
TensorFlow binary was not co mpiled to use: AVX2 323/323
[==============================] - 0s 515us/step - loss: 562.3129
- mean_absolute_error: 21.8575 - val_loss: 621.6523 - val_mean_absolute_erro
r: 23.1730 Epoch 2/500
323/323 [==============================] - 0s 11us/step - loss: 545.1666
- mean_absolute_error: 21.4887 - val_loss: 605.1341 - val_mean_absolute_error
: 22.8293 Epoch 3/500
323/323 [==============================] - 0s 12us/step - loss: 528.9944
- mean_absolute_error: 21.1328 - val_loss: 588.6594 - val_mean_absolute_error
: 22.4799 Epoch 4/500
323/323 [==============================] - 0s 12us/step - loss: 512.2739
- mean_absolute_error: 20.7658 - val_loss: 570.3772 - val_mean_absolute_error
: 22.0853 Epoch 5/500
323/323 [==============================] - 0s 9us/step - loss: 493.9775
- mean_absolute_error: 20.3506 - val_loss: 550.9548 - val_mean_absolute_error: 21.6547
..........
..........
..........
Epoch 143/500
323/323 [==============================] - 0s 15us/step - loss: 8.1004
- mean_absolute_error: 2.0002 - val_loss: 14.6286 - val_mean_absolute_error:
2. 5904 Epoch 144/500
323/323 [==============================] - 0s 19us/step - loss: 8.0300
- mean_absolute_error: 1.9683 - val_loss: 14.5949 - val_mean_absolute_error:
2. 5843 Epoch 145/500
323/323 [==============================] - 0s 12us/step - loss: 7.8704
- mean_absolute_error: 1.9313 - val_loss: 14.3770 - val_mean_absolute_error: 2. 4996
Step 7 − Evaluate the model
테스트 데이터를 사용하여 모델을 평가 해 보겠습니다.
score = model.evaluate(x_test_scaled, y_test, verbose = 0)
print('Test loss:', score[0])
print('Test accuracy:', score[1])
위의 코드를 실행하면 아래 정보가 출력됩니다.
Test loss: 21.928471583946077 Test accuracy: 2.9599233234629914
Step 8 − Predict
마지막으로 다음과 같이 테스트 데이터를 사용하여 예측하십시오.
prediction = model.predict(x_test_scaled)
print(prediction.flatten())
print(y_test)
위 응용 프로그램의 출력은 다음과 같습니다.
[ 7.5612316 17.583357 21.09344 31.859276 25.055613 18.673872 26.600405 22.403967 19.060272 22.264952
17.4191 17.00466 15.58924 41.624374 20.220217 18.985565 26.419338 19.837091 19.946192 36.43445
12.278508 16.330965 20.701359 14.345301 21.741161 25.050423 31.046402 27.738455 9.959419 20.93039
20.069063 14.518344 33.20235 24.735163 18.7274 9.148898 15.781284 18.556862 18.692865 26.045074
27.954073 28.106823 15.272034 40.879818 29.33896 23.714525 26.427515 16.483374 22.518442 22.425386
33.94826 18.831465 13.2501955 15.537227 34.639984 27.468002 13.474407 48.134598 34.39617
22.8503124.042334 17.747198 14.7837715 18.187277 23.655672 22.364983 13.858193 22.710032 14.371148
7.1272087 35.960033 28.247292 25.3014 14.477208 25.306196 17.891165 20.193708 23.585173 34.690193
12.200583 20.102983 38.45882 14.741723 14.408362 17.67158 18.418497 21.151712 21.157492 22.693687
29.809034 19.366991 20.072294 25.880817 40.814568 34.64087 19.43741 36.2591 50.73806 26.968863 43.91787
32.54908 20.248306 ] [ 7.2 18.8 19. 27. 22.2 24.5 31.2 22.9 20.5 23.2 18.6 14.5 17.8 50. 20.8 24.3 24.2
19.8 19.1 22.7 12. 10.2 20. 18.5 20.9 23. 27.5 30.1 9.5 22. 21.2 14.1 33.1 23.4 20.1 7.4 15.4 23.8 20.1
24.5 33. 28.4 14.1 46.7 32.5 29.6 28.4 19.8 20.2 25. 35.4 20.3 9.7 14.5 34.9 26.6 7.2 50. 32.4 21.6 29.8
13.1 27.5 21.2 23.1 21.9 13. 23.2 8.1 5.6 21.7 29.6 19.6 7. 26.4 18.9 20.9 28.1 35.4 10.2 24.3 43.1 17.6
15.4 16.2 27.1 21.4 21.5 22.4 25. 16.6 18.6 22. 42.8 35.1 21.5 36. 21.9 24.1 50. 26.7 25. ]
두 배열의 출력은 약 10-30 %의 차이가 있으며 모델이 합리적인 범위로 예측 함을 나타냅니다.