시계열-워크 포워드 유효성 검사
시계열 모델링에서는 시간 경과에 따른 예측의 정확도가 점점 낮아 지므로 추가 예측에 사용할 수있게되면 실제 데이터로 모델을 다시 훈련하는 것이보다 현실적인 접근 방식입니다. 통계 모델의 훈련은 시간이 많이 걸리지 않으므로 가장 정확한 결과를 얻으려면 워크 포워드 검증이 가장 선호되는 솔루션입니다.
데이터에 대해 한 단계 전진 검증을 적용하고 이전에 얻은 결과와 비교해 보겠습니다.
[333] :
prediction = []
data = train.values
for t In test.values:
model = (ExponentialSmoothing(data).fit())
y = model.predict()
prediction.append(y[0])
data = numpy.append(data, t)
[335] :
test_ = pandas.DataFrame(test)
test_['predictionswf'] = prediction
[341] :
plt.plot(test_['T'])
plt.plot(test_.predictionswf, '--')
plt.show()
[340] :
error = sqrt(metrics.mean_squared_error(test.values,prediction))
print ('Test RMSE for Triple Exponential Smoothing with Walk-Forward Validation: ', error)
Test RMSE for Triple Exponential Smoothing with Walk-Forward Validation: 11.787532205759442
이제 우리 모델이 훨씬 더 잘 수행된다는 것을 알 수 있습니다. 사실, 추세가 너무 가깝게 따라 가기 때문에 플롯에서 예측이 실제 값과 겹칩니다. ARIMA 모델에도 워크 포워드 유효성 검사를 적용 할 수 있습니다.