Rangkaian Waktu - Metrik Kesalahan
Penting bagi kami untuk mengukur kinerja model untuk digunakan sebagai umpan balik dan perbandingan. Dalam tutorial ini kami telah menggunakan salah satu metrik error yang paling populer berarti root mean squared error. Ada berbagai metrik kesalahan lain yang tersedia. Bab ini membahasnya secara singkat.
Mean Square Error
Ini adalah rata-rata selisih kuadrat antara nilai prediksi dan nilai sebenarnya. Sklearn menyediakannya sebagai fungsi. Ini memiliki unit yang sama dengan nilai benar dan prediksi kuadrat dan selalu positif.
$$ MSE = \ frac {1} {n} \ displaystyle \ sum \ limit_ {t = 1} ^ n \ lkelompok y '_ {t} \: - y_ {t} \ rgroup ^ {2} $$
Di mana $ y '_ {t} $ adalah nilai prediksi,
$ y_ {t} $ adalah nilai sebenarnya, dan
n adalah jumlah total nilai dalam set pengujian.
Jelas dari persamaan bahwa MSE lebih menghukum untuk kesalahan yang lebih besar, atau pencilan.
Root Mean Square Error
Ini adalah akar kuadrat dari kesalahan kuadrat rata-rata. Itu juga selalu positif dan berada dalam kisaran data.
$$ RMSE = \ sqrt {\ frac {1} {n} \ displaystyle \ sum \ limit_ {t = 1} ^ n \ lgroup y '_ {t} -y_ {t} \ rgroup ^ 2} $$
Di mana, $ y '_ {t} $ adalah nilai prediksi
$ y_ {t} $ adalah nilai sebenarnya, dan
n adalah jumlah total nilai dalam set pengujian.
Ini adalah kekuatan persatuan dan karenanya lebih dapat ditafsirkan dibandingkan dengan MSE. RMSE juga lebih memberi sanksi untuk kesalahan yang lebih besar. Kami telah menggunakan metrik RMSE dalam tutorial kami.
Kesalahan Mutlak Berarti
Ini adalah rata-rata perbedaan absolut antara nilai prediksi dan nilai sebenarnya. Ini memiliki unit yang sama dengan nilai prediksi dan nilai sebenarnya dan selalu positif.
$$ MAE = \ frac {1} {n} \ displaystyle \ jumlah \ batas_ {t = 1} ^ {t = n} | y '{t} -y_ {t} \ lvert $$
Di mana, $ y '_ {t} $ adalah nilai prediksi,
$ y_ {t} $ adalah nilai sebenarnya, dan
n adalah jumlah total nilai dalam set pengujian.
Rata-rata Persentase Kesalahan
Ini adalah persentase rata-rata perbedaan absolut antara nilai prediksi dan nilai sebenarnya, dibagi dengan nilai sebenarnya.
$$ MAPE = \ frac {1} {n} \ displaystyle \ jumlah \ batas_ {t = 1} ^ n \ frac {y '_ {t} -y_ {t}} {y_ {t}} * 100 \: \% $$
Di mana, $ y '_ {t} $ adalah nilai prediksi,
$ y_ {t} $ adalah nilai aktual dan n adalah jumlah total nilai dalam set pengujian.
Namun, kerugian menggunakan kesalahan ini adalah kesalahan positif dan kesalahan negatif dapat saling mengimbangi. Karenanya berarti persentase kesalahan absolut digunakan.
Rata-rata Kesalahan Persentase Mutlak
Ini adalah persentase rata-rata perbedaan absolut antara nilai prediksi dan nilai sebenarnya, dibagi dengan nilai sebenarnya.
$$ MAPE = \ frac {1} {n} \ displaystyle \ jumlah \ batas_ {t = 1} ^ n \ frac {| y '_ {t} -y_ {t} \ lvert} {y_ {t}} * 100 \: \% $$
Di mana $ y '_ {t} $ adalah nilai prediksi
$ y_ {t} $ adalah nilai sebenarnya, dan
n adalah jumlah total nilai dalam set pengujian.