Chuỗi thời gian - Số liệu lỗi
Điều quan trọng là chúng tôi phải định lượng hiệu suất của một mô hình để sử dụng nó làm phản hồi và so sánh. Trong hướng dẫn này, chúng tôi đã sử dụng một trong những lỗi phổ biến nhất của lỗi bình phương gốc trung bình. Có nhiều số liệu lỗi khác có sẵn. Chương này thảo luận ngắn gọn về chúng.
Lỗi bình phương trung bình
Nó là giá trị trung bình của hiệu số bình phương giữa các giá trị dự đoán và giá trị thực. Sklearn cung cấp nó như một chức năng. Nó có cùng đơn vị với giá trị thực và giá trị dự đoán bình phương và luôn dương.
$$ MSE = \ frac {1} {n} \ displaystyle \ sum \ limit_ {t = 1} ^ n \ lgroup y '_ {t} \: - y_ {t} \ rgroup ^ {2} $$
Trong đó $ y '_ {t} $ là giá trị dự đoán,
$ y_ {t} $ là giá trị thực và
n là tổng số giá trị trong tập kiểm tra.
Rõ ràng là MSE bị phạt nhiều hơn đối với các lỗi lớn hơn hoặc các lỗi ngoại lệ.
Lỗi hình vuông gốc trung bình
Nó là căn bậc hai của sai số bình phương trung bình. Nó cũng luôn luôn tích cực và nằm trong phạm vi của dữ liệu.
$$ RMSE = \ sqrt {\ frac {1} {n} \ displaystyle \ sum \ limit_ {t = 1} ^ n \ lgroup y '_ {t} -y_ {t} \ rgroup ^ 2} $$
Trong đó, $ y '_ {t} $ là giá trị dự đoán
$ y_ {t} $ là giá trị thực và
n là tổng số giá trị trong tập kiểm tra.
Nó có sức mạnh của sự thống nhất và do đó dễ hiểu hơn so với MSE. RMSE cũng bị phạt nhiều hơn đối với các lỗi lớn hơn. Chúng tôi đã sử dụng số liệu RMSE trong hướng dẫn của mình.
Lỗi tuyệt đối trung bình
Đây là giá trị trung bình của chênh lệch tuyệt đối giữa giá trị dự đoán và giá trị thực. Nó có cùng đơn vị như dự đoán và giá trị thực và luôn dương.
$$ MAE = \ frac {1} {n} \ displaystyle \ sum \ limit_ {t = 1} ^ {t = n} | y '{t} -y_ {t} \ lvert $$
Trong đó, $ y '_ {t} $ là giá trị được dự đoán,
$ y_ {t} $ là giá trị thực và
n là tổng số giá trị trong tập kiểm tra.
Tỷ lệ phần trăm lỗi trung bình
Đây là tỷ lệ phần trăm trung bình của chênh lệch tuyệt đối giữa giá trị dự đoán và giá trị thực, chia cho giá trị thực.
$$ MAPE = \ frac {1} {n} \ displaystyle \ sum \ limit_ {t = 1} ^ n \ frac {y '_ {t} -y_ {t}} {y_ {t}} * 100 \: \% $$
Trong đó, $ y '_ {t} $ là giá trị được dự đoán,
$ y_ {t} $ là giá trị thực và n là tổng số giá trị trong tập thử nghiệm.
Tuy nhiên, nhược điểm của việc sử dụng lỗi này là sai số dương và sai số âm có thể bù trừ cho nhau. Do đó, có nghĩa là sai số phần trăm tuyệt đối được sử dụng.
Lỗi tỷ lệ phần trăm tuyệt đối trung bình
Đây là tỷ lệ phần trăm trung bình của chênh lệch tuyệt đối giữa giá trị dự đoán và giá trị thực, chia cho giá trị thực.
$$ MAPE = \ frac {1} {n} \ displaystyle \ sum \ limit_ {t = 1} ^ n \ frac {| y '_ {t} -y_ {t} \ lvert} {y_ {t}} * 100 \: \% $$
Trong đó $ y '_ {t} $ là giá trị dự đoán
$ y_ {t} $ là giá trị thực và
n là tổng số giá trị trong tập kiểm tra.