Chuỗi thời gian - Tự động hồi quy

Đối với chuỗi thời gian tĩnh, mô hình hồi quy tự động xem giá trị của một biến tại thời điểm 't' là một hàm tuyến tính của các giá trị 'p' bước thời gian trước nó. Về mặt toán học, nó có thể được viết là -

$$ y_ {t} = \: C + \: \ phi_ {1} y_ {t-1} \: + \: \ phi_ {2} Y_ {t-2} + ... + \ phi_ {p} y_ {tp} + \ epsilon_ {t} $$

 

Trong đó, 'p' là tham số xu hướng tự động hồi quy

$ \ epsilon_ {t} $ là tiếng ồn trắng và

$ y_ {t-1}, y_ {t-2} \: \: ... y_ {tp} $ biểu thị giá trị của biến tại các khoảng thời gian trước đó.

Giá trị của p có thể được hiệu chuẩn bằng nhiều phương pháp khác nhau. Một cách để tìm giá trị apt của 'p' là vẽ biểu đồ tương quan tự động.

Note- Chúng ta nên tách dữ liệu thành huấn luyện và kiểm tra theo tỷ lệ 8: 2 trên tổng dữ liệu có sẵn trước khi thực hiện bất kỳ phân tích nào trên dữ liệu vì dữ liệu kiểm tra chỉ để tìm ra độ chính xác của mô hình của chúng tôi và giả định là, nó không có sẵn cho chúng tôi cho đến khi các dự đoán đã được thực hiện. Trong trường hợp chuỗi thời gian, chuỗi các điểm dữ liệu là rất cần thiết vì vậy người ta cần lưu ý để không bị mất thứ tự trong quá trình chia nhỏ dữ liệu.

Biểu đồ tương quan tự động hoặc biểu đồ tương quan cho thấy mối quan hệ của một biến với chính nó ở các bước thời gian trước. Nó sử dụng mối tương quan của Pearson và hiển thị các mối tương quan trong khoảng tin cậy 95%. Hãy xem nó trông như thế nào đối với biến 'nhiệt độ' của dữ liệu của chúng tôi.

Hiển thị ACP

Trong [141]:

split = len(df) - int(0.2*len(df))
train, test = df['T'][0:split], df['T'][split:]

Trong [142]:

from statsmodels.graphics.tsaplots import plot_acf

plot_acf(train, lags = 100)
plt.show()

Tất cả các giá trị độ trễ nằm ngoài vùng màu xanh lam được tô bóng được giả định là có tương quan.