時系列-自己回帰
定常時系列の場合、自己回帰モデルは、時間「t」での変数の値を、その前の値「p」タイムステップの線形関数として認識します。数学的には次のように書くことができます-
$$ y_ {t} = \:C + \:\ phi_ {1} y_ {t-1} \:+ \:\ phi_ {2} Y_ {t-2} + ... + \ phi_ {p} y_ {tp} + \ epsilon_ {t} $$
ここで、「p」は自己回帰トレンドパラメータです。
$ \ epsilon_ {t} $はホワイトノイズであり、
$ y_ {t-1}、y_ {t-2} \:\:... y_ {tp} $は、前の期間の変数の値を示します。
pの値は、さまざまな方法を使用して調整できます。'p'の適切な値を見つける1つの方法は、自己相関プロットをプロットすることです。
Note−テストデータはモデルの正確さを確認するためだけのものであり、仮定は利用できないため、データを分析する前に、利用可能な合計データの8:2の比率でデータをトレーニングとテストに分割する必要があります。予測が行われるまで。時系列の場合、データポイントのシーケンスは非常に重要であるため、データの分割中に順序を失わないように注意する必要があります。
自己相関プロットまたはコレログラムは、前のタイムステップでの変数とそれ自体の関係を示します。ピアソンの相関を利用し、95%の信頼区間内の相関を示します。データの「温度」変数がどのように見えるかを見てみましょう。
ACPを表示しています
[141]で:
split = len(df) - int(0.2*len(df))
train, test = df['T'][0:split], df['T'][split:]
[142]で:
from statsmodels.graphics.tsaplots import plot_acf
plot_acf(train, lags = 100)
plt.show()
影付きの青い領域の外側にあるすべてのラグ値には、相関関係があると見なされます。