時系列-自己回帰

定常時系列の場合、自己回帰モデルは、時間「t」での変数の値を、その前の値「p」タイムステップの線形関数として認識します。数学的には次のように書くことができます-

$$ y_ {t} = \:C + \:\ phi_ {1} y_ {t-1} \:+ \:\ phi_ {2} Y_ {t-2} + ... + \ phi_ {p} y_ {tp} + \ epsilon_ {t} $$

 

ここで、「p」は自己回帰トレンドパラメータです。

$ \ epsilon_ {t} $はホワイトノイズであり、

$ y_ {t-1}、y_ {t-2} \:\:... y_ {tp} $は、前の期間の変数の値を示します。

pの値は、さまざまな方法を使用して調整できます。'p'の適切な値を見つける1つの方法は、自己相関プロットをプロットすることです。

Note−テストデータはモデルの正確さを確認するためだけのものであり、仮定は利用できないため、データを分析する前に、利用可能な合計データの8:2の比率でデータをトレーニングとテストに分割する必要があります。予測が行われるまで。時系列の場合、データポイントのシーケンスは非常に重要であるため、データの分割中に順序を失わないように注意する必要があります。

自己相関プロットまたはコレログラムは、前のタイムステップでの変数とそれ自体の関係を示します。ピアソンの相関を利用し、95%の信頼区間内の相関を示します。データの「温度」変数がどのように見えるかを見てみましょう。

ACPを表示しています

[141]で:

split = len(df) - int(0.2*len(df))
train, test = df['T'][0:split], df['T'][split:]

[142]で:

from statsmodels.graphics.tsaplots import plot_acf

plot_acf(train, lags = 100)
plt.show()

影付きの青い領域の外側にあるすべてのラグ値には、相関関係があると見なされます。