Perbedaan antara autokorelasi dan autokorelasi parsial
Saya telah membaca beberapa artikel tentang autokorelasi parsial deret waktu dan saya harus mengakui, bahwa saya tidak terlalu memahami perbedaan autokorelasi normal. Sering dinyatakan bahwa autokorelasi parsial antara$y_t$ dan $y_t-k$ adalah koreksi antara $y_t$ dan $y_t-k$ dengan pengaruh variabel antara $y_t$ dan $y_t-k$dihapus? Saya tidak mengerti ini. Jika kita menghitung korelasi antara$y_t$ dan $y_t-k$maka variabel di antara keduanya tidak dihitung sama sekali jika Anda menggunakan koefisien korelasi untuk melakukan itu. Koefisien korelasi hanya mempertimbangkan dua variabel sejauh yang saya tahu.
Ini sangat membingungkan saya. Saya harap Anda dapat membantu saya dalam hal itu. Saya menghargai setiap komentar dan berterima kasih atas bantuan Anda.
Pembaruan: Adakah yang bisa mencoba menjelaskan bagaimana seseorang dapat menghitung autokorelasi dan autokorelasi parsial untuk deret waktu. Saya mengerti bagaimana melakukan ini dengan sampel tetapi tidak dengan deret waktu (karena Anda memerlukan tiga variabel sesuai dengan contoh di sinihttps://en.wikipedia.org/wiki/Partial_correlation). Apakah Anda tahu contoh di mana ini dilakukan?
Jawaban
Untuk sementara lupakan stempel waktu. Pertimbangkan tiga variabel:$X, Y, Z$.
Katakanlah $Z$memiliki pengaruh langsung terhadap variabel$X$. Anda bisa memikirkan$Z$ sebagai beberapa parameter ekonomi di AS yang mempengaruhi beberapa parameter ekonomi lainnya $X$ dari Cina.
Sekarang mungkin itu parameter $Y$ (beberapa parameter di Inggris) juga dipengaruhi secara langsung oleh $Z$. Tetapi ada hubungan independen antara$X$ dan $Y$demikian juga. Yang saya maksud dengan kemerdekaan di sini adalah bahwa hubungan ini bebas dari$Z$.
Jadi Anda lihat kapan $Z$ perubahan, $X$ berubah karena hubungan langsung antara $X$ dan $Z$, dan juga karena $Z$ perubahan $Y$ yang pada gilirannya berubah $X$. Begitu$X$ berubah karena dua alasan.
Sekarang baca ini dengan $Z=y_{t-h}, \ \ Y=y_{t-h+\tau}$ dan $X=y_t$ (dimana $h>\tau$).
Autokorelasi antara $X$ dan $Z$ akan memperhitungkan semua perubahan dalam $X$ apakah berasal dari $Z$ secara langsung atau melalui $Y$.
Autokorelasi parsial menghilangkan dampak tidak langsung dari $Z$ di $X$ datang $Y$.
Bagaimana melakukannya? Itu dijelaskan dalam jawaban lain yang diberikan untuk pertanyaan Anda.
Perbedaan antara (sampel) ACF dan PACF mudah dilihat dari perspektif regresi linier.
Untuk mendapatkan sampel ACF $\hat{\gamma}_h$ saat tertinggal $h$, Anda cocok dengan model regresi linier $$ y_t = \alpha + \beta y_{t-h} + u_t $$ dan hasilnya $\hat{\beta}$ adalah $\hat{\gamma}_h$. Karena stasioneritas (lemah), perkiraannya$\hat{\beta}$ adalah korelasi sampel antara $y_t$ dan $y_{t-h}$. (Ada beberapa perbedaan sepele antara bagaimana momen sampel dihitung antara rangkaian waktu dan konteks regresi linier, tetapi keduanya dapat diabaikan jika ukuran sampel besar.)
Untuk mendapatkan sampel PACF $\hat{\rho}_h$ saat tertinggal $h$, Anda cocok dengan model regresi linier $$ y_t = \alpha + \, ? y_{t-1} + \cdots + \, ? y_{t-h + 1} + \beta y_{t-h} + u_t $$ dan hasilnya $\hat{\beta}$ adalah $\hat{\rho}_h$. Begitu$\hat{\rho}_h$ adalah "korelasi antara $y_t$ dan $y_{t-h}$ setelah mengontrol elemen perantara. "
Diskusi yang sama berlaku kata demi kata pada perbedaan antara populasi ACF dan PACF. Ganti saja regresi sampel dengan regresi populasi. Untuk proses AR (p) stasioner, Anda akan menemukan PACF menjadi nol untuk kelambatan$h > p$. Ini tidak mengherankan. Prosesnya ditentukan dengan regresi linier.$$ y_t = \phi_0 + \phi_1 y_{t-1} + \cdots \phi_p y_{t-p} + \epsilon_t $$
Jika Anda menambahkan regressor (katakanlah $y_{t-p-1}$) di sisi kanan yang tidak berkorelasi dengan istilah kesalahan $\epsilon_t$, koefisien yang dihasilkan (PACF pada lag $p+1$ dalam kasus ini) akan menjadi nol.