Différence entre l'autocorrélation et l'autocorrélation partielle

Aug 17 2020

J'ai lu quelques articles sur l'autocorrélation partielle des séries chronologiques et je dois admettre que je ne comprends pas vraiment la différence avec une autocorrélation normale. On dit souvent que l'autocorrélation partielle entre$y_t$ et $y_t-k$ est la correclation entre $y_t$ et $y_t-k$ avec l'influence des variables entre $y_t$ et $y_t-k$supprimé? Je ne comprends pas cela. Si nous calculons la corrélation entre$y_t$ et $y_t-k$alors de toute façon, les variables intermédiaires ne sont pas du tout prises en compte si vous utilisez le coefficient de corrélation pour cela. Le coefficient de corrélation ne considère deux variables que pour autant que je sache.

Cela me trouble vraiment. J'espère que vous pourrez m'aider là-dessus. J'apprécierais chaque commentaire et serais reconnaissant pour votre aide.

Mise à jour: Quelqu'un peut-il essayer d'expliquer comment on pourrait calculer l'autocorrélation et l'autocorrélation partielle pour une série chronologique. J'ai compris comment faire cela avec un échantillon mais pas avec une série chronologique (car vous avez besoin de trois variables selon l'exemple icihttps://en.wikipedia.org/wiki/Partial_correlation). Connaissez-vous un exemple où cela est fait?

Réponses

4 Dayne Oct 11 2020 at 20:14

Pendant un moment, oubliez les horodatages. Considérez trois variables:$X, Y, Z$.

Disons $Z$a une influence directe sur la variable$X$. Vous pouvez penser à$Z$ en tant que paramètre économique aux États-Unis qui influence un autre paramètre économique $X$ de Chine.

Maintenant, il se peut qu'un paramètre $Y$ (un paramètre en Angleterre) est également directement influencé par $Z$. Mais il existe une relation indépendante entre$X$ et $Y$ainsi que. Par indépendance, j'entends ici que cette relation est indépendante de$Z$.

Alors tu vois quand $Z$ changements, $X$ change en raison de la relation directe entre $X$ et $Z$, et aussi parce que $Z$ changements $Y$ qui à son tour change $X$. Alors$X$ change pour deux raisons.

Maintenant, lisez ceci avec $Z=y_{t-h}, \ \ Y=y_{t-h+\tau}$ et $X=y_t$ (où $h>\tau$).

Autocorrélation entre $X$ et $Z$ prendra en compte tous les changements dans $X$ si venant de $Z$ directement ou par $Y$.

L'autocorrélation partielle supprime l'impact indirect de $Z$ sur $X$ à travers $Y$.

Comment ça se fait? Cela est expliqué dans l'autre réponse à votre question.

2 Michael Aug 18 2020 at 10:30

La différence entre (échantillon) ACF et PACF est facile à voir du point de vue de la régression linéaire.

Pour obtenir l'échantillon ACF $\hat{\gamma}_h$ au décalage $h$, vous ajustez le modèle de régression linéaire $$ y_t = \alpha + \beta y_{t-h} + u_t $$ et le résultat $\hat{\beta}$ est $\hat{\gamma}_h$. En raison de la (faible) stationnarité, l'estimation$\hat{\beta}$ est la corrélation d'échantillon entre $y_t$ et $y_{t-h}$. (Il existe des différences insignifiantes entre la façon dont les moments d'échantillonnage sont calculés entre les séries chronologiques et les contextes de régression linéaire, mais elles sont négligeables lorsque la taille de l'échantillon est grande.)

Pour obtenir l'échantillon PACF $\hat{\rho}_h$ au décalage $h$, vous ajustez le modèle de régression linéaire $$ y_t = \alpha + \, ? y_{t-1} + \cdots + \, ? y_{t-h + 1} + \beta y_{t-h} + u_t $$ et le résultat $\hat{\beta}$ est $\hat{\rho}_h$. Alors$\hat{\rho}_h$ est la "corrélation entre $y_t$ et $y_{t-h}$ après contrôle des éléments intermédiaires. "

La même discussion s'applique textuellement à la différence entre la population ACF et PACF. Remplacez simplement les exemples de régressions par des régressions de population. Pour un processus AR (p) stationnaire, vous constaterez que le PACF est nul pour les retards$h > p$. Cela n’a rien d’étonnant. Le processus est spécifié par une régression linéaire.$$ y_t = \phi_0 + \phi_1 y_{t-1} + \cdots \phi_p y_{t-p} + \epsilon_t $$
Si vous ajoutez un régresseur (disons $y_{t-p-1}$) sur le côté droit qui n'est pas corrélé avec le terme d'erreur $\epsilon_t$, le coefficient résultant (le PACF au décalage $p+1$ dans ce cas) serait égal à zéro.