Was ist ein guter Autokorrelationswert?

Nov 27 2020

Ich habe einen Datensatz von 400 Zeitreihen. Ich möchte bewerten, ob es eine Beziehung zwischen aufeinanderfolgenden Datenpunkten gibt. Daher habe ich die Autokorrelation (AC) der Zeitreihen mit unterschiedlichen Verzögerungen berechnet. Für den besten Verzögerungswert erhalte ich eine Autokorrelation von durchschnittlich etwa 0,59.

Mein Problem ist nun, wie kann ich feststellen, ob dies ein guter Wechselstromwert ist? Gibt es eine Möglichkeit zu bewerten, ob ein Autokorrelationswert wie 0,59 gut ist?

Ich habe die folgenden Ansätze ausprobiert, um zu bewerten, ob dies ein guter Wert ist.

  1. Ich habe die AC von Zufallssequenzen berechnet, um sie mit der AC meiner Zeitreihen zu vergleichen. Ich habe festgestellt, dass die AC von Zufallssequenzen immer nahe bei 0 liegt. Dies ist interessant, da 0,59 weit von 0 entfernt ist, mir aber immer noch nicht klar sagt, ob 0,59 ein guter Wert ist.

  2. Ich habe mich daher entschlossen, ein weiteres Experiment durchzuführen, um den Wechselstrom meiner Zeitreihen mit der Autokorrelation einer aufsteigenden Zeitreihe (eine Funktion, die linear zunimmt) und einer zufälligen Zeitreihe zu vergleichen. In diesem Experiment manipuliere ich zufällig jede Sequenz gemäß einem Manipulationsverhältnis, das von 0 bis 100% variiert. Das Ergebnis ist wie folgt:

Es ist zu beobachten, dass der Wechselstrom meiner Zeitreihen nahe an dem der aufsteigenden Zeitreihen liegt und schnell abnimmt, wenn das Manipulationsverhältnis erhöht wird. Dies scheint darauf hinzudeuten, dass meine Zeitreihe eine gute Wechselstromversorgung aufweist. Es sagt mir jedoch nicht wirklich, was ein guter Wert für die Klimaanlage ist.

Gibt es also andere Möglichkeiten, um festzustellen, was ein guter Wechselstromwert ist? Oder haben Sie weitere Vorschläge, wie Sie feststellen können, was ein guter Wechselstromwert ist?

Antworten

1 BruceET Nov 27 2020 at 10:34

Kommentar: Laut Daten, die Ende der 1970er Jahre über Eruptionen von Old Faithful Geysir im Yellowstone-Nationalpark gesammelt wurden, variierten die Eruptionslängen zwischen kurzen$0$ (weniger als 2 Min.) und lang $1$ (mehr als 2 Min.) ungefähr gemäß einer Markov-Kette mit zwei Zuständen, in der es niemals zwei aufeinanderfolgende kurze Eruptionen gibt und kurze Eruptionen mit Wahrscheinlichkeit langen folgen $0.44.$ Folglich kann man zeigen, dass auf lange Sicht etwa 70% der Eruptionen lang sind.

Kurze und lange Eruptionen sind jedoch keine unabhängigen Bernoulli-Versuche wie bei einer Münze mit einer Heads-Wahrscheinlichkeit von 0,7, sondern bilden eine autokorrelierte Reihe gemäß einer Markov-Kette mit zwei Zuständen.

Zweitausend aufeinanderfolgende Schritte einer solchen Kette können in R simuliert werden, wie unten gezeigt.

set.seed(2020)
n = 2000; x = numeric(n); x[1]=0
for (i in 2:n) {
 if (x[i-1]==0) x[i] = 1
 else x[i] = rbinom(1, 1, .56) }
mean(x)
[1] 0.7005

In R kann ein Autokorrelationsdiagramm für mehrere Verzögerungen erstellt werden. Natürlich die Autokorrelation für Lag$0$ ist $1.000.$ Autokorrelationen, die außerhalb der horizontalen blau gepunkteten Linien liegen, werden als signifikant verschieden von angesehen $0.$ So scheint es für 2000 Beobachtungen aus dem Old Faithful-Prozess, dass Autokorrelationen im absoluten Wert größer sind als ungefähr $0.035$ oder $0.04$ gelten als signifikant verschieden von $0.$

acf(x)

Spezifische Verzögerungen können acfmit dem Parameter erhalten werden plot=F.

acf(x, plot=F)

Autocorrelations of series ‘x’, by lag

     0      1      2      3      4      5      6      7 
 1.000 -0.426  0.203 -0.085  0.018 -0.009  0.016 -0.025 
     8      9     10     11     12     13     14     15 
 0.002 -0.030 -0.004  0.004 -0.025  0.033 -0.043  0.032 
    16     17     18     19     20     21     22     23 
-0.006  0.006  0.009 -0.001  0.005  0.014 -0.028  0.002 
    24     25     26     27     28     29     30     31 
-0.002  0.008 -0.018 -0.020  0.039 -0.009  0.013  0.010 
    32     33 
 0.005 -0.037 

In einer ergodischen (konvergenten) Markov-Kette lässt die Markov-Abhängigkeit nach einigen Verzögerungen nach, so dass weit auseinander liegende Beobachtungen entlang der Sequenz nahezu unabhängig sind.

Um zu sagen, ob eine Autokorrelation "gut" ist, müssen Sie in Ihrer Anwendung die relevante Verzögerung angeben und ein spezifisches Testkriterium für die "signifikante" Autokorrelation festlegen. Aufgrund Ihrer Frage weiß ich nicht genug über Ihren Prozess oder Ihre Bewerbung, um eine bestimmte Antwort zu geben.