O que é um bom valor de autocorrelação?
Eu tenho um conjunto de dados de 400 séries temporais. Quero avaliar se existe alguma relação entre pontos de dados consecutivos. Assim, calculei a autocorrelação (AC) das séries temporais com diferentes defasagens. Para o melhor valor de atraso, obtenho uma autocorrelação de cerca de 0,59 em média.
Agora, meu problema é como posso saber se este é um bom valor de CA? Existe alguma maneira de avaliar se um valor de autocorrelação como 0,59 é bom?
Tentei as seguintes abordagens para avaliar se esse é um bom valor.
Calculei a CA de sequências aleatórias para compará-la com a CA de minha série temporal. Descobri que a CA de sequências aleatórias está sempre próxima de 0. Isso é interessante, pois 0,59 está longe de 0, mas ainda não me diz claramente se 0,59 é um bom valor.
Portanto, decidi fazer outro experimento para comparar a CA de minha série temporal com a autocorrelação de uma série temporal ascendente (uma função que está aumentando linearmente) e uma série temporal aleatória. Nesse experimento, eu adultero aleatoriamente cada sequência de acordo com uma taxa de adulteração que varia de 0 a 100%. O resultado é assim:

Pode-se observar que a CA da minha série temporal é próxima à da série ascendente e diminui rapidamente quando a taxa de adulteração aumenta. Isso parece indicar que há um bom CA em minha série temporal. No entanto, isso realmente não me diz o que é um bom valor para o AC.
Portanto, há outras maneiras de determinar o que é um bom valor de CA? Ou você tem alguma outra sugestão sobre como determinar o que é um bom valor de CA?
Respostas
Comentário: De acordo com dados coletados no final dos anos 1970 sobre erupções do gêiser Old Faithful no Parque Nacional de Yellowstone, a duração das erupções variou entre curtos$0$ (menos de 2 min.) e longo $1$ (mais de 2 min.) aproximadamente de acordo com uma cadeia de Markov de 2 estados em que nunca há duas erupções curtas consecutivas, e erupções curtas seguem as longas com probabilidade $0.44.$ Conseqüentemente, pode-se mostrar que no longo prazo cerca de 70% das erupções são longas.
No entanto, erupções curtas e longas não são tentativas de Bernoulli independentes, como para uma moeda com probabilidade de Heads 0,7, mas formam uma série autocorrelacionada de acordo com uma Cadeia de Markov de 2 estados.
Duas mil etapas sucessivas de tal cadeia podem ser simuladas em R como mostrado abaixo.
set.seed(2020)
n = 2000; x = numeric(n); x[1]=0
for (i in 2:n) {
if (x[i-1]==0) x[i] = 1
else x[i] = rbinom(1, 1, .56) }
mean(x)
[1] 0.7005
Em R, pode-se fazer um gráfico de autocorrelação para vários atrasos. Claro que a autocorrelação para lag$0$ é $1.000.$ As autocorrelações que estão fora das linhas pontilhadas azuis horizontais são consideradas significativamente diferentes de $0.$ Assim, parece que para 2.000 observações do processo Old Faithful, as autocorrelações maiores em valor absoluto do que cerca de $0.035$ ou $0.04$ são considerados significativamente diferentes de $0.$
acf(x)

Atrasos específicos podem ser obtidos usando acf
o parâmetro plot=F
.
acf(x, plot=F)
Autocorrelations of series ‘x’, by lag
0 1 2 3 4 5 6 7
1.000 -0.426 0.203 -0.085 0.018 -0.009 0.016 -0.025
8 9 10 11 12 13 14 15
0.002 -0.030 -0.004 0.004 -0.025 0.033 -0.043 0.032
16 17 18 19 20 21 22 23
-0.006 0.006 0.009 -0.001 0.005 0.014 -0.028 0.002
24 25 26 27 28 29 30 31
-0.002 0.008 -0.018 -0.020 0.039 -0.009 0.013 0.010
32 33
0.005 -0.037
Em uma cadeia de Markov ergódica (convergente), a dependência de Markov 'desaparece' após alguns atrasos, de modo que as observações feitas distantes ao longo da sequência são quase independentes.
Em seu aplicativo, para dizer se uma autocorrelação é 'boa', você precisa especificar o atraso relevante e ter um critério de teste específico para autocorrelação 'significativa'. Com base na sua pergunta, não sei o suficiente sobre o seu processo ou aplicativo para dar uma resposta específica.