O que é um bom valor de autocorrelação?

Nov 27 2020

Eu tenho um conjunto de dados de 400 séries temporais. Quero avaliar se existe alguma relação entre pontos de dados consecutivos. Assim, calculei a autocorrelação (AC) das séries temporais com diferentes defasagens. Para o melhor valor de atraso, obtenho uma autocorrelação de cerca de 0,59 em média.

Agora, meu problema é como posso saber se este é um bom valor de CA? Existe alguma maneira de avaliar se um valor de autocorrelação como 0,59 é bom?

Tentei as seguintes abordagens para avaliar se esse é um bom valor.

  1. Calculei a CA de sequências aleatórias para compará-la com a CA de minha série temporal. Descobri que a CA de sequências aleatórias está sempre próxima de 0. Isso é interessante, pois 0,59 está longe de 0, mas ainda não me diz claramente se 0,59 é um bom valor.

  2. Portanto, decidi fazer outro experimento para comparar a CA de minha série temporal com a autocorrelação de uma série temporal ascendente (uma função que está aumentando linearmente) e uma série temporal aleatória. Nesse experimento, eu adultero aleatoriamente cada sequência de acordo com uma taxa de adulteração que varia de 0 a 100%. O resultado é assim:

Pode-se observar que a CA da minha série temporal é próxima à da série ascendente e diminui rapidamente quando a taxa de adulteração aumenta. Isso parece indicar que há um bom CA em minha série temporal. No entanto, isso realmente não me diz o que é um bom valor para o AC.

Portanto, há outras maneiras de determinar o que é um bom valor de CA? Ou você tem alguma outra sugestão sobre como determinar o que é um bom valor de CA?

Respostas

1 BruceET Nov 27 2020 at 10:34

Comentário: De acordo com dados coletados no final dos anos 1970 sobre erupções do gêiser Old Faithful no Parque Nacional de Yellowstone, a duração das erupções variou entre curtos$0$ (menos de 2 min.) e longo $1$ (mais de 2 min.) aproximadamente de acordo com uma cadeia de Markov de 2 estados em que nunca há duas erupções curtas consecutivas, e erupções curtas seguem as longas com probabilidade $0.44.$ Conseqüentemente, pode-se mostrar que no longo prazo cerca de 70% das erupções são longas.

No entanto, erupções curtas e longas não são tentativas de Bernoulli independentes, como para uma moeda com probabilidade de Heads 0,7, mas formam uma série autocorrelacionada de acordo com uma Cadeia de Markov de 2 estados.

Duas mil etapas sucessivas de tal cadeia podem ser simuladas em R como mostrado abaixo.

set.seed(2020)
n = 2000; x = numeric(n); x[1]=0
for (i in 2:n) {
 if (x[i-1]==0) x[i] = 1
 else x[i] = rbinom(1, 1, .56) }
mean(x)
[1] 0.7005

Em R, pode-se fazer um gráfico de autocorrelação para vários atrasos. Claro que a autocorrelação para lag$0$ é $1.000.$ As autocorrelações que estão fora das linhas pontilhadas azuis horizontais são consideradas significativamente diferentes de $0.$ Assim, parece que para 2.000 observações do processo Old Faithful, as autocorrelações maiores em valor absoluto do que cerca de $0.035$ ou $0.04$ são considerados significativamente diferentes de $0.$

acf(x)

Atrasos específicos podem ser obtidos usando acfo parâmetro plot=F.

acf(x, plot=F)

Autocorrelations of series ‘x’, by lag

     0      1      2      3      4      5      6      7 
 1.000 -0.426  0.203 -0.085  0.018 -0.009  0.016 -0.025 
     8      9     10     11     12     13     14     15 
 0.002 -0.030 -0.004  0.004 -0.025  0.033 -0.043  0.032 
    16     17     18     19     20     21     22     23 
-0.006  0.006  0.009 -0.001  0.005  0.014 -0.028  0.002 
    24     25     26     27     28     29     30     31 
-0.002  0.008 -0.018 -0.020  0.039 -0.009  0.013  0.010 
    32     33 
 0.005 -0.037 

Em uma cadeia de Markov ergódica (convergente), a dependência de Markov 'desaparece' após alguns atrasos, de modo que as observações feitas distantes ao longo da sequência são quase independentes.

Em seu aplicativo, para dizer se uma autocorrelação é 'boa', você precisa especificar o atraso relevante e ter um critério de teste específico para autocorrelação 'significativa'. Com base na sua pergunta, não sei o suficiente sobre o seu processo ou aplicativo para dar uma resposta específica.