좋은 자동 상관 값은 무엇입니까?
400 시계열 데이터 세트가 있습니다. 연속 된 데이터 포인트 사이에 어떤 관계가 있는지 평가하고 싶습니다. 따라서 시차가 다른 시계열의 자동 상관 (AC)을 계산했습니다. 최상의 지연 값을 위해 평균 약 0.59의 자동 상관을 얻습니다.
이제 내 문제는 이것이 좋은 AC 값인지 어떻게 알 수 있습니까? 0.59와 같은 자동 상관 값이 좋은지 평가할 수있는 방법이 있습니까?
이것이 좋은 가치인지 평가하기 위해 다음 접근 방식을 시도했습니다.
내 시계열의 AC와 비교하기 위해 무작위 시퀀스의 AC를 계산했습니다. 나는 무작위 시퀀스의 AC가 항상 0에 가깝다는 것을 발견했습니다. 이것은 0.59가 0에서 멀기 때문에 흥미롭지 만 0.59가 좋은 값인지 명확하게 말해주지 않습니다.
따라서 내 시계열의 AC를 오름차순 시계열 (선형 적으로 증가하는 함수) 및 임의의 시계열의 자동 조정과 비교하는 또 다른 실험을하기로 결정했습니다. 이 실험에서는 0 ~ 100 %의 변조 비율에 따라 각 시퀀스를 무작위로 변조했습니다. 결과는 다음과 같습니다.

내 시계열의 AC는 오름차순 시계열의 AC에 가깝고 탬 퍼링 비율이 증가하면 빠르게 감소하는 것을 볼 수 있습니다. 이것은 내 시계열에 좋은 AC가 있음을 나타내는 것 같습니다. 그러나 AC에 대해 좋은 가치가 무엇인지 실제로는 알려주지 않습니다.
따라서 좋은 AC 값을 결정하는 다른 방법이 있습니까? 아니면 좋은 AC 값을 결정하는 방법에 대한 다른 제안이 있습니까?
답변
논평 : 1970 년대 후반 옐로 스톤 국립 공원의 올드 페이스풀 간헐천 분출에 대해 수집 된 데이터에 따르면 분출의 길이는$0$ (2 분 미만) $1$ (2 분 이상) 2 개 상태의 마르코프 사슬에 따르면 두 번의 연속적인 짧은 분출이없고 짧은 분출은 확률 적으로 긴 분출을 따릅니다. $0.44.$ 따라서 장기적으로 분화의 약 70 %가 길다는 것을 보여줄 수 있습니다.
그러나 짧고 긴 분출은 앞면 확률이 0.7 인 동전의 경우와 같이 독립적 인 Bernoulli 시행이 아니지만 2- 상태 Markov Chain에 따라 자기 상관 시리즈를 형성합니다.
이러한 체인의 연속 2 천 단계는 아래와 같이 R에서 시뮬레이션 할 수 있습니다.
set.seed(2020)
n = 2000; x = numeric(n); x[1]=0
for (i in 2:n) {
if (x[i-1]==0) x[i] = 1
else x[i] = rbinom(1, 1, .56) }
mean(x)
[1] 0.7005
R에서는 여러 시차에 대한 자기 상관 플롯을 만들 수 있습니다. 물론 지연에 대한 자기 상관$0$ 이다 $1.000.$ 수평 파란색 점선 밖에있는 자기 상관은 다음과 크게 다른 것으로 간주됩니다. $0.$ 따라서 Old Faithful 과정에서 2000 건의 관찰에 대해 자기 상관은 절대 값에서 약보다 더 큰 것 같습니다. $0.035$ 또는 $0.04$ 크게 다른 것으로 간주됩니다 $0.$
acf(x)

acf
매개 변수와 함께 사용하여 특정 지연을 얻을 수 있습니다 plot=F
.
acf(x, plot=F)
Autocorrelations of series ‘x’, by lag
0 1 2 3 4 5 6 7
1.000 -0.426 0.203 -0.085 0.018 -0.009 0.016 -0.025
8 9 10 11 12 13 14 15
0.002 -0.030 -0.004 0.004 -0.025 0.033 -0.043 0.032
16 17 18 19 20 21 22 23
-0.006 0.006 0.009 -0.001 0.005 0.014 -0.028 0.002
24 25 26 27 28 29 30 31
-0.002 0.008 -0.018 -0.020 0.039 -0.009 0.013 0.010
32 33
0.005 -0.037
에르 고딕 (수렴) 마르코프 체인에서 마르코프 의존성은 몇 가지 지연 후에 '마감'되어 시퀀스를 따라 멀리 떨어진 관측치가 거의 독립적입니다.
애플리케이션에서 자기 상관이 '양호'인지 여부를 확인하려면 관련 지연을 지정하고 '유의 한'자기 상관에 대한 특정 테스트 기준을 가져야합니다. 귀하의 질문에 대해 구체적인 답변을 제공하기에는 귀하의 프로세스 또는 신청에 대해 충분히 알지 못합니다.