'공분산'함수를 사용하여 공분산을 올바르게 계산하는 방법은 무엇입니까?

Aug 18 2020

참고 : 다음 질문은 2005 년 중국 대학원 수학 입학 시험 (1 차) 의 23 번째 문제입니다 .

가정 $X_{1}, X_{2}, \cdots, X_{n}(n>2)$ 모집단의 단순 무작위 표본입니다. $\mathrm{N}(0,1)$, 및 $\bar{X}$ 샘플 평균 ($\bar{X}=\frac{X_1+X_2+\cdots+X_n}{n}$), $Y_{i}=X_{i}-\bar{X}$, $i=1,2, \cdots, n $.

이제 다음 문제를 해결해야합니다.

(1) 분산 $D Y_{i}$$Y_{i}$,$i=1,2, \cdots, n $.

(2) 공분산 $\operatorname{Cov}\left(Y_{1}, Y_{n}\right)$$Y_{1}$$Y_{n}$.

n = 10이 문제를 해결하기 위해 특별한 경우로 사용합니다 .

Y1 = TransformedDistribution[x[1] - Sum[x[i], {i, 1, 10}]/10, 
  Table[x[i] \[Distributed] NormalDistribution[], {i, 1, 10}]]
Variance[Y1]
Y10 = TransformedDistribution[x[10] - Sum[x[i], {i, 1, 10}]/10, 
  Table[x[i] \[Distributed] NormalDistribution[], {i, 1, 10}]]
Variance[Y10]
Covariance[Y1, Y10]
Correlation[Y1, Y10]

그러나 위의 코드의 공분산을 얻을 수 Y1Y10제대로 (참조 대답은$-\frac{1}{10}$). Covariance이 문제를 해결하기 위해 함수 를 어떻게 사용할 수 있습니까?

답변

3 JimB Aug 18 2020 at 11:06

확률 변수와 분포를 구분하는 표기법을 사용해야합니다. 다음 코드는 원하는 분산 및 공분산을 가져옵니다.

n = 10; 
distY1Yn = TransformedDistribution[{x[1] - Sum[x[i], {i, 1, n}]/n, x[n] - Sum[x[i], {i, 1, n}]/n}, 
  Table[x[i] \[Distributed] NormalDistribution[], {i, 1, n}]];
Covariance[distY1Yn]
(* {{9/10, -(1/10)}, {-(1/10), 9/10}} *)
Correlation[distY1Yn]
(* {{1, -(1/9)}, {-(1/9), 1}} *)

distY1 = TransformedDistribution[x[1] - Sum[x[i], {i, 1, n}]/n, 
   Table[x[i] \[Distributed] NormalDistribution[], {i, 1, n}]];
Variance[distY1]
(* 9/10 *)

distYn = TransformedDistribution[x[n] - Sum[x[i], {i, 1, n}]/n, 
   Table[x[i] \[Distributed] NormalDistribution[], {i, 1, n}]];
Variance[distYn]
(* 9/10 *)