랜덤 공변량과 함께 선형 모형을 사용할 때 잔차 분산의 감소를 결정하는 것이 피어슨 상관입니까?
일반적으로 분산이있는 정규 분포 종속 변수 Y가있는 경우 $\sigma_Y^2$ 처리 지표 및 정규 분포도있는 랜덤 공변량, ML 추정값을 사용하여 선형 모델을 피팅 할 때 잔차 분산은 요인에 비례합니다. $(1-r^2)\cdot\sigma_Y^2$. 그때,$r^2$ 변수 간의 제곱 피어슨 상관 계수를 표시해야합니다. $Y$ 및 변수 $X$.
그 맞습니까? Pearson 상관 관계는 여전히 사용됩니다.$X$ 정규 분포는 아니지만 지수 또는 이진 분포입니까?
누군가 저와 함께 그 요점을 정리하고 추가 읽기를 위해 참고 자료를 줄 수 있습니까?
답변
물론 제곱 상관 관계를 "$R^2$"비정규성에 대한 통계 $Y$. ML 추정치는 샘플 Pearson 상관 관계를 포함하지 않는 다른 형식을 취할 수 있지만, 그럼에도 불구하고 일반적인 Pearson 샘플 상관 관계는 점근 적으로 일관된 추정치가됩니다.
다음은 진정한 제곱 피어슨 상관 관계가 "$R^2$"통계, 비정규 성에서도 $X$ 과 $Y$.
첫째, 총 분산의 법칙은 $(X,Y)$ 유한 분산과 함께 공동으로 분포됩니다.
$$Var(Y) = Var\{f(X)\} + E\{\nu(X)\},$$
어디
$$ f(x) = E(Y | X=x)$$
과
$$ \nu(x) = Var(Y | X=x).$$
이후 $R^2$ 분산의 비율이어야합니다. $Y$ 에 의해 설명 $X$, 진실 $R^2$ 합리적으로 정의 할 수 있습니다.
$$ R^2 = \frac{Var\{f(X)\}}{Var\{f(X)\} + E\{\nu(X)\}} = \frac{Var\{f(X)\}}{Var(Y)}. $$
이제 선형성 가정에서 $E(Y | X=x) = \beta_0 + \beta_1 x$, 우리는 $$ \beta_1 = \frac{\sigma_{XY}}{\sigma^2_X} = \rho_{XY}\frac{\sigma_Y}{\sigma_X},$$
어디
$$ \sigma_{XY} = E\{(Y-\mu_y)\}\{X-\mu_X)\}$$ 사이의 공분산 $X$ 과 $Y$, 및 $$ \rho_{XY} = \frac{\sigma_{XY}}{\sigma_X\sigma_Y}$$ 사이의 상관 관계입니다 $X$ 과 $Y$.
이제 전체 분산의 법칙을 사용하는 것으로 돌아가서 $R^2$ ~에 의해 주어진다
$$R^2 = \frac{Var\{f(X)\}}{Var(Y)} = \frac{Var\{\beta_0 + \beta_1 X\}}{\sigma^2_Y} = \frac{\beta_1^2 \sigma_X^2}{\sigma^2_Y} = \rho_{XY}^2.$$
둘 이상의 질문에 대해 질문했습니다. $X$,이 경우 일반적인 Pearson 상관 관계는 $R^2$정상 상태에서도. 그러나 위의 주장은 쉽게 일반화됩니다.$X$ 변수를 포함하는 상관 계수의 재정의와 함께 $(X_1,X_2,\dots,Y)$공분산 행렬. 다시 말하지만, 정규성은 필요하지 않습니다.