ランダムな共変量を持つ線形モデルを使用する場合、残余分散の減少を決定するのはピアソン相関ですか?

Aug 19 2020

通常、分散のある従属変数Yを正規分布している場合 $\sigma_Y^2$ 治療指標と、正規分布しているランダム共変量。線形モデルを最尤推定で近似すると、残余分散は係数に比例します。 $(1-r^2)\cdot\sigma_Y^2$。次に、$r^2$ 変数間のピアソン相関係数の2乗を示す必要があります $Y$ および変数 $X$

あれは正しいですか?ピアソン相関は引き続き使用されますが、確率変数の場合$X$ 正規分布ではありませんが、指数分布またはバイナリ分布ですか?

誰かが私と一緒にそれらのポイントをクリアして、さらに読むためのいくつかの参照を私に教えてくれませんか?

回答

BigBendRegion Aug 26 2020 at 18:10

もちろん、二乗相関を「」として使用することもできます。$R^2$"非正規の場合でも、非正規の下での統計 $Y$。最尤推定は、おそらくサンプルのピアソン相関を含まない別の形式をとる可能性がありますが、それでも通常のピアソンのサンプル相関は漸近的に一貫した推定になります。

真の二乗ピアソン相関が「」である理由の正当化は次のとおりです。$R^2$"統計は、非正規性の下でも $X$ そして $Y$

まず、全分散の法則は、 $(X,Y)$ 有限分散で同時分布し、その後

$$Var(Y) = Var\{f(X)\} + E\{\nu(X)\},$$

どこ

$$ f(x) = E(Y | X=x)$$

そして

$$ \nu(x) = Var(Y | X=x).$$

以来 $R^2$ の分散の割合であると想定されています $Y$ それはによって説明されています $X$、 真実 $R^2$ 合理的に定義することができます

$$ R^2 = \frac{Var\{f(X)\}}{Var\{f(X)\} + E\{\nu(X)\}} = \frac{Var\{f(X)\}}{Var(Y)}. $$

さて、線形性の仮定の下で $E(Y | X=x) = \beta_0 + \beta_1 x$、私たちはそれを持っています $$ \beta_1 = \frac{\sigma_{XY}}{\sigma^2_X} = \rho_{XY}\frac{\sigma_Y}{\sigma_X},$$

どこ

$$ \sigma_{XY} = E\{(Y-\mu_y)\}\{X-\mu_X)\}$$ 間の共分散です $X$ そして $Y$、および $$ \rho_{XY} = \frac{\sigma_{XY}}{\sigma_X\sigma_Y}$$ 間の相関関係です $X$ そして $Y$

ここで、全分散の法則の使用に戻ります。 $R^2$ によって与えられます

$$R^2 = \frac{Var\{f(X)\}}{Var(Y)} = \frac{Var\{\beta_0 + \beta_1 X\}}{\sigma^2_Y} = \frac{\beta_1^2 \sigma_X^2}{\sigma^2_Y} = \rho_{XY}^2.$$

質問は複数について尋ねました $X$、この場合、通常のピアソン相関では、 $R^2$正常な状態でも。ただし、上記の議論は簡単に複数に一般化されます$X$ 変数、以下を含む相関係数の再定義 $(X_1,X_2,\dots,Y)$共分散行列。繰り返しますが、正規性は必要ありません。