Recherche du coefficient de corrélation de $X$ et $XY$
Laisser $X$ et $Y$être des variables aléatoires indépendantes avec des variances différentes de zéro. Je cherche le coefficient de corrélation$\rho$ de $Z=XY$ et $X$ en termes de moyennes et de variances de $X$ et $Y$, c'est à dire $\mu_X, \mu_Y, \sigma^2_X, \sigma^2_Y$.
(J'ai recherché différentes méthodes en ligne, y compris la corrélation entre X et XY . Cependant, je me demande si je pourrais utiliser une approche de calcul simple plutôt que d'utiliser également des moments.)
Le résultat que j'ai obtenu, ainsi que les étapes que j'ai utilisées, est le suivant:
$$ \begin{align} \rho & = \frac{\text{Cov}(Z,X)}{\sigma_Z\sigma_X}\\[1em] & = \frac{E\left[\left(Z-\mu_Z\right)\left(X-\mu_X\right)\right]}{\sigma_Z\sigma_X} \\[1em] & = \frac{E\left[\left(XY-\mu_X\mu_Y\right)\left(X-\mu_X\right)\right]}{\sqrt{E\left[\left(XY\right)^2\right]-\left[E\left(XY\right)\right]^2}\cdot\sigma_X} \\[1em] & = \frac{E\left(X^2Y\right)-\mu_X^2\mu_Y}{\sqrt{E\left(X^2\right)E\left(Y^2\right)-\left[E\left(X\right)\right]^2\left[E\left(Y\right)\right]^2}\cdot\sigma_X} \\[1em] & = \frac{E\left(X^2\right)E\left(Y\right)-\mu_X^2\mu_Y}{\sqrt{\left(\sigma_X^2+\mu_X^2\right)\left(\sigma_Y^2+\mu_Y^2\right)-\mu^2_X\mu^2_Y}\cdot\sigma_X} \\[1em] & = \frac{\mu_Y\left[E\left(X^2\right)-\mu^2_X\right]}{\sqrt{\sigma^2_X\sigma^2_Y+\sigma_X^2\mu_Y^2+\sigma_Y^2\mu_X^2}\cdot\sigma_X} \\[1em] & = \frac{\mu_Y\sigma_X^2}{\sqrt{\sigma^2_X\sigma^2_Y+\sigma_X^2\mu_Y^2+\sigma_Y^2\mu_X^2}\cdot\sigma_X} \\[1em] & = \frac{\mu_Y\sigma_X}{\sqrt{\sigma^2_X\sigma^2_Y+\sigma_X^2\mu_Y^2+\sigma_Y^2\mu_X^2}} \end{align} $$
qui est apparemment différent du résultat de l'approche du moment utilisée dans Corrélation entre X et XY . À quelle étape une erreur de calcul s'est-elle produite (le cas échéant) et comment puis-je obtenir$\rho$ de l'approche que j'essaie d'utiliser?
Réponses
Une approche utile pour déboguer une chaîne d'égalités est un exemple ou deux, afin que vous puissiez vérifier où l'égalité s'arrête.
L'exemple le plus simple auquel je puisse penser est $Y$étant une constante qui n'est pas 0, 1 ou -1. Alors laisse$Y=\mu_Y$ être une constante positive qui n'est pas 1, et $\sigma^2_Y=0$.
Les trois premières égalités ne font qu'étendre les définitions, donc la quatrième est la première fois que quelque chose pourrait mal tourner. Et c'est le cas. Le numérateur de la troisième ligne se simplifie en$\mu_Y\mathrm{var}[X]$. Le numérateur de la quatrième ligne ne le fait pas. Ou pas quand j'ai écrit ceci; il a maintenant été modifié.
La version modifiée réussit ce contrôle. Il correspond également à la troisième réponse à la question liée, qui correspond à la première réponse, nous pouvons donc probablement en conclure qu'elle est correcte.
Ce que vous avez écrit est le même que l'expression dans le lien. Dans le lien, il y a une faute de frappe dans le dénominateur, comme$\mu_2(Y)^2$ devrait être $\mu_1(Y)^2$.
\ begin {eqnarray} \ text {Cor} (X, XY) & = & \ frac {\ mu_2 (X) \ mu_1 (Y) - \ mu_1 (X) ^ 2 \ mu_1 (Y)} {\ sqrt {( \ mu_2 (X) - \ mu_1 (X) ^ 2) (\ mu_2 (X) \ mu_2 (Y) - \ mu_1 (X) ^ 2 \ mu_1 (Y) ^ 2)}} \\ & = & \ frac {E [X ^ 2] \ mu_Y - \ mu_X ^ 2 \ mu_Y} {\ sqrt {\ sigma_X ^ 2 (E [X ^ 2] E [Y ^ 2] - \ mu_X ^ 2 \ mu_Y ^ 2)}} \\ & = & \ frac {\ sigma_X \ mu_Y} {\ sqrt {(\ sigma_X ^ 2 + \ mu_X ^ 2) (\ sigma_Y ^ 2 + \ mu_Y ^ 2) - \ mu_X ^ 2 \ mu_Y ^ 2}} \\ & = & \ frac {\ sigma_X \ mu_Y} {\ sqrt {\ sigma_X ^ 2 \ sigma_Y ^ 2 + \ sigma_X ^ 2 \ mu_Y ^ 2 + \ mu_X ^ 2 \ sigma_Y ^ 2}} \\ \ end { eqnarray}