Odkrycie $E[X\mid Y]$ i $\operatorname{Var}(X\mid Y)$ podana średnia i wariancja $X$ i $Y$
Załóżmy, że mamy 2 rozkłady normalne $X$ i $Y$ ze średnią $u_1$ i $u_2$ i wariancji $\sigma_1^2$ i $\sigma_2^2$; odnaleźć$E[X\mid Y]$ i $\operatorname{Var}(X\mid Y)$.
wiem $$E[X\mid Y] = \mu_1 + \rho\sigma_1 \frac{Y - u_2}{\sigma_2} $$ i $$\operatorname{Var}[X\mid Y] = \sigma_1 (1 - \rho^2)$$ ale nie mogę tego udowodnić.
Dla $E[X\mid Y]$ Zaczynam od $$E[X\mid Y] = \int_{-\infty}^{+\infty} x f_{X|Y}(x\mid y)\ dx$$ ale to nie działa, ponieważ do obliczania $f_{X\mid Y}(x\mid y)$ potrzebuję $f_{X,Y}(x,y)$Nie mam tego. Czy ktoś może mi pomóc?
Odpowiedzi
Podejście do gęstości zadziała. W najprostszym przypadku załóż to$X$ i $Y$każdy standardowy prawidłowa, korelacja$\rho$, tak że gęstość spoiny wynosi$(X,Y)$ jest $$ f(x,y)=\frac1{2\pi\sqrt{1-\rho^2}}\exp \left[-\frac1{2(1-\rho^2)}(x^2-2\rho xy+y^2)\right] $$ podczas gdy marginalna gęstość $Y$ jest $$f(y)=\frac1{\sqrt{2\pi}}\exp\left[-\left(\frac{y^2}2\right)\right]. $$ Gęstość warunkowa $\displaystyle f(x\mid y)=\frac{f(x,y)}{f(y)}$to stosunek tych. Więc zależne od$Y=y$, gęstość $X$ jest $$\begin{align} f(x\mid y)&=\frac1{\sqrt{2\pi(1-\rho^2)}}\exp\left[-\frac1{2(1-\rho^2)}(x^2-2\rho xy+y^2-(1-\rho^2)y^2)\right]\\ &= \frac1{\sqrt{2\pi(1-\rho^2)}}\exp\left[-\frac1{2(1-\rho^2)}(x-\rho y)^2\right]\end{align} $$ którą rozpoznajemy jako gęstość normalnej zmiennej losowej ze średnią $\rho y$ i wariancji $1-\rho^2$. Wynika, że$$ E(X\mid Y=y) = \rho y\qquad{\rm and}\qquad \operatorname{Var}(X\mid Y=y)=1-\rho^2.$$
W ogólnym przypadku napisz $\displaystyle X':=\frac{X-\mu_1}{\sigma_1}$ i $\displaystyle Y':=\frac{Y-\mu_2}{\sigma_2}$. Zastosuj poprzedni przypadek do$X'$ i $Y'$i zakończ $$\begin{aligned} E\left (X\mid Y=y\right)&=E\left(\mu_1+\sigma_1 X'\biggm| Y'=\frac{y-\mu_2}{\sigma_2}\right)=\mu_1+\sigma_1 E\left(X'\biggm| Y'=\frac{y-\mu_2}{\sigma_2}\right)\\ &=\mu_1+\sigma_1\rho\left(\frac{y-\mu_2}{\sigma_2}\right) =\mu_1+\rho\frac{\sigma_1}{\sigma_2}(y-\mu_2) \end{aligned} $$ i $$\begin{aligned} \operatorname{Var}(X\mid Y=y)&=\operatorname{Var}\left(\mu_1+\sigma_1 X'\biggm| Y'=\frac{y-\mu_2}{\sigma_2}\right) =\sigma_1^2\operatorname{Var}\left( X'\biggm| Y'=\frac{y-\mu_2}{\sigma_2}\right)\\ &=\sigma_1^2(1-\rho^2).\end{aligned} $$
Przyjmijmy to za pewnik $$\frac{X-\mu_1}{\sigma_1} = \rho \frac{Y-\mu_2}{\sigma_2} + \sqrt{1-\rho^2} Z \tag{$*$}$$ gdzie $Z \sim N(0,1)$ jest niezależny od $Y$. Zobacz koniec mojej odpowiedzi, aby uzyskać wyjaśnienie.
Następnie \begin{align} E[X \mid Y] &= \mu_1 + \sigma_1 E[(X-\mu_1)/\sigma_1 \mid Y] \\ &= \mu_1 + \sigma_1 \left( E[\rho (Y-\mu_2)/\sigma_2 \mid Y] + E[\sqrt{1-\rho^2} Z \mid Y] \right) \\ &= \mu_1 + \sigma_1 (\rho(Y - \mu_2) / \sigma_2) + \sqrt{1-\rho^2} E[Z] \\ &= \mu_1 + \rho \frac{\sigma_1}{\sigma_2} (Y-\mu_2). \end{align} Zauważ, że Ottavio Bartenor poprawił literówkę w oryginalnym wyrażeniu dla $E[X\mid Y]$.
Podobnie, \begin{align} \text{Var}(X \mid Y) &= \sigma_1^2 \text{Var}((X-\mu_1)/\sigma_1 \mid Y) \\ &= \sigma_1^2 \text{Var}(\rho(Y-\mu_2)/\sigma_2 + \sqrt{1-\rho^2} Z \mid Y) \\ &= \sigma_1^2 \text{Var}(\sqrt{1-\rho^2} Z \mid Y) \\ &= \sigma_1^2 (1-\rho^2) \text{Var}(Z) \\ &= \sigma_1^2(1-\rho^2). \end{align} Zwróć uwagę, że wyrażenie w Twoim poście zawiera literówkę.
Przypuszczać $Y \sim N(\mu_2, \sigma_2^2)$ i $Z \sim N(0,1)$są niezależne. Pozwolić$X$ spełnić powyższą równość ($*$). Twierdzenie jest takie$(X,Y)$ jest zgodny z dwuwymiarowym rozkładem normalnym z parametrami $\mu_1, \sigma_1, \mu_2 ,\sigma_2, \rho$.
Możesz to sprawdzić $X$ ma na myśli $\mu_1$ i wariancji $\sigma_1^2$. Możesz również sprawdzić, czy korelacja między plikami$X$ i $Y$ jest $\rho$. Możesz również sprawdzić, czy marginalna dystrybucja$X$jest normalne, ponieważ jest liniową kombinacją niezależnych normalnych zmiennych losowych . Wreszcie, aby to uzasadnić$(X,Y)$jest łącznie (dwuwymiarowa) normalna, można odwołać się do równoważnej charakterystyki wspólnie normalnych rozkładów , zauważając, że dowolna liniowa kombinacja$X$ i $Y$ jest normalna, ponieważ można ją zapisać jako liniową kombinację niezależnych normalnych zmiennych losowych $Y$ i $Z$