Correlação como ângulo entre vetores

Aug 17 2020

Estou um pouco confuso sobre a interpretação geométrica da correlação como ângulo entre duas variáveis ​​aleatórias. Suponha$X$ e $Y$ são duas variáveis ​​com média $0$ e o espaço de estado $S=\{\omega_1, \omega_2,\omega_3\}$. Então$$Var(X)=X(\omega_1)^2\mathbb{P}(\omega_1)+X(\omega_2)^2\mathbb{P}(\omega_2)+X(\omega_3)^2\mathbb{P}(\omega_3)$$ $$Var(Y)=Y(\omega_1)^2\mathbb{P}(\omega_1)+Y(\omega_2)^2\mathbb{P}(\omega_2)+Y(\omega_3)^2\mathbb{P}(\omega_3)$$ $$Cov(X,Y)=X(\omega_1)Y(\omega_1)\mathbb{P}(\omega_1)+X(\omega_2)Y(\omega_2)\mathbb{P}(\omega_2)+X(\omega_3)Y(\omega_3)\mathbb{P}(\omega_3)$$ E a correlação $$\rho_{X,Y}=\frac{Cov(X,Y)}{\sqrt{Var(X)Var(Y)}}=\frac{X(\omega_1)Y(\omega_1)\mathbb{P}(\omega_1)+X(\omega_2)Y(\omega_2)\mathbb{P}(\omega_2)+X(\omega_3)Y(\omega_3)\mathbb{P}(\omega_3)}{\sqrt{(X(\omega_1)^2\mathbb{P}(\omega_1)+X(\omega_2)^2\mathbb{P}(\omega_2)+X(\omega_3)^2\mathbb{P}(\omega_3))(Y(\omega_1)^2\mathbb{P}(\omega_1)+Y(\omega_2)^2\mathbb{P}(\omega_2)+Y(\omega_3)^2\mathbb{P}(\omega_3))}}$$ Não vejo como isso é um ângulo entre dois vetores, a menos que eu defina os dois vetores $$x=[X(\omega_1)\sqrt{\mathbb{P}(\omega_1)}, X(\omega_2)\sqrt{\mathbb{P}(\omega_2)}, X(\omega_3)\sqrt{\mathbb{P}(\omega_3)}]$$ $$y=[Y(\omega_1)\sqrt{\mathbb{P}(\omega_1)}, Y(\omega_2)\sqrt{\mathbb{P}(\omega_2)}, Y(\omega_3)\sqrt{\mathbb{P}(\omega_3)}]$$ nesse caso eu vejo que $$\rho_{X,Y}=\frac{<x,y>}{\sqrt{<x,x><y,y>}}=\cos\theta$$ Onde $\theta$ é o ângulo entre $x$ e $y$. É esta a maneira correta de interpretar (definindo o vetor do valor de cada estado ponderado pela raiz quadrada da probabilidade associada)?

Respostas

gg Aug 17 2020 at 17:31

Isso é quase correto. Para dar essa interpretação geométrica, é necessário proceder exatamente como você fez e definir duas coisas:

  1. Como uma variável aleatória é interpretada como um vetor?
  2. Como é o produto escalar (ou comprimentos e ângulos equivalentes) entre esses vetores definidos?

A interpretação para 1. é apenas a interpretação padrão de funções como vetores. Ou seja, as variáveis ​​aleatórias mapeiam o espaço de estado para$\mathbb{R}$portanto, eles são vetores como qualquer outra função real. No seu caso, o espaço de estado é finito, portanto, o espaço vetorial é de dimensão finita. Você pode identificá-lo com$\mathbb{R}^3$exatamente como você sugeriu, mas você não incorpora as probabilidades! Ou seja, sua variável aleatória$X$ relaciona-se com o vetor $(X(\omega_1), X(\omega_2), X(\omega_3)).$

As probabilidades entram apenas para 2: Observe que a expectativa do produto de variáveis ​​aleatórias de média zero $\mathbb{E}[XY]$ preenche todas as condições de um produto escalar, isto é bilinear, simétrico (obviamente) e não degenerado, pois $\mathbb{E}[X^2]=0 \implies X=0$ ae

Então você simplesmente define $<X,Y>=\mathbb{E}[XY]$ e estão prontos para medir ângulos!