Como é que cada probabilidade em uma distribuição normal ocorre com a mesma frequência? [duplicado]
Recentemente, notei que se você gerar 10.000 números normalmente distribuídos e, em seguida, encontrar a probabilidade associada a cada número (pnorm), cada probabilidade de 0 a 1 ocorre com aproximadamente a mesma frequência. Veja como fiz em R:
var2 <- numeric(10000)
normnos <- rnorm(10000)
for (i in 1:10000) {
var2[i] <- pnorm(normnos[i])
}
hist(var2)
Como isso é possível? Se todas as probabilidades têm igual probabilidade de ocorrer, então a distribuição resultante não seria uniforme em vez de normal? Estou muito confuso e gostaria de uma explicação.
Respostas
5 stbv
pnorm
não calcula a probabilidade do número amostrado - em vez disso, calcula $P(X \leq x)$- que é a função de distribuição cumulativa. Para calcular a probabilidade do número amostrado, você terá que usar o PDF - distribuição normal neste caso, ou seja,$p(x_i - \delta < X < x_i + \delta) = N(x_i | \mu = 0, \sigma = 1)$ ($\delta$ muito pequeno).- O histograma que você traçou é a distribuição dos valores cdf, que é sempre uniforme, independentemente da distribuição. Isso é conhecido como " Universalidade do Uniforme "
- Matematicamente, suponha $X$ é uma variável aleatória com pdf $p_X(x)$ e cdf $F_X(x) = P(X \leq x)$. Deixei$T$ seja a variável aleatória $T = F_X(X)$ - as amostras que você plotou no histograma. $T$ é aleatório porque $X$(variável normal no seu caso) é aleatória. Então,$$F_T(t) = P(T \leq t) = P(F_X(X) \leq t) = P(X \leq F_X^{-1}(t)) = F_X(F_X^{-1}(t)) = t$$
- $F_T(t) = t$- este é o cdf de uma distribuição uniforme. Portanto, a pdf de T é uniforme - que é o que você traçou. Observe que o inverso de$F_{X}(x)$ existe apenas se $F_X$ é contínuo e estritamente crescente.
Espero que isto ajude! :)
O que significa um erro “Não é possível encontrar o símbolo” ou “Não é possível resolver o símbolo”?
George Harrison ficou chateado por suas letras de 'Hurdy Gurdy Man' de Donovan não terem sido usadas