Com'è che ogni probabilità in una distribuzione normale si verifica con la stessa frequenza? [duplicare]
Jan 03 2021
Recentemente ho notato che se generi 10000 numeri normalmente distribuiti e poi trovi la probabilità associata a ciascun numero (pnorm), ogni probabilità da 0 a 1 si verifica con approssimativamente la stessa frequenza. Ecco come l'ho fatto in R:
var2 <- numeric(10000)
normnos <- rnorm(10000)
for (i in 1:10000) {
var2[i] <- pnorm(normnos[i])
}
hist(var2)

Com'è possibile? Se tutte le probabilità hanno la stessa probabilità di verificarsi, allora la distribuzione risultante non sarebbe uniforme invece che normale? Sono davvero confuso e apprezzerei una spiegazione.
Risposte
5 stbv Jan 03 2021 at 14:53
pnorm
non calcola la probabilità del numero campionato, piuttosto calcola $P(X \leq x)$- che è la funzione di distribuzione cumulativa. Per calcolare la probabilità del numero campionato, dovrai utilizzare il PDF - distribuzione normale in questo caso, ovvero,$p(x_i - \delta < X < x_i + \delta) = N(x_i | \mu = 0, \sigma = 1)$ ($\delta$ molto piccolo).- L'istogramma che hai tracciato è la distribuzione dei valori cdf, che è sempre uniforme indipendentemente dalla distribuzione. Questo è noto come " Universalità dell'uniforme "
- Matematicamente, supponi $X$ è una variabile casuale con pdf $p_X(x)$ e cdf $F_X(x) = P(X \leq x)$. Permettere$T$ essere la variabile casuale $T = F_X(X)$ - i campioni di cui hai tracciato nell'istogramma. $T$ è casuale perché $X$(variabile normale nel tuo caso) è casuale. Poi,$$F_T(t) = P(T \leq t) = P(F_X(X) \leq t) = P(X \leq F_X^{-1}(t)) = F_X(F_X^{-1}(t)) = t$$
- $F_T(t) = t$- questo è il cdf di una distribuzione uniforme. Quindi, il pdf di T è uniforme, che è ciò che hai tracciato. Nota che l'inverso di$F_{X}(x)$ esiste solo se $F_X$ è continuo e rigorosamente crescente.
Spero che questo ti aiuti! :)