¿Cómo es que cada probabilidad en una distribución normal ocurre con la misma frecuencia? [duplicar]

Jan 03 2021

Recientemente noté que si genera 10000 números distribuidos normalmente y luego encuentra la probabilidad asociada con cada número (pnorm), cada probabilidad de 0 a 1 ocurre con aproximadamente la misma frecuencia. Así es como lo hice en R:

var2 <- numeric(10000)
normnos <- rnorm(10000)
for (i in 1:10000) {
  var2[i] <- pnorm(normnos[i])
}
hist(var2)

¿Cómo es esto posible? Si todas las probabilidades tienen la misma probabilidad de ocurrir, ¿la distribución resultante no sería uniforme en lugar de normal? Estoy realmente confundido y agradecería una explicación.

Respuestas

5 stbv Jan 03 2021 at 14:53
  1. pnorm no calcula la probabilidad del número muestreado, sino que calcula $P(X \leq x)$- que es la función de distribución acumulativa. Para calcular la probabilidad del número muestreado, tendrá que usar el PDF, distribución normal en este caso, es decir,$p(x_i - \delta < X < x_i + \delta) = N(x_i | \mu = 0, \sigma = 1)$ ($\delta$ muy pequeña).
  2. El histograma que trazó es la distribución de valores de CDF, que siempre es uniforme independientemente de la distribución. Esto se conoce como " universalidad del uniforme ".
  3. Matemáticamente, suponga $X$ es una variable aleatoria con pdf $p_X(x)$ y cdf $F_X(x) = P(X \leq x)$. Dejar$T$ ser la variable aleatoria $T = F_X(X)$ - las muestras que trazó en el histograma. $T$ es aleatorio porque $X$(variable normal en su caso) es aleatoria. Entonces,$$F_T(t) = P(T \leq t) = P(F_X(X) \leq t) = P(X \leq F_X^{-1}(t)) = F_X(F_X^{-1}(t)) = t$$
  4. $F_T(t) = t$- este es el CDF de una distribución uniforme. Entonces, el pdf de T es uniforme, que es lo que trazó. Tenga en cuenta que la inversa de$F_{X}(x)$ existe solo si $F_X$ es continuo y estrictamente creciente.

¡Espero que esto ayude! :)