Comment se fait-il que chaque probabilité dans une distribution normale se produise avec la même fréquence? [dupliquer]
Jan 03 2021
J'ai récemment remarqué que si vous générez 10000 nombres normalement distribués et que vous trouvez ensuite la probabilité associée à chaque nombre (pnorm), chaque probabilité de 0 à 1 se produit avec approximativement la même fréquence. Voici comment je l'ai fait dans R:
var2 <- numeric(10000)
normnos <- rnorm(10000)
for (i in 1:10000) {
var2[i] <- pnorm(normnos[i])
}
hist(var2)

Comment est-ce possible? Si toutes les probabilités ont la même probabilité de se produire, alors la distribution résultante ne serait-elle pas uniforme au lieu de normale? Je suis vraiment confus et j'apprécierais une explication.
Réponses
5 stbv Jan 03 2021 at 14:53
pnorm
ne calcule pas la probabilité du nombre échantillonné - il calcule plutôt $P(X \leq x)$- qui est la fonction de distribution cumulative. Pour calculer la probabilité du nombre échantillonné, vous devrez utiliser le PDF - distribution normale dans ce cas, c'est-à-dire$p(x_i - \delta < X < x_i + \delta) = N(x_i | \mu = 0, \sigma = 1)$ ($\delta$ très petit).- L'histogramme que vous avez tracé est la distribution des valeurs cdf, qui est toujours uniforme quelle que soit la distribution. C'est ce qu'on appelle «l' universalité de l'uniforme »
- Mathématiquement, supposons $X$ est une variable aléatoire avec pdf $p_X(x)$ et cdf $F_X(x) = P(X \leq x)$. Laisser$T$ être la variable aléatoire $T = F_X(X)$ - les échantillons dont vous avez tracé dans l'histogramme. $T$ est aléatoire parce que $X$(variable normale dans votre cas) est aléatoire. Ensuite,$$F_T(t) = P(T \leq t) = P(F_X(X) \leq t) = P(X \leq F_X^{-1}(t)) = F_X(F_X^{-1}(t)) = t$$
- $F_T(t) = t$- c'est le CDF d'une distribution uniforme. Ainsi, le pdf de T est uniforme - c'est ce que vous avez tracé. Notez que l'inverse de$F_{X}(x)$ n'existe que si $F_X$ est continue et strictement croissante.
J'espère que cela t'aides! :)