Comment se fait-il que chaque probabilité dans une distribution normale se produise avec la même fréquence? [dupliquer]

Jan 03 2021

J'ai récemment remarqué que si vous générez 10000 nombres normalement distribués et que vous trouvez ensuite la probabilité associée à chaque nombre (pnorm), chaque probabilité de 0 à 1 se produit avec approximativement la même fréquence. Voici comment je l'ai fait dans R:

var2 <- numeric(10000)
normnos <- rnorm(10000)
for (i in 1:10000) {
  var2[i] <- pnorm(normnos[i])
}
hist(var2)

Comment est-ce possible? Si toutes les probabilités ont la même probabilité de se produire, alors la distribution résultante ne serait-elle pas uniforme au lieu de normale? Je suis vraiment confus et j'apprécierais une explication.

Réponses

5 stbv Jan 03 2021 at 14:53
  1. pnorm ne calcule pas la probabilité du nombre échantillonné - il calcule plutôt $P(X \leq x)$- qui est la fonction de distribution cumulative. Pour calculer la probabilité du nombre échantillonné, vous devrez utiliser le PDF - distribution normale dans ce cas, c'est-à-dire$p(x_i - \delta < X < x_i + \delta) = N(x_i | \mu = 0, \sigma = 1)$ ($\delta$ très petit).
  2. L'histogramme que vous avez tracé est la distribution des valeurs cdf, qui est toujours uniforme quelle que soit la distribution. C'est ce qu'on appelle «l' universalité de l'uniforme »
  3. Mathématiquement, supposons $X$ est une variable aléatoire avec pdf $p_X(x)$ et cdf $F_X(x) = P(X \leq x)$. Laisser$T$ être la variable aléatoire $T = F_X(X)$ - les échantillons dont vous avez tracé dans l'histogramme. $T$ est aléatoire parce que $X$(variable normale dans votre cas) est aléatoire. Ensuite,$$F_T(t) = P(T \leq t) = P(F_X(X) \leq t) = P(X \leq F_X^{-1}(t)) = F_X(F_X^{-1}(t)) = t$$
  4. $F_T(t) = t$- c'est le CDF d'une distribution uniforme. Ainsi, le pdf de T est uniforme - c'est ce que vous avez tracé. Notez que l'inverse de$F_{X}(x)$ n'existe que si $F_X$ est continue et strictement croissante.

J'espère que cela t'aides! :)