Jak to się dzieje, że każde prawdopodobieństwo w rozkładzie normalnym występuje z tą samą częstotliwością? [duplikować]
Jan 03 2021
Niedawno zauważyłem, że jeśli wygenerujesz 10000 liczb o rozkładzie normalnym, a następnie znajdziesz prawdopodobieństwo związane z każdą liczbą (pnorm), każde prawdopodobieństwo od 0 do 1 występuje z mniej więcej taką samą częstotliwością. Oto jak zrobiłem to w R:
var2 <- numeric(10000)
normnos <- rnorm(10000)
for (i in 1:10000) {
var2[i] <- pnorm(normnos[i])
}
hist(var2)

Jak to jest możliwe? Gdyby wszystkie prawdopodobieństwa miały równe prawdopodobieństwo wystąpienia, to czy wynikowy rozkład nie byłby jednolity zamiast normalnego? Jestem naprawdę zdezorientowany i byłbym wdzięczny za wyjaśnienie.
Odpowiedzi
5 stbv Jan 03 2021 at 14:53
pnorm
nie oblicza prawdopodobieństwa liczby próbkowanej - raczej oblicza $P(X \leq x)$- która jest skumulowaną funkcją dystrybucji. Aby obliczyć prawdopodobieństwo liczby próbkowanej, będziesz musiał użyć pliku PDF - w tym przypadku rozkład normalny, czyli$p(x_i - \delta < X < x_i + \delta) = N(x_i | \mu = 0, \sigma = 1)$ ($\delta$ bardzo mały).- Wykreślony histogram to rozkład wartości CDF, który jest zawsze jednolity niezależnie od rozkładu. Jest to znane jako „ Uniwersalność munduru ”
- Przypuśćmy matematycznie $X$ jest zmienną losową w formacie pdf $p_X(x)$ i cdf $F_X(x) = P(X \leq x)$. Pozwolić$T$ być zmienną losową $T = F_X(X)$ - próbki, które wykreśliłeś na histogramie. $T$ jest losowe, ponieważ $X$(normalna zmienna w twoim przypadku) jest losowa. Następnie,$$F_T(t) = P(T \leq t) = P(F_X(X) \leq t) = P(X \leq F_X^{-1}(t)) = F_X(F_X^{-1}(t)) = t$$
- $F_T(t) = t$- to jest cdf jednolitej dystrybucji. Tak więc plik PDF T jest jednolity - tak jest, co wykreśliłeś. Zauważ, że odwrotność$F_{X}(x)$ istnieje tylko wtedy, gdy $F_X$ jest ciągły i stale rośnie.
Mam nadzieję że to pomoże! :)