Как получается, что каждая вероятность в нормальном распределении встречается с одинаковой частотой? [дубликат]
Jan 03 2021
Недавно я заметил, что если вы генерируете 10000 нормально распределенных чисел, а затем находите вероятность, связанную с каждым числом (pnorm), каждая вероятность от 0 до 1 встречается примерно с одинаковой частотой. Вот как я это сделал в R:
var2 <- numeric(10000)
normnos <- rnorm(10000)
for (i in 1:10000) {
var2[i] <- pnorm(normnos[i])
}
hist(var2)

Как это возможно? Если все вероятности имеют равную вероятность возникновения, то не будет ли полученное распределение однородным, а не нормальным? Я действительно смущен и был бы признателен за объяснение.
Ответы
5 stbv Jan 03 2021 at 14:53
pnorm
не вычисляет вероятность выбранного числа - он скорее вычисляет $P(X \leq x)$- которая является кумулятивной функцией распределения. Чтобы вычислить вероятность выборки числа, вам нужно будет использовать PDF - нормальное распределение в этом случае, то есть$p(x_i - \delta < X < x_i + \delta) = N(x_i | \mu = 0, \sigma = 1)$ ($\delta$ очень маленький).- Гистограмма, которую вы построили, представляет собой распределение значений cdf, которое всегда одинаково независимо от распределения. Это известно как « Универсальность униформы ».
- Математически предположим $X$ случайная величина с pdf $p_X(x)$ и cdf $F_X(x) = P(X \leq x)$. Позволять$T$ быть случайной величиной $T = F_X(X)$ - образцы, которые вы нанесли на гистограмму. $T$ случайно, потому что $X$(нормальная переменная в вашем случае) случайна. Потом,$$F_T(t) = P(T \leq t) = P(F_X(X) \leq t) = P(X \leq F_X^{-1}(t)) = F_X(F_X^{-1}(t)) = t$$
- $F_T(t) = t$- это cdf равномерного распределения. Итак, PDF-файл T однороден - это то, что вы нарисовали. Обратите внимание, что обратное$F_{X}(x)$ существует только если $F_X$ непрерывно и строго возрастает.
Надеюсь это поможет! :)