정규 분포의 각 확률이 동일한 빈도로 어떻게 발생합니까? [복제]

Jan 03 2021

최근에 10000 개의 정규 분포 된 숫자를 생성 한 다음 각 숫자 (pnorm)와 관련된 확률을 찾으면 0에서 1까지의 각 확률이 거의 동일한 빈도로 발생한다는 사실을 알게되었습니다. R에서 한 방법은 다음과 같습니다.

var2 <- numeric(10000)
normnos <- rnorm(10000)
for (i in 1:10000) {
  var2[i] <- pnorm(normnos[i])
}
hist(var2)

이것이 어떻게 가능한지? 모든 확률이 동일한 발생 가능성을 갖는다면 결과 분포가 정규 분포가 아닌 균일하지 않을까요? 나는 정말 혼란스럽고 설명을 주시면 감사하겠습니다.

답변

5 stbv Jan 03 2021 at 14:53
  1. pnorm 샘플링 된 숫자의 확률을 계산하지 않습니다. $P(X \leq x)$-누적 분포 함수입니다. 샘플링 된 숫자의 확률을 계산하려면 PDF를 사용해야합니다.이 경우 정규 분포, 즉,$p(x_i - \delta < X < x_i + \delta) = N(x_i | \mu = 0, \sigma = 1)$ ($\delta$ 매우 작은).
  2. 플로팅 한 히스토그램은 분포에 관계없이 항상 균일 한 cdf 값의 분포입니다. 이것은 "로 알려져 통일의 보편성 "
  3. 수학적으로 $X$ pdf를 사용하는 확률 변수입니다. $p_X(x)$ 및 cdf $F_X(x) = P(X \leq x)$. 허락하다$T$ 랜덤 변수 $T = F_X(X)$ -히스토그램에 플로팅 한 샘플. $T$ 왜냐하면 $X$(귀하의 경우 정규 변수)는 무작위입니다. 그때,$$F_T(t) = P(T \leq t) = P(F_X(X) \leq t) = P(X \leq F_X^{-1}(t)) = F_X(F_X^{-1}(t)) = t$$
  4. $F_T(t) = t$-이것은 균등 분포의 cdf입니다. 따라서 T의 pdf는 균일합니다. 의 반대$F_{X}(x)$ 경우에만 존재 $F_X$ 지속적이고 엄격하게 증가합니다.

도움이 되었기를 바랍니다! :)