正規分布の各確率が同じ頻度で発生するのはどうしてですか?[複製]

Jan 03 2021

最近、10000個の正規分布の数値を生成し、各数値(pnorm)に関連付けられた確率を見つけると、0から1までの各確率がほぼ同じ頻度で発生することに気付きました。これが私がRでそれをした方法です:

var2 <- numeric(10000)
normnos <- rnorm(10000)
for (i in 1:10000) {
  var2[i] <- pnorm(normnos[i])
}
hist(var2)

これはどのように可能ですか?すべての確率が等しい可能性を持っている場合、結果の分布は通常ではなく均一ではないでしょうか?私は本当に混乱しているので、説明をいただければ幸いです。

回答

5 stbv Jan 03 2021 at 14:53
  1. pnorm サンプリングされた数の確率を計算しません-むしろ計算します $P(X \leq x)$-これは累積分布関数です。サンプリングされた数の確率を計算するには、PDFを使用する必要があります。この場合は正規分布です。$p(x_i - \delta < X < x_i + \delta) = N(x_i | \mu = 0, \sigma = 1)$ (($\delta$ 非常に少ない)。
  2. プロットしたヒストグラムは累積分布関数値の分布であり、分布に関係なく常に均一です。これは「ユニフォームの普遍性」として知られています。
  3. 数学的に、 $X$ pdfの確率変数です $p_X(x)$ および累積分布関数 $F_X(x) = P(X \leq x)$。しましょう$T$ 確率変数である $T = F_X(X)$ -ヒストグラムにプロットしたサンプル。 $T$ ランダムなので $X$(あなたの場合の正規変数)はランダムです。次に、$$F_T(t) = P(T \leq t) = P(F_X(X) \leq t) = P(X \leq F_X^{-1}(t)) = F_X(F_X^{-1}(t)) = t$$
  4. $F_T(t) = t$-これは一様分布の累積分布関数です。したがって、Tの確率密度関数は均一です-これはあなたがプロットしたものです。の逆に注意してください$F_{X}(x)$ 次の場合にのみ存在します $F_X$ 継続的かつ厳密に増加しています。

お役に立てれば!:)