Bagaimana mungkin setiap probabilitas dalam distribusi normal terjadi dengan frekuensi yang sama? [duplikat]

Jan 03 2021

Saya baru-baru ini memperhatikan bahwa jika Anda menghasilkan 10.000 angka terdistribusi normal dan kemudian menemukan probabilitas yang terkait dengan setiap angka (pnorm), setiap probabilitas dari 0 hingga 1 terjadi dengan frekuensi yang kira-kira sama. Inilah cara saya melakukannya di R:

var2 <- numeric(10000)
normnos <- rnorm(10000)
for (i in 1:10000) {
  var2[i] <- pnorm(normnos[i])
}
hist(var2)

Bagaimana ini mungkin? Jika semua probabilitas memiliki kemungkinan yang sama untuk terjadi, bukankah distribusi yang dihasilkan akan seragam, bukan normal? Saya benar-benar bingung dan sangat menghargai penjelasannya.

Jawaban

5 stbv Jan 03 2021 at 14:53
  1. pnorm tidak menghitung probabilitas nomor sampel - melainkan menghitung $P(X \leq x)$- yang merupakan fungsi distribusi kumulatif. Untuk menghitung probabilitas nomor sampel, Anda harus menggunakan PDF - distribusi normal dalam hal ini, yaitu,$p(x_i - \delta < X < x_i + \delta) = N(x_i | \mu = 0, \sigma = 1)$ ($\delta$ sangat kecil).
  2. Histogram yang Anda gambar adalah distribusi nilai cdf, yang selalu seragam apa pun distribusinya. Ini dikenal sebagai " Universalitas Seragam "
  3. Secara matematis, misalkan $X$ adalah variabel acak dengan pdf $p_X(x)$ dan cdf $F_X(x) = P(X \leq x)$. Membiarkan$T$ menjadi variabel acak $T = F_X(X)$ - sampel yang Anda gambar di histogram. $T$ acak karena $X$(variabel normal dalam kasus Anda) adalah acak. Kemudian,$$F_T(t) = P(T \leq t) = P(F_X(X) \leq t) = P(X \leq F_X^{-1}(t)) = F_X(F_X^{-1}(t)) = t$$
  4. $F_T(t) = t$- ini adalah cdf dari distribusi yang seragam. Jadi, pdf dari T seragam - itulah yang Anda rencanakan. Perhatikan bahwa kebalikan dari$F_{X}(x)$ hanya ada jika $F_X$ terus menerus dan meningkat secara ketat.

Semoga ini membantu! :)