Làm thế nào để mỗi xác suất trong phân phối chuẩn đều xảy ra với cùng tần số? [bản sao]
Jan 03 2021
Gần đây tôi nhận thấy rằng nếu bạn tạo 10000 số có phân phối chuẩn và sau đó tìm xác suất liên quan đến mỗi số (pnorm), thì mỗi xác suất từ 0 đến 1 xảy ra với tần suất xấp xỉ như nhau. Đây là cách tôi đã làm điều đó trong R:
var2 <- numeric(10000)
normnos <- rnorm(10000)
for (i in 1:10000) {
var2[i] <- pnorm(normnos[i])
}
hist(var2)
![](https://post.nghiatu.com/assets/images/s/ubVdj.png)
Sao có thể như thế được? Nếu tất cả các xác suất có khả năng xảy ra bằng nhau, thì không phải phân phối kết quả là đồng nhất thay vì bình thường? Tôi thực sự bối rối và sẽ đánh giá cao một lời giải thích.
Trả lời
5 stbv Jan 03 2021 at 14:53
pnorm
không tính toán xác suất của số được lấy mẫu - nó tính toán $P(X \leq x)$- là hàm phân phối tích lũy. Để tính xác suất của số được lấy mẫu, bạn sẽ phải sử dụng PDF - phân phối chuẩn trong trường hợp này, nghĩa là$p(x_i - \delta < X < x_i + \delta) = N(x_i | \mu = 0, \sigma = 1)$ ($\delta$ rất nhỏ).- Biểu đồ mà bạn vẽ biểu đồ là sự phân bố của các giá trị cdf, luôn luôn đồng nhất bất kể phân phối. Đây được gọi là "Tính phổ biến của đồng phục "
- Về mặt toán học, giả sử $X$ là một biến ngẫu nhiên với pdf $p_X(x)$ và cdf $F_X(x) = P(X \leq x)$. Để cho$T$ là biến ngẫu nhiên $T = F_X(X)$ - các mẫu mà bạn đã vẽ trong biểu đồ. $T$ là ngẫu nhiên bởi vì $X$(biến bình thường trong trường hợp của bạn) là ngẫu nhiên. Sau đó,$$F_T(t) = P(T \leq t) = P(F_X(X) \leq t) = P(X \leq F_X^{-1}(t)) = F_X(F_X^{-1}(t)) = t$$
- $F_T(t) = t$- đây là cdf của một bản phân phối đồng đều. Vì vậy, pdf của T là đồng nhất - đó là những gì bạn đã vẽ. Lưu ý rằng nghịch đảo của$F_{X}(x)$ chỉ tồn tại nếu $F_X$ đang tăng liên tục và nghiêm ngặt.
Hi vọng điêu nay co ich! :)