Perilaku asimtotik dari distribusi campuran seragam
Membiarkan$X = \{x_1= -\alpha, x_2, \ldots, x_n= \alpha\}$menjadi satu set dengan$x_{i+1} = x_i + \beta$untuk beberapa$\alpha, \beta \in \mathbb{R}$.
$Y$adalah variabel acak yang diambil sampelnya dari distribusi campuran sebagai:$$Y ~ \sim \sum_{i=1}^n p_i \mathbb{U}[x_i, x_{i+1}]$$
di mana$\mathbb{U}[x_i, x_{i+1}]$menunjukkan variabel acak seragam yang diambil sampelnya dari interval$[x_i, x_{i+1}]$.
Mari kita pilih distribusi, misalnya, distribusi Gaussian, dan mari$CDF(x)$menyatakan nilai fungsi distribusi kumulatif dari distribusi ini pada$x$.
Pertanyaan saya adalah sebagai berikut: mari kita beri bobot$p_i = CDF(x_{i+1}) - CDF ( x_{i})$, misalnya, probabilitas yang diberikan kepada variabel$\mathbb{U}[x_i, x_{i+1}]$adalah densitas yang diberikan oleh distribusi Gaussian pada interval$[x_i, x_{i+1}]$. Jelas, ini valid ketika kita memiliki$\alpha \rightarrow \infty$. Apakah distribusi Y konvergen ke (juga) distribusi Gaussian (lebih umum distribusi yang digunakan dalam CDF), ketika$\alpha \rightarrow \infty$dan$\beta \rightarrow 0$?
Intuisi saya mengatakan ya, tapi saya tidak bisa membuktikannya.
Jawaban
Ini benar dengan asumsi Anda bebas memilih$\alpha, \beta$bagaimanapun Anda inginkan. Konvergensi dalam distribusi urutan variabel acak bernilai nyata berarti cdfsnya$F_n$memuaskan$\lim_{n\rightarrow\infty} F_n(x) = F(x)$untuk setiap titik$x \in \mathbb{R}$di mana$F$terus menerus. Kami dapat menunjukkan bahwa, untuk setiap$\varepsilon > 0$, Ada$A$dan$B$sedemikian rupa sehingga untuk semua$\alpha > A$,$\beta < B$,$$\sup_{x \in \mathbb{R}} |F_{\alpha,\beta}(x) - F(x)| < \varepsilon.$$Ini cukup untuk mengekstrak sebuah urutan$\alpha_n, \beta_n$.
Ini berubah menjadi posting yang cukup panjang, jadi izinkan saya mengatakan idenya sederhana: Anda memperkirakan kepadatan dengan fungsi konstan sepotong-sepotong, dan yang terpenting adalah area di bawah kurva bertemu secara seragam.

Biarkan kemudian$\varepsilon > 0$diberikan, dan biarkan$\Phi$menunjukkan cdf dari Gaussian standar. Ada$A > 0$cukup besar sehingga$\Phi(-A) < \varepsilon/4$, yang dengan simetri juga menyiratkan$\Phi(A) > 1-\varepsilon/4$. Perbaiki beberapa$\alpha > A$. Kami baru saja memotong ekornya.
Diberikan$x_i = -\alpha + i\beta$dengan$n = 2\alpha/\beta \in \mathbb{Z}$, Ada$n$interval$I_i = [x_i,x_{i+1})$penutup itu$[-\alpha, \alpha)$. Asumsi$p_i = \Phi(x_{i+1}) - \Phi(x_i)$, massa probabilitas total yang dialokasikan adalah$1 - 2\Phi(-\alpha)$; massa yang tersisa dapat diberikan di mana saja di luar$[-\alpha,\alpha)$; katakan itu ditugaskan untuk$x > \alpha$. Saya akan mengabaikan teknis apa pun dengan titik akhir yang tepat (memiliki probabilitas 0).
Tentukan peta "pencari"$\ell : [-\alpha, \alpha) \rightarrow \{0, ..., n-1\}$yang berasosiasi dengan apapun$x$indeks unik$i$dari titik akhir kiri dalam interval$I_i$(jadi khususnya$\ell(x_i) = i)$. Mengingat densitas$i^{th}$variabel acak seragam adalah$(1/\beta)1_{I_i}$, cdf$F_{\alpha, \beta}$memuaskan$$F_{\alpha, \beta}(x) = p_{\ell(x)}\frac{x - x_{\ell(x)}}{\beta} + F_{\alpha,\beta}(x_{\ell(x)}),$$dan perhatikan bahwa perkiraan cdf sesuai dengan$\Phi$pada titik-titik diskritisasi$x_i$sampai shift$\Phi(-\alpha)$:$$F_{\alpha,\beta}(x_i) = \sum_{i'=1, ..., i-1} p_{i'} = \sum_{i' = 1,...,i-1} (\Phi(x_{i'+1}) - \Phi(x_{i'})) = \Phi(x_{i}) - \Phi(-\alpha).$$Jadi, untuk setiap$x \in [-\alpha, \alpha)$,\begin{align*} F_{\alpha,\beta}(x) - \Phi(x) &= p_{\ell(x)}(x - x_{\ell(x)})/\beta + F_{\alpha,\beta}(x_{\ell(x)}) - \Phi(x) \\ &= p_{\ell(x)}(x - x_{\ell(x)})/\beta + \Phi(x_{\ell(x)}) - \Phi(-\alpha) - [\Phi(x) - \Phi(x_{\ell(x)}) + \Phi(x_{\ell(x)})]\\ &= [p_{\ell(x)}(x - x_{\ell(x)})/\beta - (\Phi(x) - \Phi(x_{\ell(x)}))] - \Phi(-\alpha).\tag{1} \end{align*}Suku kiri dalam kurung pada persamaan terakhir di atas adalah$$(\Phi(x_{\ell(x)+1}) - \Phi(x_{\ell(x)}))(x - x_{\ell(x)})/\beta - (\Phi(x) - \Phi(x_{\ell(x)})),$$yang, jika Anda menyipitkan mata, adalah teorema dasar kalkulus:$$\Phi'(a)(x-a) \approx \frac{\Phi(b) - \Phi(a)}{\beta}(x - a) \approx (\Phi(x) - \Phi(a)).$$Saya serahkan kepada pembaca untuk membenarkan penggunaan kekompakan$[-\alpha,\alpha]$dan diferensiasi dari$\Phi$pada$(-\alpha,\alpha)$yang bisa ditemukan$B > 0$sedemikian rupa sehingga$\beta < B$membuat istilah dalam tanda kurung sekecil yang diinginkan, kurang dari$\varepsilon/2$.
Kembali ke$(1)$, kita menemukan bahwa untuk$\alpha > A$dan$\beta < B$dan$x \in [-\alpha, \alpha)$, kita mendapatkan$$|F_{\alpha,\beta}(x) - \Phi(x)| < \varepsilon/2 + \varepsilon/4.$$Untuk yang tersisa$x$, paling banyak kita salah tempat$2\Phi(-\alpha)$massa yang dibatasi oleh$\varepsilon/2$. Dengan demikian,$$\sup_{x \in \mathbb{R}} |F_{\alpha,\beta}(x) - \Phi(x)| < \varepsilon,$$yang membentuk konvergensi yang diinginkan.