Асимптотика равномерного распределения смеси.

Aug 20 2020

Позволять $X = \{x_1= -\alpha, x_2, \ldots, x_n= \alpha\}$ быть набором с $x_{i+1} = x_i + \beta$ для некоторых $\alpha, \beta \in \mathbb{R}$.

$Y$ - случайная величина, которая выбирается из распределения смеси как: $$Y ~ \sim \sum_{i=1}^n p_i \mathbb{U}[x_i, x_{i+1}]$$

куда $\mathbb{U}[x_i, x_{i+1}]$ обозначает однородную случайную величину, которая выбирается из интервала $[x_i, x_{i+1}]$.

Выберем распределение, например, Гауссово, и пусть $CDF(x)$ обозначают кумулятивное значение функции распределения этого распределения при $x$.

У меня вопрос такой: дадим веса $p_i = CDF(x_{i+1}) - CDF ( x_{i})$, например, вероятность, присвоенная переменной $\mathbb{U}[x_i, x_{i+1}]$ - плотность, задаваемая распределением Гаусса на интервале $[x_i, x_{i+1}]$. Очевидно, это верно, когда у нас есть$\alpha \rightarrow \infty$. Сходится ли распределение Y к (также) гауссовскому распределению (в более общем смысле к распределению, используемому в CDF), когда$\alpha \rightarrow \infty$ а также $\beta \rightarrow 0$?

Моя интуиция говорит «да», но я не могу этого доказать.

Ответы

1 snar Aug 20 2020 at 01:46

Это верно, если вы свободны выбирать $\alpha, \beta$как хотите. Сходимость в распределении последовательности вещественных случайных величин означает их cdfs$F_n$ удовлетворить $\lim_{n\rightarrow\infty} F_n(x) = F(x)$ за каждую точку $x \in \mathbb{R}$ на котором $F$непрерывно. Мы можем показать это для любого$\varepsilon > 0$, Есть $A$ а также $B$ такое, что для всех $\alpha > A$, $\beta < B$, $$\sup_{x \in \mathbb{R}} |F_{\alpha,\beta}(x) - F(x)| < \varepsilon.$$ Этого достаточно, чтобы извлечь последовательность $\alpha_n, \beta_n$.

Это превратилось в довольно длинный пост, поэтому позвольте мне сказать, что идея проста: вы аппроксимируете плотность кусочно-постоянными функциями, и все, что имеет значение, - это области под кривыми сходятся равномерно.

Пусть тогда $\varepsilon > 0$ быть дано, и пусть $\Phi$обозначают cdf стандартного гауссиана. Там есть$A > 0$ достаточно большой, чтобы $\Phi(-A) < \varepsilon/4$, что по симметрии также означает $\Phi(A) > 1-\varepsilon/4$. Исправить некоторые$\alpha > A$. Мы только что отрезали хвосты.

Данный $x_i = -\alpha + i\beta$ с участием $n = 2\alpha/\beta \in \mathbb{Z}$, Есть $n$ интервалы $I_i = [x_i,x_{i+1})$ эта обложка $[-\alpha, \alpha)$. Предполагая$p_i = \Phi(x_{i+1}) - \Phi(x_i)$, общая распределенная вероятностная масса равна $1 - 2\Phi(-\alpha)$; оставшаяся масса может быть назначена где угодно за пределами$[-\alpha,\alpha)$; говорят, что это назначено$x > \alpha$. Я проигнорирую любые технические детали с правильной конечной точкой (вероятность 0).

Определите карту "локатора" $\ell : [-\alpha, \alpha) \rightarrow \{0, ..., n-1\}$ который ассоциируется с любым $x$ уникальный индекс $i$ левой конечной точки интервала $I_i$ (так, в частности $\ell(x_i) = i)$. Помня, что плотность$i^{th}$ равномерная случайная величина $(1/\beta)1_{I_i}$, cdf $F_{\alpha, \beta}$ удовлетворяет $$F_{\alpha, \beta}(x) = p_{\ell(x)}\frac{x - x_{\ell(x)}}{\beta} + F_{\alpha,\beta}(x_{\ell(x)}),$$ и обратите внимание, что приблизительный cdf соответствует $\Phi$ в точках дискретизации $x_i$ до смены на $\Phi(-\alpha)$: $$F_{\alpha,\beta}(x_i) = \sum_{i'=1, ..., i-1} p_{i'} = \sum_{i' = 1,...,i-1} (\Phi(x_{i'+1}) - \Phi(x_{i'})) = \Phi(x_{i}) - \Phi(-\alpha).$$ Таким образом, для любого $x \in [-\alpha, \alpha)$, \begin{align*} F_{\alpha,\beta}(x) - \Phi(x) &= p_{\ell(x)}(x - x_{\ell(x)})/\beta + F_{\alpha,\beta}(x_{\ell(x)}) - \Phi(x) \\ &= p_{\ell(x)}(x - x_{\ell(x)})/\beta + \Phi(x_{\ell(x)}) - \Phi(-\alpha) - [\Phi(x) - \Phi(x_{\ell(x)}) + \Phi(x_{\ell(x)})]\\ &= [p_{\ell(x)}(x - x_{\ell(x)})/\beta - (\Phi(x) - \Phi(x_{\ell(x)}))] - \Phi(-\alpha).\tag{1} \end{align*} Левый член в скобках в последнем равенстве выше равен $$(\Phi(x_{\ell(x)+1}) - \Phi(x_{\ell(x)}))(x - x_{\ell(x)})/\beta - (\Phi(x) - \Phi(x_{\ell(x)})),$$ что, если прищуриться, является основной теоремой исчисления: $$\Phi'(a)(x-a) \approx \frac{\Phi(b) - \Phi(a)}{\beta}(x - a) \approx (\Phi(x) - \Phi(a)).$$ Предоставляю читателю обосновать использование компактности $[-\alpha,\alpha]$ и дифференцируемость $\Phi$ на $(-\alpha,\alpha)$ что можно найти $B > 0$ такой, что любой $\beta < B$ делает термин в скобках настолько маленьким, насколько желательно, меньше, чем $\varepsilon/2$.

Возвращаясь к $(1)$, мы находим это для $\alpha > A$ а также $\beta < B$ а также $x \in [-\alpha, \alpha)$, мы получаем $$|F_{\alpha,\beta}(x) - \Phi(x)| < \varepsilon/2 + \varepsilon/4.$$ Для оставшихся $x$, мы потеряли самое большее $2\Phi(-\alpha)$ масса, ограниченная $\varepsilon/2$. Таким образом,$$\sup_{x \in \mathbb{R}} |F_{\alpha,\beta}(x) - \Phi(x)| < \varepsilon,$$ что устанавливает желаемую сходимость.