균일한 혼합물 분포의 점근적 거동

Aug 20 2020

허락하다 $X = \{x_1= -\alpha, x_2, \ldots, x_n= \alpha\}$ 세트가 되다 $x_{i+1} = x_i + \beta$ 일부 $\alpha, \beta \in \mathbb{R}$.

$Y$ 다음과 같이 혼합물 분포에서 샘플링된 확률 변수입니다. $$Y ~ \sim \sum_{i=1}^n p_i \mathbb{U}[x_i, x_{i+1}]$$

어디 $\mathbb{U}[x_i, x_{i+1}]$ 구간에서 샘플링된 균일 확률 변수를 나타냅니다. $[x_i, x_{i+1}]$.

가우스 분포와 같은 분포를 선택하고 $CDF(x)$ 에서 이 분포의 누적 분포 함수 값을 나타냅니다. $x$.

내 질문은 다음과 같습니다. 가중치를 부여합시다. $p_i = CDF(x_{i+1}) - CDF ( x_{i})$, 예: 변수에 주어진 확률 $\mathbb{U}[x_i, x_{i+1}]$ 는 간격에 대한 가우스 분포에 의해 할당된 밀도입니다. $[x_i, x_{i+1}]$. 분명히 이것은 우리가 가지고있을 때 유효합니다.$\alpha \rightarrow \infty$. Y의 분포는 (또한) 가우스 분포(더 일반적으로 CDF에서 사용되는 분포)로 수렴합니까?$\alpha \rightarrow \infty$ 그리고 $\beta \rightarrow 0$?

내 직감은 그렇다고 말하지만 나는 그것을 증명할 수 없습니다.

답변

1 snar Aug 20 2020 at 01:46

이것은 당신이 자유롭게 선택할 수 있다는 가정하에 사실입니다. $\alpha, \beta$그러나 당신이 원하는. 실수 값 확률 변수 시퀀스의 분포 수렴은 cdfs를 의미합니다.$F_n$ 풀다 $\lim_{n\rightarrow\infty} F_n(x) = F(x)$ 각 포인트에 대해 $x \in \mathbb{R}$ 어느 때 $F$연속적이다. 우리는 그것을 보여줄 수 있습니다.$\varepsilon > 0$, 있다 $A$ 그리고 $B$ 모두를 위해 $\alpha > A$, $\beta < B$, $$\sup_{x \in \mathbb{R}} |F_{\alpha,\beta}(x) - F(x)| < \varepsilon.$$ 이것은 시퀀스를 추출하기에 충분합니다. $\alpha_n, \beta_n$.

이것은 꽤 긴 게시물로 바뀌었으므로 아이디어가 간단하다고 말하겠습니다. 조각별 상수 함수로 밀도를 근사화하고 중요한 것은 곡선 아래의 영역이 균일하게 수렴된다는 것입니다.

그럼 하자 $\varepsilon > 0$ 주어지다, 그리고 시키다 $\Phi$표준 가우스의 cdf를 나타냅니다. 있다$A > 0$ 충분히 큰 $\Phi(-A) < \varepsilon/4$, 대칭에 의해 또한 의미 $\Phi(A) > 1-\varepsilon/4$. 일부 수정$\alpha > A$. 우리는 꼬리를 잘랐습니다.

주어진 $x_i = -\alpha + i\beta$ ~와 함께 $n = 2\alpha/\beta \in \mathbb{Z}$, 있다 $n$ 간격 $I_i = [x_i,x_{i+1})$ 그 덮개 $[-\alpha, \alpha)$. 가정$p_i = \Phi(x_{i+1}) - \Phi(x_i)$, 할당된 총 확률 질량은 $1 - 2\Phi(-\alpha)$; 나머지 질량은 외부에 할당할 수 있습니다.$[-\alpha,\alpha)$; 에 할당되었다고 말한다.$x > \alpha$. 올바른 끝점이 있는 기술은 무시하겠습니다(확률 0임).

"로케이터" 지도 정의 $\ell : [-\alpha, \alpha) \rightarrow \{0, ..., n-1\}$ 어떤 것과 관련이 있는지 $x$ 고유 인덱스 $i$ 간격의 왼쪽 끝점 $I_i$ (그래서 특히 $\ell(x_i) = i)$. 밀도를 기억하면$i^{th}$ 균일 확률 변수는 $(1/\beta)1_{I_i}$, CDF $F_{\alpha, \beta}$ 만족 $$F_{\alpha, \beta}(x) = p_{\ell(x)}\frac{x - x_{\ell(x)}}{\beta} + F_{\alpha,\beta}(x_{\ell(x)}),$$ 대략적인 cdf는 다음과 일치합니다. $\Phi$ 이산화 지점에서 $x_i$ 시프트까지 $\Phi(-\alpha)$: $$F_{\alpha,\beta}(x_i) = \sum_{i'=1, ..., i-1} p_{i'} = \sum_{i' = 1,...,i-1} (\Phi(x_{i'+1}) - \Phi(x_{i'})) = \Phi(x_{i}) - \Phi(-\alpha).$$ 따라서, 어떤 $x \in [-\alpha, \alpha)$, \begin{align*} F_{\alpha,\beta}(x) - \Phi(x) &= p_{\ell(x)}(x - x_{\ell(x)})/\beta + F_{\alpha,\beta}(x_{\ell(x)}) - \Phi(x) \\ &= p_{\ell(x)}(x - x_{\ell(x)})/\beta + \Phi(x_{\ell(x)}) - \Phi(-\alpha) - [\Phi(x) - \Phi(x_{\ell(x)}) + \Phi(x_{\ell(x)})]\\ &= [p_{\ell(x)}(x - x_{\ell(x)})/\beta - (\Phi(x) - \Phi(x_{\ell(x)}))] - \Phi(-\alpha).\tag{1} \end{align*} 위의 마지막 평등에서 괄호 안의 왼쪽 항은 $$(\Phi(x_{\ell(x)+1}) - \Phi(x_{\ell(x)}))(x - x_{\ell(x)})/\beta - (\Phi(x) - \Phi(x_{\ell(x)})),$$ 이것은 미적분학의 기본 정리입니다. $$\Phi'(a)(x-a) \approx \frac{\Phi(b) - \Phi(a)}{\beta}(x - a) \approx (\Phi(x) - \Phi(a)).$$ 의 간결함을 사용하여 정당화하는 것은 독자에게 맡깁니다. $[-\alpha,\alpha]$ 의 미분성 $\Phi$ ~에 $(-\alpha,\alpha)$ 찾을 수 있는 $B > 0$ 그 어떤 $\beta < B$ 괄호 안의 항을 원하는 만큼 작게 만듭니다. $\varepsilon/2$.

돌아가기 $(1)$, 우리는 그것을 찾습니다 $\alpha > A$ 그리고 $\beta < B$ 그리고 $x \in [-\alpha, \alpha)$, 우리는 얻는다 $$|F_{\alpha,\beta}(x) - \Phi(x)| < \varepsilon/2 + \varepsilon/4.$$ 나머지를 위해 $x$, 우리는 기껏해야 잘못 배치되었습니다 $2\Phi(-\alpha)$ 로 경계를 이루는 질량 $\varepsilon/2$. 따라서,$$\sup_{x \in \mathbb{R}} |F_{\alpha,\beta}(x) - \Phi(x)| < \varepsilon,$$ 원하는 수렴을 설정합니다.