Stima della massa di probabilità data a un intervallo tramite l'approssimazione di Taylor del primo ordine
$F(x)$ è una funzione di distribuzione cumulativa (CDF) su un intervallo continuo simmetrico, ad es. $[-\alpha, \alpha]$ per alcuni $\alpha \in \mathbb{R}$. Possiamo anche supporre che la distribuzione sia continua e simmetrica. Tuttavia, il CDF non è necessariamente differenziabile due volte (ovvero, il PDF potrebbe non essere differenziabili). Ad esempio, la distribuzione sottostante può essere (e nel mio caso è) una distribuzione di Laplace.
Permettere $\hat{x} \in (-\alpha, \alpha)$ essere un punto arbitrario e $x$ essere tale $x \in (\hat{x}, \hat{x} + \beta)$ per alcuni $\beta > 0$.
Ho la seguente affermazione, che intuitivamente ha senso, ma difficile da dimostrare formalmente: l'approssimazione $$ \begin{align} \frac{F(\hat{x} + \beta) - F(\hat{x})}{\beta}(x - \hat{x})& \stackrel{(1)}{\approx} F'(\hat{x}) (x - \hat{x}) \\ & \stackrel{(2)}{\approx} F(x) - F(\hat{x}) \end{align} $$ può essere stretto quanto desiderato diminuendo $\beta$. Formalmente, per ogni piccolo$\epsilon > 0$ esiste un $\beta(\epsilon)$ tale che per tutti $0 < \beta < \beta(\epsilon)$ possiamo ottenere:
$$\left| \left( \frac{F(\hat{x} + \beta) - F(\hat{x})}{\beta}(x - \hat{x}) \right) - \left( F(x) - F(\hat{x}) \right) \right| < \epsilon.$$
Notare che al punto $(1)$ usiamo la definizione di derivata e al passo $(2)$ usiamo un'approssimazione di Taylor del primo ordine.
Tentativo: ho provato a utilizzare la disuguaglianza di Taylor per l'errore nell'approssimazione di Taylor del primo ordine. Tuttavia, ciò richiede$F(x)$essere differenziabili due volte. Quindi non sono sicuro di come questa convergenza possa essere dimostrata.
Nota: in un'altra discussione su Math.SE è stata menzionata l'affermazione di cui sopra e sospetto che potrebbe non essere valida se il PDF non è differenziabili. Tuttavia, l'autore afferma che ciò è dovuto solo alla compattezza di$[-\alpha, \alpha]$ e differenziabilità di $F(x)$. Quindi volevo avere una nuova discussione su questo risultato più generale perché i) questa è una lunga discussione per un follow-up in un altro post, e ii) questo sembra essere un risultato molto utile se possiamo provarlo qui.
Risposte
Dato $\varepsilon,$ si può trovare $\delta$ così piccolo che per tutti $\widehat x + \beta\in(\widehat x - \delta,\widehat x+\delta)\cap (\widehat x -1,\widehat x + 1),$ $$ \left| \frac{F(\widehat x+\beta) - F(\widehat x\,)} \beta - F'(\widehat x\,) \right| < \varepsilon/2. $$ Se $x$ è tra $\widehat x$ e $\widehat x+\beta,$ quindi a causa della parola "tutto" sopra, ne consegue $$ \left| \frac{F(x) - F(\widehat x\,)}{x-\widehat x} - F'(\widehat x\,) \right|< \varepsilon/2. $$ Dalla disuguaglianza triangolare ne consegue che $$ \left| \frac{F(\widehat x + \beta) - F(\widehat x\,)} \beta - \frac{F(x) - F(\widehat x\,)}{x- \widehat x} \right| < \varepsilon. $$ Da $|\widehat x - x|<1,$ moltiplicando entrambi i lati per $|\widehat x - x|$ ti lascia con qualcosa${}<\varepsilon$ dal lato giusto.
Permettere $f := F'$essere il PDF. Lo presumo anche io$\beta$ è abbastanza piccolo $[\hat{x},\hat{x} + \beta] \subset [-\alpha,\alpha]$. Per compattezza di$[-\alpha,\alpha]$, $f$ è uniformemente continua $[-\alpha,\alpha]$. Cioè, esiste una funzione continua non decrescente$h:[0,\infty)\to[0,\infty)$ a seconda di $F$ tale che $h(0) = 0$ e,
$$|f(a) - f(b)| \leq h(|b-a|) \text{ when } a,b \in [-\alpha,\alpha].$$
Quindi,
$$\sup_{y \in [\hat{x},x]} f(y) - \inf_{z \in [\hat{x},x]} f(z) := \overline{f} - \underline{f} \leq h(\beta).$$
Ma allora,
\begin{align} \underline{f}(x - \hat{x}) &\leq F(x) - F(\hat{x}) &\leq \overline{f}(x - \hat{x})\\ \underline{f}(x - \hat{x}) &\leq f(\hat{x})(x - \hat{x}) &\leq \overline{f}(x - \hat{x}). \end{align}
Quindi,
$$\left|F(x) - F(\hat{x}) - f(\hat{x})(x - \hat{x})\right| \leq \left|(\overline{f} - \underline{f})(x - \hat{x})\right| \leq h(\beta)(x - \hat{x}) \leq \beta h(\beta).$$
In conclusione, $\overset{(2)}{\approx}$ nell'affermazione del tuo problema regge asintoticamente come $\beta \to 0$, ma la stima specifica fornita dal teorema di Taylor potrebbe fallire quando $f$non è differenziabile. Invece ottieni una stima che coinvolge$h$, che esiste perché stiamo lavorando su uno spazio compatto.