Probabilidad de una desviación cuando la desigualdad de Jensen es casi estrecha
Esta es una publicación cruzada a una pregunta aún sin respuesta en Math StackExchange
https://math.stackexchange.com/questions/3906767/probability-of-a-deviation-when-jensen-s-inequality-is-almost-tight
Dejar $X>0$ser una variable aleatoria. Supongamos que supiéramos que para algunos$\epsilon \geq 0$, \ begin {eqnarray} \ log (E [X]) \ leq E [\ log (X)] + \ epsilon \ tag {1} \ label {eq: primary} \ end {eqnarray} La pregunta es: si$\epsilon$es pequeña, ¿podemos encontrar un buen límite para \ begin {eqnarray *} P \ left (\ log (X)> E [\ log (X)] + \ eta \ right) \ end {eqnarray *} para un$\eta > 0$. Se puede obtener un límite de esta manera: \ begin {eqnarray *} P \ left (\ log (X)> E [\ log (X)] + \ eta \ right) & = & P \ left (X> \ exp ( E [\ log (X)] + \ eta) \ right) \\ & \ leq & E [X] / \ exp (E [\ log (X)] + \ eta) \\ & = & \ exp (\ log E [X] - E [\ log (X)] - \ eta) \\ & \ leq & \ exp (\ epsilon - \ eta) \ end {eqnarray *} donde la primera desigualdad se sigue de la desigualdad de Markov. Esto parece un buen límite debido a la caída exponencial con$\eta$, pero tras un examen más detenido, parece que se puede mejorar significativamente. Si tenemos$\epsilon = 0$, entonces estos límites dan \ begin {eqnarray} P \ left (\ log (X)> E [\ log (X)] + \ eta \ right) & \ leq & \ exp (- \ eta) \ tag {2} \ label {eq: good_but_not_best} \ end {eqnarray} Sin embargo, de la desigualdad de Jensen aplicada a (\ ref {eq: primary}) con$\epsilon = 0$ obtenemos $\log(E[X]) = E[\log(X)]$ y por lo tanto $X$es una constante en casi todas partes. Como consecuencia, para cualquier$\eta>0$, \ begin {eqnarray *} P \ left (\ log (X)> E [\ log (X)] + \ eta \ right) = 0. \ end {eqnarray *} que es (por supuesto) infinitamente mejor que ( \ ref {eq: good_but_not_best}).
Parecería que un mejor límite debería decaer a cero a medida que $\epsilon$ decae, e idealmente preservar el decaimiento exponencial con $\eta$. ¿Alguna sugerencia?
(Soy consciente de que se ha hecho anteriormente una versión de esta pregunta ¿ Versión cuantitativa de la desigualdad de Jensen? )
Respuestas
$\newcommand\ep\epsilon $Dejar $u:=\eta>0$, de modo que la probabilidad en cuestión es $P(\ln X>E\ln X+u)$. Tenga en cuenta que esta probabilidad no cambiará si reemplazamos allí$X$ por $tX$ por cualquier real $t>0$. Entonces, sin pérdida de generalidad \ begin {ecuación *} E \ ln X = 0, \ tag {-1} \ end {ecuación *} y, por lo tanto, su condición (1) puede reescribirse como \ begin {ecuación *} EX \ le e ^ \ ep, \ etiqueta {0} \ end {ecuación *} y luego la probabilidad en cuestión se simplifica a \ begin {ecuación *} P (X> v), \ end {ecuación *} donde \ begin {ecuación * } v: = e ^ u> 1. \ end {ecuación *} Toma ahora cualquier$z\in(0,v)$ y para todo real $x>0$sea
\ begin {ecuación *} g (x): = ax-b \ ln x + c, \ end {ecuación *} donde \ begin {ecuación *} a: = a (z): = \ frac {1 / v } {h (r)}, \ quad b: = b (z): = az, \ quad c: = c (z): = az \ ln \ frac ze, \ end {ecuación *} \ begin {ecuación * } h (r): = 1-r + r \ ln r, \ quad r: = z / v \ in (0,1). \ end {ecuación *} Tenga en cuenta que la función$h$ está disminuyendo en $(0,1)$, con $h(1-)=0$. Entonces,$h>0$ en $(0,1)$ y por lo tanto $a>0$ y $b>0$. Entonces, la función$g$ es convexo en $(0,\infty)$. Además, \ begin {ecuación *} g (z) = g '(z) = 0, \ quad g (v) = 1. \ end {ecuación *} De ello se deduce que$g(x)\ge1(x>v)$ por todo real $x>0$y por lo tanto, en vista de (-1) y (0),
\ begin {ecuación *} P (X> v) \ le Eg (X) = a \, EX + c \ le ae ^ \ ep + c. \ tag {1} \ end {ecuación *} La última expresión,$ae^\ep+c$, en (1) ahora se puede minimizar en $z\in(0,v)$, con el minimizador expresado en términos de Lambert $W$ función.
La elección subóptima pero simple $z=1$en (1) produce \ begin {ecuación *} P (\ ln X> E \ ln X + u) = P (X> v) \ le \ frac {e ^ \ ep-1} {v-1- \ ln v} \ end {ecuación *} y por lo tanto \ begin {ecuación *} P (\ ln X> E \ ln X + u) \ le B_ \ ep (u): = \ min \ Big (1, \ frac {e ^ \ ep-1} {e ^ u-1-u} \ Grande). \ end {ecuación *} El límite superior simple$B_\ep(u)$ tiene las dos propiedades deseadas:
(i) para cada real $u>0$ \ begin {ecuación *} B_ \ ep (u) \ underset {\ ep \ downarrow0} \ longrightarrow0; \ end {ecuación *}
(ii) uniformemente sobre todo $\ep\in(0,1)$(digamos) \ begin {ecuación *} B_ \ ep (u) = O (e ^ {- u}) \ end {ecuación *} como$u\to\infty$.