Probabilité d'un écart lorsque l'inégalité de Jensen est presque serrée
Ceci est un article croisé vers une question encore sans réponse dans Math StackExchange
https://math.stackexchange.com/questions/3906767/probability-of-a-deviation-when-jensen-s-inequality-is-almost-tight
Laisser $X>0$être une variable aléatoire. Supposons que nous savions que pour certains$\epsilon \geq 0$, \ begin {eqnarray} \ log (E [X]) \ leq E [\ log (X)] + \ epsilon \ tag {1} \ label {eq: primary} \ end {eqnarray} La question est: si$\epsilon$est petit, pouvons-nous trouver une bonne borne pour \ begin {eqnarray *} P \ left (\ log (X)> E [\ log (X)] + \ eta \ right) \ end {eqnarray *} pour un$\eta > 0$. Une borne peut être obtenue de cette façon: \ begin {eqnarray *} P \ left (\ log (X)> E [\ log (X)] + \ eta \ right) & = & P \ left (X> \ exp ( E [\ log (X)] + \ eta) \ right) \\ & \ leq & E [X] / \ exp (E [\ log (X)] + \ eta) \\ & = & \ exp (\ log E [X] - E [\ log (X)] - \ eta) \\ & \ leq & \ exp (\ epsilon - \ eta) \ end {eqnarray *} où la première inégalité découle de l'inégalité de Markov. Cela semble être une bonne limite en raison de la décroissance exponentielle avec$\eta$, mais après un examen plus approfondi, il apparaît qu'il peut être considérablement amélioré. Si nous avons$\epsilon = 0$, alors cette borne donne \ begin {eqnarray} P \ left (\ log (X)> E [\ log (X)] + \ eta \ right) & \ leq & \ exp (- \ eta) \ tag {2} \ label {eq: good_but_not_best} \ end {eqnarray} Cependant, à partir de l'inégalité de Jensen appliquée à (\ ref {eq: primary}) avec$\epsilon = 0$ on obtient $\log(E[X]) = E[\log(X)]$ et donc $X$est une constante presque partout. En conséquence, pour tout$\eta>0$, \ begin {eqnarray *} P \ left (\ log (X)> E [\ log (X)] + \ eta \ right) = 0. \ end {eqnarray *} qui est (bien sûr) infiniment mieux que ( \ ref {eq: good_but_not_best}).
Il semblerait qu'une meilleure borne se désintègre à zéro lorsque $\epsilon$ se désintègre et, idéalement, préserve la décroissance exponentielle avec $\eta$. Aucune suggestion?
(Je suis conscient qu'une version de cette question a été posée précédemment Version quantitative de l'inégalité de Jensen? )
Réponses
$\newcommand\ep\epsilon $Laisser $u:=\eta>0$, de sorte que la probabilité en question soit $P(\ln X>E\ln X+u)$. Notez que cette probabilité ne changera pas si nous y remplaçons$X$ par $tX$ pour tout vrai $t>0$. Donc, sans perte de généralité \ begin {équation *} E \ ln X = 0, \ tag {-1} \ end {equation *} et donc votre condition (1) peut être réécrite comme \ begin {équation *} EX \ le e ^ \ ep, \ tag {0} \ end {équation *} puis la probabilité en question se simplifie en \ begin {équation *} P (X> v), \ end {équation *} où \ begin {équation * } v: = e ^ u> 1. \ end {equation *} Prenez maintenant n'importe quel$z\in(0,v)$ et pour tout vrai $x>0$let
\ begin {équation *} g (x): = ax-b \ ln x + c, \ end {équation *} où \ begin {équation *} a: = a (z): = \ frac {1 / v } {h (r)}, \ quad b: = b (z): = az, \ quad c: = c (z): = az \ ln \ frac ze, \ end {équation *} \ begin {équation * } h (r): = 1-r + r \ ln r, \ quad r: = z / v \ in (0,1). \ end {equation *} Notez que la fonction$h$ diminue sur $(0,1)$, avec $h(1-)=0$. Donc,$h>0$ sur $(0,1)$ et donc $a>0$ et $b>0$. Donc, la fonction$g$ est convexe sur $(0,\infty)$. De plus, \ begin {équation *} g (z) = g '(z) = 0, \ quad g (v) = 1. \ end {équation *} Il s'ensuit que$g(x)\ge1(x>v)$ pour tout vrai $x>0$et donc, au vu de (-1) et (0),
\ begin {équation *} P (X> v) \ le Eg (X) = a \, EX + c \ le ae ^ \ ep + c. \ tag {1} \ end {équation *} Cette dernière expression,$ae^\ep+c$, dans (1) peut maintenant être minimisé dans $z\in(0,v)$, avec le minimiseur exprimé en termes de Lambert $W$ fonction.
Le choix sous-optimal mais simple $z=1$in (1) donne \ begin {équation *} P (\ ln X> E \ ln X + u) = P (X> v) \ le \ frac {e ^ \ ep-1} {v-1- \ ln v} \ end {équation *} et donc \ begin {équation *} P (\ ln X> E \ ln X + u) \ le B_ \ ep (u): = \ min \ Big (1, \ frac {e ^ \ ep-1} {e ^ u-1-u} \ Big). \ end {equation *} La simple borne supérieure$B_\ep(u)$ possède les deux propriétés souhaitées:
(i) pour chaque réel $u>0$ \ begin {équation *} B_ \ ep (u) \ underet {\ ep \ downarrow0} \ longrightarrow0; \ end {équation *}
(ii) uniformément sur tous $\ep\in(0,1)$(disons) \ begin {équation *} B_ \ ep (u) = O (e ^ {- u}) \ end {équation *} comme$u\to\infty$.