Prawdopodobieństwo odchylenia, gdy nierówność Jensena jest prawie mała

Dec 02 2020

To jest przekierowanie do pytania, na które nie udzielono jeszcze odpowiedzi w Math StackExchange

https://math.stackexchange.com/questions/3906767/probability-of-a-deviation-when-jensen-s-inequality-is-almost-tight

Pozwolić $X>0$być zmienną losową. Załóżmy, że dla niektórych o tym wiemy$\epsilon \geq 0$, \ begin {eqnarray} \ log (E [X]) \ leq E [\ log (X)] + \ epsilon \ tag {1} \ label {eq: primary} \ end {eqnarray} Pytanie brzmi: jeśli$\epsilon$jest mała, czy możemy znaleźć dobre ograniczenie dla \ begin {eqnarray *} P \ left (\ log (X)> E [\ log (X)] + \ eta \ right) \ end {eqnarray *} dla danego$\eta > 0$. Jedno ograniczenie można uzyskać w ten sposób: \ begin {eqnarray *} P \ left (\ log (X)> E [\ log (X)] + \ eta \ right) & = & P \ left (X> \ exp ( E [\ log (X)] + \ eta) \ right) \\ & \ leq & E [X] / \ exp (E [\ log (X)] + \ eta) \\ & = & \ exp (\ log E [X] - E [\ log (X)] - \ eta) \\ & \ leq & \ exp (\ epsilon - \ eta) \ end {eqnarray *} gdzie pierwsza nierówność wynika z nierówności Markowa. Wydaje się, że to dobre ograniczenie ze względu na wykładniczy rozpad$\eta$, ale po dokładniejszym zbadaniu okazuje się, że można go znacznie poprawić. Jeśli mamy$\epsilon = 0$, to ta granica daje \ begin {eqnarray} P \ left (\ log (X)> E [\ log (X)] + \ eta \ right) & \ leq & \ exp (- \ eta) \ tag {2} \ label {eq: good_but_not_best} \ end {eqnarray} Jednak z nierówności Jensena zastosowanej do (\ ref {eq: primary}) z$\epsilon = 0$ otrzymujemy $\log(E[X]) = E[\log(X)]$ i dlatego $X$jest stała prawie wszędzie. W konsekwencji dla każdego$\eta>0$, \ begin {eqnarray *} P \ left (\ log (X)> E [\ log (X)] + \ eta \ right) = 0. \ end {eqnarray *} co jest (oczywiście) nieskończenie lepsze niż ( \ ref {eq: good_but_not_best}).

Wydawałoby się, że lepsze wiązanie powinno spaść do zera jako $\epsilon$ rozpada się i najlepiej zachować wykładniczy rozpad z $\eta$. Jakieś sugestie?

(Wiem, że wersja tego pytania została zadana wcześniej ilościowej wersji nierówności Jensena? )

Odpowiedzi

2 IosifPinelis Dec 02 2020 at 08:31

$\newcommand\ep\epsilon $Pozwolić $u:=\eta>0$, tak aby dane prawdopodobieństwo było $P(\ln X>E\ln X+u)$. Zauważ, że to prawdopodobieństwo nie zmieni się, jeśli tam zastąpimy$X$ przez $tX$ dla każdego prawdziwego $t>0$. Tak więc bez utraty ogólności \ begin {equation *} E \ ln X = 0, \ tag {-1} \ end {equation *} i stąd twój warunek (1) można przepisać jako \ begin {equation *} EX \ le e ^ \ ep, \ tag {0} \ end {equation *}, a następnie prawdopodobieństwo, o którym mowa, upraszcza się do \ begin {equation *} P (X> v), \ end {equation *} gdzie \ begin {equation * } v: = e ^ u> 1. \ end {equation *} Weź teraz dowolne$z\in(0,v)$ i naprawdę $x>0$niech
\ begin {equation *} g (x): = ax-b \ ln x + c, \ end {equation *} gdzie \ begin {equation *} a: = a (z): = \ frac {1 / v } {h (r)}, \ quad b: = b (z): = az, \ quad c: = c (z): = az \ ln \ frac ze, \ end {equation *} \ begin {equation * } h (r): = 1-r + r \ ln r, \ quad r: = z / v \ in (0,1). \ end {equation *} Zauważ, że funkcja$h$ maleje $(0,1)$, z $h(1-)=0$. Więc,$h>0$ na $(0,1)$ i stąd $a>0$ i $b>0$. A więc funkcja$g$ jest wypukły $(0,\infty)$. Ponadto \ begin {equation *} g (z) = g '(z) = 0, \ quad g (v) = 1. \ end {equation *} Wynika z tego$g(x)\ge1(x>v)$ dla wszystkich prawdziwych $x>0$a zatem, biorąc pod uwagę (-1) i (0),
\ begin {equation *} P (X> v) \ le Eg (X) = a \, EX + c \ le ae ^ \ ep + c. \ tag {1} \ end {equation *} Drugie wyrażenie,$ae^\ep+c$, w (1) można teraz zminimalizować w $z\in(0,v)$, z minimalizatorem wyrażonym w kategoriach Lamberta $W$ funkcjonować.

Nieoptymalny, ale prosty wybór $z=1$in (1) daje \ begin {equation *} P (\ ln X> E \ ln X + u) = P (X> v) \ le \ frac {e ^ \ ep-1} {v-1- \ ln v} \ end {equation *} i stąd \ begin {equation *} P (\ ln X> E \ ln X + u) \ le B_ \ ep (u): = \ min \ Big (1, \ frac {e ^ \ ep-1} {e ^ u-1-u} \ Big). \ end {equation *} Prosta górna granica$B_\ep(u)$ ma obie pożądane właściwości:

(i) dla każdego rzeczywistego $u>0$ \ begin {equation *} B_ \ ep (u) \ underset {\ ep \ downarrow0} \ longrightarrow0; \ end {equation *}

(ii) jednakowo we wszystkich $\ep\in(0,1)$(powiedz) \ begin {equation *} B_ \ ep (u) = O (e ^ {- u}) \ end {equation *} as$u\to\infty$.