Questa stima di convessità forte è valida?
Permettere$F:[0,\infty) \to [0,\infty)$essere un$C^2$funzione strettamente convessa, e let$r_0<r_1$essere costanti fisse positive. Permettere$$a<r_0<r_1<c<b, \tag{1}$$e lascia$\lambda \in [0,1]$soddisfare$ \lambda a +(1-\lambda)b=c. $
Impostare$D(a,b,c)=\lambda F(a)+(1-\lambda)F(b)-F(c) $.
Domanda: Esiste una costante $m>0$(che può dipendere da$f,r_0,r_1$ma non su$a,b,c$) tale che$ D(a,b,c) \ge m\lambda(1-\lambda)(r_1-r_0)^2 $per qualsiasi scelta di$a,b,c$condizione soddisfacente$(1)$?
Ecco il punto chiave:
Se$f'' \ge m$, poi$f$è fortemente convesso con il parametro$m$, Così$$ D(a,b,c) \ge \frac{1}{2}m\lambda(1-\lambda)(b-a)^2 \ge \frac{1}{2}m\lambda(1-\lambda)(r_1-r_0)^2 \tag{2} $$come richiesto. Tuttavia, nel nostro caso,$c$e$b$può essere arbitrariamente grande, e$F$può diventare "meno convesso" (più vicino ad essere affine) quando$x \to \infty$. In altre parole, se$\lim_{x \to \infty}F''(x)=0$, quindi il limite inferiore$(2)$diventa il limite banale$$ D(a,b,c) \ge \frac{1}{2} (\inf F'')\lambda(1-\lambda)(b-a)^2=0. $$
Quindi, "l'applicazione ingenua" della forte convessità non si applica qui così com'è. Tuttavia, la mia intuizione è che anche se$\lim_{x \to \infty}F''(x)=0$, dovremmo in qualche modo incontrare "il forte contenuto di convessità" che si trova tra il fisso$r_0$e$r_1$quindi il "divario di convessità"$D(a,b,c)$dovrebbe essere delimitato da zero.
Ho pensato di esprimere$D(a,b,c)$come qualche integrale di$F''$su un dominio che contiene$[r_0,r_1]$ma finora senza successo.
Risposte
Se è sufficiente richiederlo$F$è strettamente convessa e differenziabile su un intervallo$I \subset \Bbb R$. (Anche il requisito di differenziabilità può essere eliminato, vedere le osservazioni alla fine della risposta.)
Per$a, b \in I$insieme a$a < b$e$c = \lambda a + (1 - \lambda) b$insieme a$0 \le \lambda \le 1$possiamo scrivere$$ D(a, b, c) = \lambda F(a)+(1-\lambda)F(b)-F(c) \\ = \lambda \bigl \{ F(a) - F(c) - (a-c)F'(c) \bigr\} + (1- \lambda) \bigl \{F(b) - F(c) - (b-c)F'(c)\bigr\} \, . $$
Questo suggerisce di introdurre$$ H(u, v) = F(u) - F(v) - (u-v) F'(v) $$per$u, v \in I$.$H$ha le seguenti proprietà:
- $H(u, v) > 0$Se$u \ne v$.
- $H(u_1, v) > H(u_2, v)$Se$u_1 < u_2 \le v$, cioè$H(u,v)$sta diminuendo$u$fino a quando$u \le v$.
- $H(u, v_1) < H(u, v_2)$Se$u \le v_1 < v_2$, cioè$H(u, v)$sta aumentando$v$fino a quando$u \le v$.
La proprietà (1) è una diretta conseguenza della stretta convessità:$F(u)$è maggiore del valore corrispondente della retta tangente a$x=v$.
Per la proprietà (2) assumiamo$u_1 < u_2 \le v$e calcola$$ H(u_1, v) - H(u_2, v) = F(u_1) - F(u_2) - (u_1 - u_2) F'(v) \\ \ge F(u_1) - F(u_2) - (u_1 - u_2) F'(u_2) = H(u_1, u_2) > 0 \, . $$Qui abbiamo usato quello$F'$sta aumentando.
Per la proprietà (3) assumiamo$u \le v_1 < v_2$e calcola$$ H(u,v_1) - H(u, v_2) = -F(v_1) - (u-v_1)F'(v_1) + F(v_2) + (u-v_2) F'(v_2) \\ \le -F(v_1) - (u-v_1)F'(v_2) + F(v_2) + (u-v_2) F'(v_2) \\ = -H(v_1, v_2) < 0 \, . $$
Con questi strumenti, stimare$D(a, b, c)$dal basso diventa facile. Se$a \le r_0 < r_1 \le c < b$poi$$ D(a, b, c) = \lambda H(a, c) + (1-\lambda)H(b,c) \\ \ge \lambda H(a, c) \ge \lambda H(r_0, r_1) \ge \lambda(1- \lambda) H(r_0, r_1) \\ = m \lambda(1-\lambda) (r_1-r_0)^2 $$insieme a$m$definito come$$ m = \frac{H(r_0, r_1)}{(r_1-r_0)^2} = \frac{F(r_0) - F(r_1) - (r_0 - r_1) F'(r_1)}{(r_1-r_0)^2} > 0 \, . $$
Osservazioni:
- L'ipotesi che$F$è definito solo su$[0, \infty)$con valori in$[0, \infty)$non è stato utilizzato nella dimostrazione.
- Anche il requisito di differenziabilità può essere eliminato. Una funzione convessa ha derivate unilaterali in ogni punto interno dell'intervallo. La dimostrazione di cui sopra funziona ancora se sostituiamo$F'$dalla derivata destra (o sinistra).
Soluzione alternativa
Proviamo che la migliore costante$m$è$$m = \frac{F(r_0) - F(r_1) - F'(r_1)(r_0 - r_1)}{(r_1 - r_0)^2} > 0.$$(Nota: in realtà, è uguale a$\frac{1}{(r_1 - r_0)^2}\int_{r_0}^{r_1} (x- r_0) F''(x) \mathrm{d} x$che è positivo da allora$F(x)$è strettamente convesso.)
Innanzitutto, riformuliamo il problema come segue:
Permettere$F : [0, \infty) \to [0, \infty)$essere un$\mathrm{C}^2$funzione strettamente convessa. Permettere$0 < r_0 < r_1$essere costanti fisse. Esiste una costante$m > 0$tale che$$\lambda F(a) + (1 - \lambda)F(b) - F(\lambda a + (1 - \lambda)b) \ge m \lambda (1 - \lambda) (r_1 - r_0)^2$$per tutti i numeri reali$a, b, \lambda$soddisfacente$$0 < \lambda < 1, \quad 0 \le a < r_0 < r_1 < \lambda a + (1 - \lambda) b\ ?$$
In secondo luogo, abbiamo\begin{align} &\inf_{0 < \lambda < 1,\ 0 \le a < r_0 < r_1 < \lambda a + (1 - \lambda) b} \frac{\lambda F(a) + (1 - \lambda)F(b) - F(\lambda a + (1 - \lambda)b)}{\lambda (1 - \lambda)}\\ =\ & \inf_{0 < \lambda < 1, \ 0 \le a < r_0} \left(\inf_{b > \frac{r_1 - \lambda a}{1 - \lambda}} \frac{\lambda F(a) + (1 - \lambda)F(b) - F(\lambda a + (1 - \lambda)b)}{\lambda (1 - \lambda)}\right)\\ =\ & \inf_{0 < \lambda < 1, \ 0 \le a < r_0} \frac{\lambda F(a) + (1 - \lambda)F(\frac{r_1 - \lambda a}{1 - \lambda}) - F(r_1)}{\lambda (1 - \lambda)} \tag{1}\\ =\ & \inf_{0 < \lambda < 1} \left(\inf_{0 \le a < r_0} \frac{\lambda F(a) + (1 - \lambda)F(\frac{r_1 - \lambda a}{1 - \lambda}) - F(r_1)}{\lambda (1 - \lambda)} \right)\\ =\ & \inf_{0 < \lambda < 1} \frac{\lambda F(r_0) + (1 - \lambda)F(\frac{r_1 - \lambda r_0}{1 - \lambda}) - F(r_1)}{\lambda (1 - \lambda)} \tag{2}\\ =\ & \inf_{y > r_1} \frac{(y - r_0)(y - r_1)F(r_0) + (r_1 - r_0)(y - r_0)F(y) - (y - r_0)^2F(r_1)}{(r_1 - r_0)(y - r_1)} \tag{3}\\ =\ & \lim_{y \to r_1} \frac{(y - r_0)(y - r_1)F(r_0) + (r_1 - r_0)(y - r_0)F(y) - (y - r_0)^2F(r_1)}{(r_1 - r_0)(y - r_1)} \tag{4}\\ =\ & F(r_0) - F(r_1) - F'(r_1)(r_0 - r_1). \tag{5} \end{align}Spiegazioni:
(1): Affittando$f(b) = (1 - \lambda)F(b) - F(\lambda a + (1 - \lambda)b)$, noi abbiamo$f'(b) = (1 - \lambda)F'(b) - (1 - \lambda) F'(\lambda a + (1 - \lambda)b) \ge 0$(Nota:$F'(x)$è non decrescente) e quindi$f(b)$non è decrescente$[b, \infty)$.
(2): Affittando$g(a) = \lambda F(a) + (1 - \lambda)F(\frac{r_1 - \lambda a}{1 - \lambda})$, noi abbiamo$g'(a) = \lambda F'(a) - \lambda F'(\frac{r_1 - \lambda a}{1 - \lambda}) \le 0$(Nota:$F'(x)$è non decrescente) e quindi$g(a)$non è crescente$[0, r_0)$.
(3): Usa la sostituzione$y = \frac{r_1 - \lambda r_0}{1 - \lambda}$.
(4): Usa il seguente fatto (la dimostrazione è data alla fine):
Fatto 1 : Let$$g(y) \triangleq \frac{(y - r_0)(y - r_1)F(r_0) + (r_1 - r_0)(y - r_0)F(y) - (y - r_0)^2F(r_1)}{(r_1 - r_0)(y - r_1)}.$$Quindi$g'(y) \ge 0$Su$(r_1, \infty)$.
(5) Applicare la regola de L'Hopital.
Abbiamo chiuso.
$\phantom{2}$
Dimostrazione del fatto 1 : Abbiamo, per$y > r_1$,\begin{align} (r_1 - r_0)(y - r_1)^2g'(y) &= (y - r_1)^2F(r_0) - (r_1 - r_0)^2F(y)\\ &\quad + (r_1 - r_0)(y - r_0)(y - r_1)F'(y)\\ &\quad + (-2(y - r_0)(y - r_1) + (y - r_0)^2)F(r_1) \\ &= (y - r_1)^2F(r_0) - (r_1 - r_0)^2( F(y) - F(r_1) ) \\ &\quad - (r_1 - r_0)^2F(r_1) + (r_1 - r_0)(y - r_0)(y - r_1)F'(y)\\ &\quad + (-2(y - r_0)(y - r_1) + (y - r_0)^2)F(r_1)\\ &\ge (y - r_1)^2F(r_0) - (r_1 - r_0)^2(y - r_1)F'(y) \\ &\quad - (r_1 - r_0)^2F(r_1) + (r_1 - r_0)(y - r_0)(y - r_1)F'(y)\\ &\quad + (-2(y - r_0)(y - r_1) + (y - r_0)^2)F(r_1)\\ &= (y - r_1)^2F(r_0) - (y - r_1)^2F(r_1) + (r_1 - r_0)(y - r_1)^2F'(y) \\ &\ge (y - r_1)^2F(r_0) - (y - r_1)^2F(r_1) + (r_1 - r_0)(y - r_1)^2F'(r_1)\\ &= (y - r_1)^2[F(r_0) - F(r_1) - F'(r_1)(r_0 - r_1)]\\ &\ge 0 \end{align}dove abbiamo usato$(y - r_1)F'(y) \ge F(y) - F(r_1)$e$F(r_0) - F(r_1) - F'(r_1)(r_0 - r_1) \ge 0$e$F'(y) \ge F'(r_1)$(Nota:$F(x) \ge F(y) + F'(y)(x-y)$per funzioni convesse;$F'(x)$non è decrescente). Abbiamo chiuso.