¿Se mantiene esta fuerte estimación de convexidad?
Dejar$F:[0,\infty) \to [0,\infty)$ser un$C^2$función estrictamente convexa, y sea$r_0<r_1$ser constantes fijas positivas. Dejar$$a<r_0<r_1<c<b, \tag{1}$$y deja$\lambda \in [0,1]$satisfacer$ \lambda a +(1-\lambda)b=c. $
Establecer$D(a,b,c)=\lambda F(a)+(1-\lambda)F(b)-F(c) $.
Pregunta: ¿Existe una constante $m>0$(que puede depender de$f,r_0,r_1$pero no en$a,b,c$) tal que$ D(a,b,c) \ge m\lambda(1-\lambda)(r_1-r_0)^2 $para cualquier elección de$a,b,c$condición satisfactoria$(1)$?
Aquí está el punto clave:
Si$f'' \ge m$, después$f$es fuertemente convexa con parámetro$m$, asi que$$ D(a,b,c) \ge \frac{1}{2}m\lambda(1-\lambda)(b-a)^2 \ge \frac{1}{2}m\lambda(1-\lambda)(r_1-r_0)^2 \tag{2} $$según sea necesario. Sin embargo, en nuestro caso,$c$y$b$puede ser arbitrariamente grande, y$F$puede volverse "menos convexo" (más cercano a ser afín) cuando$x \to \infty$. En otras palabras, si$\lim_{x \to \infty}F''(x)=0$, entonces el límite inferior$(2)$se convierte en el límite trivial$$ D(a,b,c) \ge \frac{1}{2} (\inf F'')\lambda(1-\lambda)(b-a)^2=0. $$
Entonces, la "aplicación ingenua" de convexidad fuerte no se aplica aquí tal como está. Sin embargo, mi intuición es que incluso si$\lim_{x \to \infty}F''(x)=0$, de alguna manera deberíamos encontrar "el fuerte contenido de convexidad" que se encuentra entre el fijo$r_0$y$r_1$por lo que la "brecha de convexidad"$D(a,b,c)$debe estar acotado desde cero.
pensé en expresar$D(a,b,c)$como alguna integral de$F''$sobre un dominio que contiene$[r_0,r_1]$pero hasta ahora sin éxito.
Respuestas
Si es suficiente para exigir que$F$es estrictamente convexa y diferenciable en un intervalo$I \subset \Bbb R$. (Incluso el requisito de diferenciabilidad puede eliminarse, consulte los comentarios al final de la respuesta).
Para$a, b \in I$con$a < b$y$c = \lambda a + (1 - \lambda) b$con$0 \le \lambda \le 1$podemos escribir$$ D(a, b, c) = \lambda F(a)+(1-\lambda)F(b)-F(c) \\ = \lambda \bigl \{ F(a) - F(c) - (a-c)F'(c) \bigr\} + (1- \lambda) \bigl \{F(b) - F(c) - (b-c)F'(c)\bigr\} \, . $$
Esto sugiere introducir$$ H(u, v) = F(u) - F(v) - (u-v) F'(v) $$por$u, v \in I$.$H$tiene las siguientes propiedades:
- $H(u, v) > 0$si$u \ne v$.
- $H(u_1, v) > H(u_2, v)$si$u_1 < u_2 \le v$, es decir$H(u,v)$está disminuyendo en$u$mientras$u \le v$.
- $H(u, v_1) < H(u, v_2)$si$u \le v_1 < v_2$, es decir$H(u, v)$está aumentando en$v$mientras$u \le v$.
La propiedad (1) es una consecuencia directa de la convexidad estricta:$F(u)$es mayor que el valor correspondiente de la recta tangente en$x=v$.
Para la propiedad (2) asumimos$u_1 < u_2 \le v$y calcular$$ H(u_1, v) - H(u_2, v) = F(u_1) - F(u_2) - (u_1 - u_2) F'(v) \\ \ge F(u_1) - F(u_2) - (u_1 - u_2) F'(u_2) = H(u_1, u_2) > 0 \, . $$Aquí usamos eso$F'$esta incrementando.
Para la propiedad (3) asumimos$u \le v_1 < v_2$y calcular$$ H(u,v_1) - H(u, v_2) = -F(v_1) - (u-v_1)F'(v_1) + F(v_2) + (u-v_2) F'(v_2) \\ \le -F(v_1) - (u-v_1)F'(v_2) + F(v_2) + (u-v_2) F'(v_2) \\ = -H(v_1, v_2) < 0 \, . $$
Con estas herramientas, estimar$D(a, b, c)$desde abajo se vuelve fácil. Si$a \le r_0 < r_1 \le c < b$después$$ D(a, b, c) = \lambda H(a, c) + (1-\lambda)H(b,c) \\ \ge \lambda H(a, c) \ge \lambda H(r_0, r_1) \ge \lambda(1- \lambda) H(r_0, r_1) \\ = m \lambda(1-\lambda) (r_1-r_0)^2 $$con$m$definido como$$ m = \frac{H(r_0, r_1)}{(r_1-r_0)^2} = \frac{F(r_0) - F(r_1) - (r_0 - r_1) F'(r_1)}{(r_1-r_0)^2} > 0 \, . $$
Observaciones:
- La suposición de que$F$solo se define en$[0, \infty)$con valores en$[0, \infty)$no se usó en la prueba.
- El requisito de diferenciabilidad también puede eliminarse. Una función convexa tiene derivadas unilaterales en cada punto interior del intervalo. La prueba anterior todavía funciona si reemplazamos$F'$por la derivada derecha (o izquierda).
Solución alternativa
Probemos que la mejor constante$m$es$$m = \frac{F(r_0) - F(r_1) - F'(r_1)(r_0 - r_1)}{(r_1 - r_0)^2} > 0.$$(Nota: en realidad, es igual a$\frac{1}{(r_1 - r_0)^2}\int_{r_0}^{r_1} (x- r_0) F''(x) \mathrm{d} x$lo cual es positivo ya que$F(x)$es estrictamente convexa.)
Primero, reformulamos el problema de la siguiente manera:
Dejar$F : [0, \infty) \to [0, \infty)$ser un$\mathrm{C}^2$función estrictamente convexa. Dejar$0 < r_0 < r_1$ser constantes fijas. ¿Existe una constante?$m > 0$tal que$$\lambda F(a) + (1 - \lambda)F(b) - F(\lambda a + (1 - \lambda)b) \ge m \lambda (1 - \lambda) (r_1 - r_0)^2$$para cualquier número real$a, b, \lambda$satisfactorio$$0 < \lambda < 1, \quad 0 \le a < r_0 < r_1 < \lambda a + (1 - \lambda) b\ ?$$
En segundo lugar, tenemos\begin{align} &\inf_{0 < \lambda < 1,\ 0 \le a < r_0 < r_1 < \lambda a + (1 - \lambda) b} \frac{\lambda F(a) + (1 - \lambda)F(b) - F(\lambda a + (1 - \lambda)b)}{\lambda (1 - \lambda)}\\ =\ & \inf_{0 < \lambda < 1, \ 0 \le a < r_0} \left(\inf_{b > \frac{r_1 - \lambda a}{1 - \lambda}} \frac{\lambda F(a) + (1 - \lambda)F(b) - F(\lambda a + (1 - \lambda)b)}{\lambda (1 - \lambda)}\right)\\ =\ & \inf_{0 < \lambda < 1, \ 0 \le a < r_0} \frac{\lambda F(a) + (1 - \lambda)F(\frac{r_1 - \lambda a}{1 - \lambda}) - F(r_1)}{\lambda (1 - \lambda)} \tag{1}\\ =\ & \inf_{0 < \lambda < 1} \left(\inf_{0 \le a < r_0} \frac{\lambda F(a) + (1 - \lambda)F(\frac{r_1 - \lambda a}{1 - \lambda}) - F(r_1)}{\lambda (1 - \lambda)} \right)\\ =\ & \inf_{0 < \lambda < 1} \frac{\lambda F(r_0) + (1 - \lambda)F(\frac{r_1 - \lambda r_0}{1 - \lambda}) - F(r_1)}{\lambda (1 - \lambda)} \tag{2}\\ =\ & \inf_{y > r_1} \frac{(y - r_0)(y - r_1)F(r_0) + (r_1 - r_0)(y - r_0)F(y) - (y - r_0)^2F(r_1)}{(r_1 - r_0)(y - r_1)} \tag{3}\\ =\ & \lim_{y \to r_1} \frac{(y - r_0)(y - r_1)F(r_0) + (r_1 - r_0)(y - r_0)F(y) - (y - r_0)^2F(r_1)}{(r_1 - r_0)(y - r_1)} \tag{4}\\ =\ & F(r_0) - F(r_1) - F'(r_1)(r_0 - r_1). \tag{5} \end{align}Explicaciones:
(1): Al dejar$f(b) = (1 - \lambda)F(b) - F(\lambda a + (1 - \lambda)b)$, tenemos$f'(b) = (1 - \lambda)F'(b) - (1 - \lambda) F'(\lambda a + (1 - \lambda)b) \ge 0$(Nota:$F'(x)$no es decreciente) y por lo tanto$f(b)$no es decreciente en$[b, \infty)$.
(2): Al dejar$g(a) = \lambda F(a) + (1 - \lambda)F(\frac{r_1 - \lambda a}{1 - \lambda})$, tenemos$g'(a) = \lambda F'(a) - \lambda F'(\frac{r_1 - \lambda a}{1 - \lambda}) \le 0$(Nota:$F'(x)$no es decreciente) y por lo tanto$g(a)$no es creciente en$[0, r_0)$.
(3): Usa la sustitución$y = \frac{r_1 - \lambda r_0}{1 - \lambda}$.
(4): Use el siguiente hecho (la prueba se da al final):
Hecho 1 : Sea$$g(y) \triangleq \frac{(y - r_0)(y - r_1)F(r_0) + (r_1 - r_0)(y - r_0)F(y) - (y - r_0)^2F(r_1)}{(r_1 - r_0)(y - r_1)}.$$Después$g'(y) \ge 0$en$(r_1, \infty)$.
(5) Aplicar la regla de L'Hopital.
Hemos terminado.
$\phantom{2}$
Prueba del Hecho 1 : Tenemos, por$y > r_1$,\begin{align} (r_1 - r_0)(y - r_1)^2g'(y) &= (y - r_1)^2F(r_0) - (r_1 - r_0)^2F(y)\\ &\quad + (r_1 - r_0)(y - r_0)(y - r_1)F'(y)\\ &\quad + (-2(y - r_0)(y - r_1) + (y - r_0)^2)F(r_1) \\ &= (y - r_1)^2F(r_0) - (r_1 - r_0)^2( F(y) - F(r_1) ) \\ &\quad - (r_1 - r_0)^2F(r_1) + (r_1 - r_0)(y - r_0)(y - r_1)F'(y)\\ &\quad + (-2(y - r_0)(y - r_1) + (y - r_0)^2)F(r_1)\\ &\ge (y - r_1)^2F(r_0) - (r_1 - r_0)^2(y - r_1)F'(y) \\ &\quad - (r_1 - r_0)^2F(r_1) + (r_1 - r_0)(y - r_0)(y - r_1)F'(y)\\ &\quad + (-2(y - r_0)(y - r_1) + (y - r_0)^2)F(r_1)\\ &= (y - r_1)^2F(r_0) - (y - r_1)^2F(r_1) + (r_1 - r_0)(y - r_1)^2F'(y) \\ &\ge (y - r_1)^2F(r_0) - (y - r_1)^2F(r_1) + (r_1 - r_0)(y - r_1)^2F'(r_1)\\ &= (y - r_1)^2[F(r_0) - F(r_1) - F'(r_1)(r_0 - r_1)]\\ &\ge 0 \end{align}donde hemos usado$(y - r_1)F'(y) \ge F(y) - F(r_1)$y$F(r_0) - F(r_1) - F'(r_1)(r_0 - r_1) \ge 0$y$F'(y) \ge F'(r_1)$(Nota:$F(x) \ge F(y) + F'(y)(x-y)$para funciones convexas;$F'(x)$no es decreciente). Hemos terminado.