Concentration de la norme pour les sous-gaussiens
Je lis le théorème 3.1.1 dans le livre HDP de Vershynin. Le théorème déclare que
$ \text{Let } X=\left(X_1,\ldots,X_n \right) \text{be a random vector with independent, sub-gaussian coordinates } X_i \text{ that satisfy } \mathbb{E}X_i^2=1. \text{Then}$ $$ \| \| X\|_2-\sqrt{n}\|\|_{\psi_2} \leq CK^2$$ $ \text{where } K=\max_i{\|X_i\|_{\psi_2}} \text{ and } C \text{ is an absolute constant.}$
le $\psi_2$ la norme est la norme Orlicz avec la fonction Orlicz $\psi(x)=e^{x^2}-1. $
J'ai trouvé une place que je ne comprends pas dans la preuve.
La preuve entière a seulement montré que $ \| X \|_2 -\sqrt{n} $est une variable aléatoire sous-gaussienne. Et dans la dernière phrase, l'auteur vient de dire que cela équivaut à la conclusion du théorème.
Je voudrais poser des questions sur l'équivalence dans la dernière phrase.
J'ai essayé de regarder la propriété de centrage du sous-gaussien, mais il semble que $\sqrt n \neq \mathbb{E}\|X\|_2 $. Tout indice ou idée est apprécié.
Réponses
J'ai suivi le cours HDP sur lequel ce livre était basé et je pense que ces résultats m'ont également pris du temps! Il faut faire un peu de raisonnement «circulaire», ce qui n'est pas (pour moi du moins) immédiatement évident. En bref, il y a deux choses en jeu:
- Premièrement, à partir de la preuve, nous avons l'inégalité de concentration $$\mathbb{P}\left\{ \big| ||X||_2 - \sqrt{n} \big|\geq t\right\} \leq 2 \exp\left(-\frac{ct^2}{K^4}\right) \\ = 2 \exp\left(-\frac{ct^2}{(K^2)^2}\right)$$ qui vaut pour tous $t \geq 0$. Comme vous le mentionnez, cela implique que le terme de valeur absolue est sous-gaussien avec le paramètre$K^2$. D'après la proposition 2.5.2, nous savons qu'il existe un équivalent (jusqu'à un facteur constant)$K_1=c_1K^2$ tel que $\mathbb{E}\exp\left(X^2/K_1^2\right) \leq 2$.
- D'après la définition de la norme Orlicz, $$\big|\big| ||X||_2 - \sqrt{n}\big|\big|_{\psi_2} $$qui spécifie la norme comme le positif infimum ou minimal$t$ avec $\mathbb{E}\exp\left(X^2/t^2\right) \leq 2$. De là, nous concluons que la norme ne doit pas être supérieure à$K_1$. Nous racontions$K_1$ à $K^2$ ci-dessus et le résultat suit.