Dérivée de la fonction trace

Nov 22 2020

$\DeclareMathOperator{\tr}{tr}$ Laisser $A,B$ être des matrices auto-adjointes et $f$ être une vraie fonction différentiable sur $\mathbb{R}$ avec dérivé $f'$. Alors pourquoi est-il vrai que $$ \left.\ \frac{d}{dt}\right|_0 \tr f(A+tB)=\tr (f'(A)B) $$

Ceci est utilisé dans le https://en.wikipedia.org/wiki/Trace_inequality#Klein%27s_inequality. Cependant, je ne sais pas pourquoi exactement cela est vrai en général. Il est assez clair pourquoi c'est vrai pour les polnômes puisque nous pouvons utiliser la relation de commutation de la fonction trace, mais c'est plus difficile à justifier en général. J'ai également vérifié la référence liée (E. Carlen, Trace Inequality and Quantum Entropy: An Introductory Course, Contemp. Math. 529 (2010) 73-140) sans succès, car l'auteur n'a pas donné beaucoup d'explications.

EDIT : Après réflexion, permettez-moi de fournir une preuve incomplète de ce que j'ai obtenu jusqu'à présent. J'espère que quelqu'un avec de meilleures connaissances pourra terminer la preuve.

Pour plus de simplicité, laissez $\lambda_i(A)$ dénotent les valeurs propres de $A$ par ordre décroissant, c'est-à-dire $\lambda_1(A) \ge \cdots \ge \lambda_d (A)$. ensuite $$ \tr \left( \frac{f(A+tB)-f(A)}{t}\right) = \sum_i \frac{1}{t}[f(\lambda_i(A+tB)-f(\lambda_i(A))] $$ Notez que par l'inégalité de Weyl (stabilité des valeurs propres), on voit que $|\lambda_i(A+tB)-\lambda_i(A)|\le t||B||$. Par conséquent, en utilisant un$\epsilon,\delta$ argument, nous pouvons remplacer ce qui précède par $$ \sum_i \frac{1}{t}(\lambda_i(A+tB)-\lambda_i(A)) f'(\lambda_i(A)) $$ Maintenant, supposons d'abord que $A$ a un spectre simple, alors $A+tB$ est aussi simple pour suffisamment petit $t$. Puis par la formule de variation d'Hadarmard, on voit que $$ \frac{1}{t}(\lambda_i(A+tB)-\lambda_i(A)) \to \langle i|B| i\rangle $$$|i\rangle$ est le vecteur propre correspondant (unique jusqu'à la phase puisque nous supposons que $A$ est simple) à $\lambda_i(A)$. En rebranchant tout cela, nous voyons que la formule tient au moins quand$A$ est simple.

MODIFIER 2 . Je pense que j'ai maintenant un moyen de traiter les valeurs propres dégénérées. Je fournirai un croquis et remplirai les détails plus tard (si quelqu'un d'autre ne signale pas une erreur).

Laisser $\lambda_1 (A)=\cdots =\lambda_r(A)$être les valeurs propres dégénérées. Puis pour suffisamment petit$t$, les valeurs propres $\lambda_i (A+tB),i=1,...,r$ne touchera pas les autres valeurs propres (encore une fois l'inégalité de Weyl). Utilisons le projecteur Riesz $$ P_A =\frac{1}{2\pi i} \oint_\Gamma \frac{dz}{A-z} $$$\Gamma$ est un contour "lisse" autour du $\lambda_1 (A)=\cdots =\lambda_r(A)$et son intérieur ne contient aucune autre valeur propre. Par l'inégalité de Weyl, nous pouvons supposer que$\lambda_i(A+tB),i=1,...,r$ sont toujours à l'intérieur de $\Gamma$ pour suffisamment petit $t$. Remarquerez que $$ \frac{d}{dt} \Big|_0 \tr {((A+tB)P_{A+tB})} = \tr(BP_A) $$ où je me suis inspiré du commentaire de @ Ruy et j'ai utilisé le fait que \ begin {align} \ frac {d} {dt} \ Big | _0 \ tr {(A (P_ {A + tB} -P_A))} & = \ tr A \ oint_ \ Gamma \ frac {dz} {(zA) ^ 2} B \\ & = \ sum_ {i = 1} ^ r \ oint_ \ Gamma \ lambda_i (A) \ frac {1} {(z - \ lambda_i (A)) ^ 2} dz \ langle i | B | i \ rangle \\ & = 0 \ end {align} Par conséquent, si nous combinons cela avec la partie précédente, nous voyons que l'égalité est vraie.

Ma preuve est un peu compliquée, alors j'espère toujours voir une approche plus simple

Réponses

1 Ruy Nov 25 2020 at 01:26

Lemme 1 . Laisser$f$ et $g$ être de vraies fonctions valorisées de classe $C^1$ défini sur un quartier $(a-\delta , a+\delta )$ du nombre réel $a$, tel que $$ f(a)=g(a),\quad \text{and}\quad f'(a)=g'(a). $$ Laissez également $\lambda :U\to (a-\delta , a+\delta )$ être n'importe quelle fonction définie sur un voisinage $U$ de zéro tel que $$ |\lambda (t)-a|\leq c|t|, \quad \forall t\in U, $$$c$est une constante positive donnée. ensuite $$ \lim_{t\to 0} \frac{f(\lambda _t) - g(\lambda _t)}t = 0. $$

Preuve . Par le théorème de la valeur moyenne, pour chaque$t$ dans $U$, on peut écrire $$ f(\lambda _t) = f(a) + f'(\xi _t)(\lambda _t-a), $$ et $$ g(\lambda _t) = g(a) + g'(\eta _t)(\lambda _t-a), $$$\xi _t$ et $\eta _t$ se situer entre $\lambda _t$ et $a$. Par conséquent $$ |f(\lambda _t) - g(\lambda _t)| = $$ $$ = |f'(\xi _t)-g'(\eta _t)||\lambda _t-a| \leq c|f'(\xi _t)-g'(\eta _t)| |t|. $$ Depuis les deux $\xi _t$ et $\eta _t$ convergent vers $a$, comme $t\to 0$, on a $$ \lim_{t\to 0} \left|\frac{f(\lambda _t) - g(\lambda _t)}t\right| \leq $$ $$ \leq \lim_{t\to 0} c|f'(\xi _t)-g'(\eta _t)| = c|f'(a)-g'(a)| = 0. $$ QED

Lemme 2 . Laisser$A$ et $B$ être $n\times n$ matrices complexes auto-adjointes et soit $f$ et $g$ être de vraies fonctions valorisées de classe $C^1$ défini sur un voisinage de $\sigma (A)$, tel que $$ f(a)=g(a),\quad \text{and}\quad f'(a)=g'(a), \quad \forall a\in \sigma (A). $$ ensuite $$ \lim_{t\to 0} \frac{f(A+tB)-g(A+tB)}t = 0. $$

Preuve . Laisser$a_1\leq a_2\leq \cdots \leq a_n$ être les valeurs propres de $A$, et laissez $\lambda _1(t)\leq \lambda _2(t)\leq \cdots \leq \lambda _n(t)$ être les valeurs propres de $A+tB$. Par l'inégalité de Weyl (stabilité des valeurs propres), on a que $$ |\lambda _i(t)-a_i|\leq |t| \|B\|. $$ Donc $$ \lim_{t\to 0}\left\|\frac{f(A+tB)-g(A+tB)}t\right\| = $$ $$ = \lim_{t\to 0}\max_{1\leq i\leq n} \left|\frac{f(\lambda _i(t))-g(\lambda _i(t))}t\right| = 0, $$ par Lemme (1). QED

Théorème 3 . Laisser$A$ et $B$ être $n\times n$ matrices complexes auto-adjointes et soit $f$ être une vraie fonction valorisée de classe $C^1$ défini sur un voisinage de $\sigma (A)$. ensuite $$ \frac d{dt}\Big|_{t=0} \text{tr}(f(A+tB)) = \hbox{tr}(f'(A)B). $$

Preuve . Supposons d'abord que$f$ admet une extension holomorphe à un voisinage complexe du spectre de $A$. ensuite $$ \frac d{dt}\Big|_{t=0} f(A+tB) = \frac d{dt}\Big|_{t=0} \frac{1}{2\pi}\oint f(z)(z-A-tB)^{-1}\,d z = $$ $$ = \frac{1}{2\pi}\oint f(z)(z-A)^{-1} B(z-A)^{-1}\,d z $$ ... qui a la même trace que ... $$ \frac{1}{2\pi}\oint f(z)(z-A)^{-2} B\,d z = $$ $$ = \left(\frac{1}{2\pi}\oint f(z)(z-A)^{-2} \,d z\right) B = f'(A)B. $$

Revenons au cas général, laissez $p$ être un vrai polynôme tel que $$ p(a)=f(a),\quad \text{and}\quad p'(a)=f'(a), \quad \forall a\in \sigma (A). $$ On a alors ça $$ \left\|\frac{f(A+tB) - f(A)}t -\frac{p(A+tB) - p(A)}t \right\| = $$ $$ = \left\|\frac{f(A+tB) - p(A+tB)}t \right\|, $$ qui converge vers zéro par le lemme (2). Prenant la limite comme$t\to 0$, il s'ensuit alors que $$ \frac d{dt}\Big|_{t=0} \text{tr}(f(A+tB)) = \frac d{dt}\Big|_{t=0} \text{tr}(p(A+tB)) = $$ $$ = \hbox{tr}(p'(A)B) = \hbox{tr}(f'(A)B). $$ QED