Ableitung der Trace-Funktion
$\DeclareMathOperator{\tr}{tr}$ Lassen $A,B$ selbstadjunkte Matrizen sein und $f$ eine wirklich differenzierbare Funktion sein $\mathbb{R}$ mit Derivat $f'$. Warum ist es dann so? $$ \left.\ \frac{d}{dt}\right|_0 \tr f(A+tB)=\tr (f'(A)B) $$
Dies wird in der verwendet https://en.wikipedia.org/wiki/Trace_inequality#Klein%27s_inequality. Ich bin mir jedoch nicht sicher, warum genau dies im Allgemeinen zutrifft. Es ist ziemlich klar, warum dies für Polnome gilt, da wir die Kommutierungsrelation der Trace-Funktion verwenden können, aber es ist im Allgemeinen schwieriger zu rechtfertigen. Ich habe auch die verknüpfte Referenz (E. Carlen, Spurenungleichungen und Quantenentropie: Ein Einführungskurs, Contemp. Math. 529 (2010) 73–140) ohne Glück überprüft, da der Autor nicht viel Erklärung gab.
EDIT : Lassen Sie mich nach einigen weiteren Überlegungen einen unvollständigen Beweis dafür liefern, was ich bisher bekommen habe. Hoffentlich kann jemand mit besseren Kenntnissen den Beweis beenden.
Der Einfachheit halber sei $\lambda_i(A)$ bezeichnen die Eigenwerte von $A$ in absteigender Reihenfolge, dh $\lambda_1(A) \ge \cdots \ge \lambda_d (A)$. Dann $$ \tr \left( \frac{f(A+tB)-f(A)}{t}\right) = \sum_i \frac{1}{t}[f(\lambda_i(A+tB)-f(\lambda_i(A))] $$ Beachten Sie, dass wir dies durch Weyls Ungleichung (Stabilität der Eigenwerte) sehen $|\lambda_i(A+tB)-\lambda_i(A)|\le t||B||$. Daher mit einem$\epsilon,\delta$ Argument, können wir das oben genannte durch ersetzen $$ \sum_i \frac{1}{t}(\lambda_i(A+tB)-\lambda_i(A)) f'(\lambda_i(A)) $$ Nehmen wir nun zunächst an, dass $A$ hat also ein einfaches Spektrum $A+tB$ ist auch einfach für ausreichend klein $t$. Dann sehen wir das an Hadarmards Variationsformel $$ \frac{1}{t}(\lambda_i(A+tB)-\lambda_i(A)) \to \langle i|B| i\rangle $$ wo $|i\rangle$ ist der entsprechende Eigenvektor (bis zur Phase eindeutig, da wir davon ausgehen, dass $A$ ist einfach) zu $\lambda_i(A)$. Wenn wir das alles wieder einstecken, sehen wir, dass die Formel zumindest gilt, wenn$A$ Ist einfach.
BEARBEITEN 2 . Ich glaube, ich habe jetzt eine Möglichkeit, mit entarteten Eigenwerten umzugehen. Ich werde eine Skizze bereitstellen und die Details später ausfüllen (wenn jemand anderes nicht auf einen Fehler hinweist).
Lassen $\lambda_1 (A)=\cdots =\lambda_r(A)$seien die entarteten Eigenwerte. Dann für ausreichend klein$t$, die Eigenwerte $\lambda_i (A+tB),i=1,...,r$wird die anderen Eigenwerte nicht berühren (wieder Weyls Ungleichung). Verwenden wir den Riesz-Projektor $$ P_A =\frac{1}{2\pi i} \oint_\Gamma \frac{dz}{A-z} $$ wo $\Gamma$ ist eine "glatte" Kontur um die $\lambda_1 (A)=\cdots =\lambda_r(A)$und sein Inneres enthält keine anderen Eigenwerte. Durch Weyls Ungleichung können wir das annehmen$\lambda_i(A+tB),i=1,...,r$ sind noch im Inneren von $\Gamma$ für ausreichend klein $t$. Beachte das $$ \frac{d}{dt} \Big|_0 \tr {((A+tB)P_{A+tB})} = \tr(BP_A) $$ Hier habe ich mich von @ Ruys Kommentar inspirieren lassen und die Tatsache verwendet, dass \ begin {align} \ frac {d} {dt} \ Big | _0 \ tr {(A (P_ {A + tB} -P_A))} & = \ tr A \ oint_ \ Gamma \ frac {dz} {(zA) ^ 2} B \\ & = \ sum_ {i = 1} ^ r \ oint_ \ Gamma \ lambda_i (A) \ frac {1} {(z - \ lambda_i (A)) ^ 2} dz \ langle i | B | i \ rangle \\ & = 0 \ end {align} Wenn wir dies also mit dem vorherigen Teil kombinieren, sehen wir, dass die Gleichheit gilt.
Mein Beweis ist ein wenig verworren, daher würde ich immer noch auf einen einfacheren Ansatz hoffen
Antworten
Lemma 1 . Lassen$f$ und $g$ seien Sie wirklich geschätzte Funktionen der Klasse $C^1$ auf eine Nachbarschaft definiert $(a-\delta , a+\delta )$ der reellen Zahl $a$, so dass $$ f(a)=g(a),\quad \text{and}\quad f'(a)=g'(a). $$ Auch lassen $\lambda :U\to (a-\delta , a+\delta )$ eine beliebige Funktion sein, die in einer Nachbarschaft definiert ist $U$ von Null, so dass $$ |\lambda (t)-a|\leq c|t|, \quad \forall t\in U, $$ wo $c$ist eine gegebene positive Konstante. Dann $$ \lim_{t\to 0} \frac{f(\lambda _t) - g(\lambda _t)}t = 0. $$
Beweis . Nach dem Mittelwertsatz für jeden$t$ im $U$können wir schreiben $$ f(\lambda _t) = f(a) + f'(\xi _t)(\lambda _t-a), $$ und $$ g(\lambda _t) = g(a) + g'(\eta _t)(\lambda _t-a), $$ wo $\xi _t$ und $\eta _t$ dazwischen liegen $\lambda _t$ und $a$. Deshalb $$ |f(\lambda _t) - g(\lambda _t)| = $$ $$ = |f'(\xi _t)-g'(\eta _t)||\lambda _t-a| \leq c|f'(\xi _t)-g'(\eta _t)| |t|. $$ Da beides $\xi _t$ und $\eta _t$ konvergieren zu $a$, wie $t\to 0$, wir bekommen $$ \lim_{t\to 0} \left|\frac{f(\lambda _t) - g(\lambda _t)}t\right| \leq $$ $$ \leq \lim_{t\to 0} c|f'(\xi _t)-g'(\eta _t)| = c|f'(a)-g'(a)| = 0. $$ QED
Lemma 2 . Lassen$A$ und $B$ Sein $n\times n$ selbstadjunkte komplexe Matrizen und lassen $f$ und $g$ seien Sie wirklich geschätzte Funktionen der Klasse $C^1$ definiert auf einer Nachbarschaft von $\sigma (A)$, so dass $$ f(a)=g(a),\quad \text{and}\quad f'(a)=g'(a), \quad \forall a\in \sigma (A). $$ Dann $$ \lim_{t\to 0} \frac{f(A+tB)-g(A+tB)}t = 0. $$
Beweis . Lassen$a_1\leq a_2\leq \cdots \leq a_n$ seien die Eigenwerte von $A$, und lass $\lambda _1(t)\leq \lambda _2(t)\leq \cdots \leq \lambda _n(t)$ seien die Eigenwerte von $A+tB$. Durch Weyls Ungleichung (Stabilität der Eigenwerte) haben wir das $$ |\lambda _i(t)-a_i|\leq |t| \|B\|. $$ Damit $$ \lim_{t\to 0}\left\|\frac{f(A+tB)-g(A+tB)}t\right\| = $$ $$ = \lim_{t\to 0}\max_{1\leq i\leq n} \left|\frac{f(\lambda _i(t))-g(\lambda _i(t))}t\right| = 0, $$ von Lemma (1). QED
Satz 3 . Lassen$A$ und $B$ Sein $n\times n$ selbstadjunkte komplexe Matrizen und lassen $f$ eine wirklich geschätzte Funktion der Klasse sein $C^1$ definiert auf einer Nachbarschaft von $\sigma (A)$. Dann $$ \frac d{dt}\Big|_{t=0} \text{tr}(f(A+tB)) = \hbox{tr}(f'(A)B). $$
Beweis . Nehmen Sie zuerst das an$f$ lässt eine holomorphe Erweiterung einer komplexen Nachbarschaft des Spektrums von zu $A$. Dann $$ \frac d{dt}\Big|_{t=0} f(A+tB) = \frac d{dt}\Big|_{t=0} \frac{1}{2\pi}\oint f(z)(z-A-tB)^{-1}\,d z = $$ $$ = \frac{1}{2\pi}\oint f(z)(z-A)^{-1} B(z-A)^{-1}\,d z $$ ... was die gleiche Spur hat wie ... $$ \frac{1}{2\pi}\oint f(z)(z-A)^{-2} B\,d z = $$ $$ = \left(\frac{1}{2\pi}\oint f(z)(z-A)^{-2} \,d z\right) B = f'(A)B. $$
Zurück zum allgemeinen Fall, lassen Sie $p$ sei ein echtes Polynom, so dass $$ p(a)=f(a),\quad \text{and}\quad p'(a)=f'(a), \quad \forall a\in \sigma (A). $$ Das haben wir dann $$ \left\|\frac{f(A+tB) - f(A)}t -\frac{p(A+tB) - p(A)}t \right\| = $$ $$ = \left\|\frac{f(A+tB) - p(A+tB)}t \right\|, $$ die durch Lemma (2) gegen Null konvergiert. Das Limit nehmen als$t\to 0$Daraus folgt dann $$ \frac d{dt}\Big|_{t=0} \text{tr}(f(A+tB)) = \frac d{dt}\Big|_{t=0} \text{tr}(p(A+tB)) = $$ $$ = \hbox{tr}(p'(A)B) = \hbox{tr}(f'(A)B). $$ QED