Pochodna funkcji śledzenia
$\DeclareMathOperator{\tr}{tr}$ Pozwolić $A,B$ być macierzami samosprzężonymi i $f$ być prawdziwą różniczkowalną funkcją $\mathbb{R}$ z pochodną $f'$. Więc dlaczego to prawda $$ \left.\ \frac{d}{dt}\right|_0 \tr f(A+tB)=\tr (f'(A)B) $$
Jest to używane w https://en.wikipedia.org/wiki/Trace_inequality#Klein%27s_inequality. Jednak nie jestem pewien, dlaczego dokładnie tak jest w ogóle. Jest całkiem jasne, dlaczego jest to prawdziwe dla wielomianów, skoro możemy użyć relacji komutacji funkcji śledzenia, ale ogólnie trudniej jest to uzasadnić. Sprawdziłem również odsyłacz (E. Carlen, Trace Inequalities and Quantum Entropy: An Introduction, Contemp. Math. 529 (2010) 73–140) bez powodzenia, ponieważ autor nie podał zbyt wielu wyjaśnień.
EDYCJA : Po dłuższym przemyśleniu pozwólcie, że przedstawię niepełny dowód tego, co osiągnąłem do tej pory. Miejmy nadzieję, że ktoś z większą wiedzą dokończy dowód.
Dla uproszczenia niech $\lambda_i(A)$ oznaczają wartości własne $A$ w kolejności malejącej, tj. $\lambda_1(A) \ge \cdots \ge \lambda_d (A)$. Następnie $$ \tr \left( \frac{f(A+tB)-f(A)}{t}\right) = \sum_i \frac{1}{t}[f(\lambda_i(A+tB)-f(\lambda_i(A))] $$ Zauważ, że dzięki nierówności Weyla (stabilności wartości własnych) widzimy to $|\lambda_i(A+tB)-\lambda_i(A)|\le t||B||$. Dlatego używając$\epsilon,\delta$ argument, możemy zamienić powyższe na $$ \sum_i \frac{1}{t}(\lambda_i(A+tB)-\lambda_i(A)) f'(\lambda_i(A)) $$ Teraz najpierw załóż to $A$ ma więc proste widmo $A+tB$ jest również prosta dla wystarczająco małych $t$. Następnie widzimy to dzięki formule wariacyjnej Hadarmarda $$ \frac{1}{t}(\lambda_i(A+tB)-\lambda_i(A)) \to \langle i|B| i\rangle $$ gdzie $|i\rangle$ jest odpowiednim wektorem własnym (unikalnym do fazy, ponieważ to zakładamy $A$ jest proste) do $\lambda_i(A)$. Podłączając to wszystko z powrotem, widzimy, że wzór zachowuje przynajmniej kiedy$A$ jest proste.
EDYCJA 2 . Myślę, że teraz mam sposób radzenia sobie ze zdegenerowanymi wartościami własnymi. Przygotuję szkic i później uzupełnię szczegóły (jeśli ktoś inny nie wskaże błędu).
Pozwolić $\lambda_1 (A)=\cdots =\lambda_r(A)$być zdegenerowanymi wartościami własnymi. Następnie za wystarczająco mały$t$, wartości własne $\lambda_i (A+tB),i=1,...,r$nie dotknie innych wartości własnych (znowu nierówność Weyla). Skorzystajmy z projektora Riesz $$ P_A =\frac{1}{2\pi i} \oint_\Gamma \frac{dz}{A-z} $$ gdzie $\Gamma$ jest jakiś „gładki” kontur wokół $\lambda_1 (A)=\cdots =\lambda_r(A)$a jego wnętrze nie zawiera żadnych innych wartości własnych. Z nierówności Weyla możemy to założyć$\lambda_i(A+tB),i=1,...,r$ nadal znajdują się we wnętrzu $\Gamma$ za wystarczająco małe $t$. Zauważ, że $$ \frac{d}{dt} \Big|_0 \tr {((A+tB)P_{A+tB})} = \tr(BP_A) $$ gdzie zaczerpnąłem inspirację z komentarza @ Ruy i wykorzystałem fakt, że \ begin {align} \ frac {d} {dt} \ Big | _0 \ tr {(A (P_ {A + tB} -P_A))} & = \ tr A \ oint_ \ Gamma \ frac {dz} {(zA) ^ 2} B \\ & = \ sum_ {i = 1} ^ r \ oint_ \ Gamma \ lambda_i (A) \ frac {1} {(z - \ lambda_i (A)) ^ 2} dz \ langle i | B | i \ rangle \\ & = 0 \ end {align} Stąd, jeśli połączymy to z poprzednią częścią, zobaczymy, że równość zachowuje.
Mój dowód jest trochę zawiły, więc nadal mam nadzieję, że ujrzę prostsze podejście
Odpowiedzi
Lemat 1 . Pozwolić$f$ i $g$ być wartościowymi funkcjami klasy $C^1$ zdefiniowane w sąsiedztwie $(a-\delta , a+\delta )$ liczby rzeczywistej $a$, takie że $$ f(a)=g(a),\quad \text{and}\quad f'(a)=g'(a). $$ Niech też $\lambda :U\to (a-\delta , a+\delta )$ być dowolną funkcją zdefiniowaną w sąsiedztwie $U$ zero takie, że $$ |\lambda (t)-a|\leq c|t|, \quad \forall t\in U, $$ gdzie $c$jest daną stałą dodatnią. Następnie $$ \lim_{t\to 0} \frac{f(\lambda _t) - g(\lambda _t)}t = 0. $$
Dowód . Twierdzenie o wartości średniej, dla każdego$t$ w $U$możemy napisać $$ f(\lambda _t) = f(a) + f'(\xi _t)(\lambda _t-a), $$ i $$ g(\lambda _t) = g(a) + g'(\eta _t)(\lambda _t-a), $$ gdzie $\xi _t$ i $\eta _t$ leżeć pomiędzy $\lambda _t$ i $a$. W związku z tym $$ |f(\lambda _t) - g(\lambda _t)| = $$ $$ = |f'(\xi _t)-g'(\eta _t)||\lambda _t-a| \leq c|f'(\xi _t)-g'(\eta _t)| |t|. $$ Od kiedy oboje $\xi _t$ i $\eta _t$ zbiegają się do $a$, tak jak $t\to 0$, mamy $$ \lim_{t\to 0} \left|\frac{f(\lambda _t) - g(\lambda _t)}t\right| \leq $$ $$ \leq \lim_{t\to 0} c|f'(\xi _t)-g'(\eta _t)| = c|f'(a)-g'(a)| = 0. $$ CO BYŁO DO OKAZANIA
Lemat 2 . Pozwolić$A$ i $B$ być $n\times n$ macierze zespolone samosprzężone i niech $f$ i $g$ być wartościowymi funkcjami klasy $C^1$ zdefiniowane w sąsiedztwie $\sigma (A)$, takie że $$ f(a)=g(a),\quad \text{and}\quad f'(a)=g'(a), \quad \forall a\in \sigma (A). $$ Następnie $$ \lim_{t\to 0} \frac{f(A+tB)-g(A+tB)}t = 0. $$
Dowód . Pozwolić$a_1\leq a_2\leq \cdots \leq a_n$ być wartościami własnymi $A$, i pozwól $\lambda _1(t)\leq \lambda _2(t)\leq \cdots \leq \lambda _n(t)$ być wartościami własnymi $A+tB$. Mamy to przez nierówność Weyla (stabilność wartości własnych) $$ |\lambda _i(t)-a_i|\leq |t| \|B\|. $$ Więc $$ \lim_{t\to 0}\left\|\frac{f(A+tB)-g(A+tB)}t\right\| = $$ $$ = \lim_{t\to 0}\max_{1\leq i\leq n} \left|\frac{f(\lambda _i(t))-g(\lambda _i(t))}t\right| = 0, $$ przez Lemma (1). CO BYŁO DO OKAZANIA
Twierdzenie 3 . Pozwolić$A$ i $B$ być $n\times n$ macierze zespolone samosprzężone i niech $f$ być wartościową funkcją klasy $C^1$ zdefiniowane w sąsiedztwie $\sigma (A)$. Następnie $$ \frac d{dt}\Big|_{t=0} \text{tr}(f(A+tB)) = \hbox{tr}(f'(A)B). $$
Dowód . Załóżmy najpierw$f$ dopuszcza holomorficzne rozszerzenie do złożonego sąsiedztwa widma $A$. Następnie $$ \frac d{dt}\Big|_{t=0} f(A+tB) = \frac d{dt}\Big|_{t=0} \frac{1}{2\pi}\oint f(z)(z-A-tB)^{-1}\,d z = $$ $$ = \frac{1}{2\pi}\oint f(z)(z-A)^{-1} B(z-A)^{-1}\,d z $$ ... który ma ten sam ślad co ... $$ \frac{1}{2\pi}\oint f(z)(z-A)^{-2} B\,d z = $$ $$ = \left(\frac{1}{2\pi}\oint f(z)(z-A)^{-2} \,d z\right) B = f'(A)B. $$
Wróćmy do przypadku ogólnego, niech $p$ być takim prawdziwym wielomianem $$ p(a)=f(a),\quad \text{and}\quad p'(a)=f'(a), \quad \forall a\in \sigma (A). $$ Mamy to $$ \left\|\frac{f(A+tB) - f(A)}t -\frac{p(A+tB) - p(A)}t \right\| = $$ $$ = \left\|\frac{f(A+tB) - p(A+tB)}t \right\|, $$ który zbiega się do zera przez Lemma (2). Biorąc limit jako$t\to 0$, wynika z tego $$ \frac d{dt}\Big|_{t=0} \text{tr}(f(A+tB)) = \frac d{dt}\Big|_{t=0} \text{tr}(p(A+tB)) = $$ $$ = \hbox{tr}(p'(A)B) = \hbox{tr}(f'(A)B). $$ CO BYŁO DO OKAZANIA