Minimalizacja darmowej energii
$\DeclareMathOperator{\tr}{tr}$ Pozwolić $H$być samosprzężoną macierzą i zdefiniować darmową energię jako$$ F(\Gamma)=\tr(H\Gamma+\Gamma \log \Gamma +(1-\Gamma) \log(1-\Gamma)) $$ gdzie $\Gamma$ spełnia $0\le \Gamma \le 1$. Widziałem, jak sugerują to prace z fizyki$F(\Gamma)$ jest zminimalizowane, jeśli weźmiemy $$ \Gamma =\frac{1}{e^H +1} $$ ale nie mogę wymyślić rygorystycznego dowodu.
EDYTUJ . „Zwykłą” nieryglistyczną metodą dowodzenia byłoby użycie metody wariacyjnej, tj.\begin{align} \delta F &=\tr\left(H\delta\Gamma+\log\left(\frac{\Gamma}{1-\Gamma}\right)\delta\Gamma \right)\\ 0&=H+\log\left(\frac{\Gamma}{1-\Gamma}\right)\\ \Gamma &= \frac{1}{e^H+1} \end{align} Jak można uczynić ten argument rygorystycznym?
EDYCJA 2 . Właśnie to sobie uświadomiłem$F(\Gamma)$jest wypukły, więc myślę, że powyższe obliczenia są prawie rygorystyczne, poza tym$\delta\Gamma$ nie może dojeżdżać z $\Gamma$, jak wskazał @Sangchul Lee.
EDYCJA 3 . Dziękuję @Sangchul Lee za dowód. Myślę, że znalazłem też inny dowód, który może być trochę prostszy.
Pozwolić $\Gamma_0=1/(e^H+1)$ i pozwól $0\le \Gamma_1 \le 1$. Pozwolić$\Gamma(t)=(1-t)\Gamma_0 +t\Gamma_1 =\Gamma_0 +t\Delta$ gdzie $\Delta = \Gamma_1-\Gamma_0$. Pozwolić$f(x)=x \log x +(1-x) \log (1-x)$. W związku z tym,$$ F(\Gamma)-F(\Gamma_0) = \tr(tH\Delta)+\tr (f(\Gamma)-f(\Gamma_0)) $$ Od $f$jest wypukła, możemy zastosować nierówność Kleina i to zobaczyć$$ F(\Gamma)-F(\Gamma_0) \ge \tr(t\Delta (H+\log\Gamma_0 -\log (1-\Gamma_0))=0 $$ Również od $f$ jest ściśle wypukła, widzimy to $\Gamma_0$ to unikalne na świecie min.
Nawiasem mówiąc , nie jestem pewien, dlaczego głosowano za zamknięciem tego pytania. Zagłosuj na ponowne otwarcie, jeśli uważasz inaczej.
EDYCJA 4 . Po dokładniejszym przyjrzeniu się dowodowi nierówności Kleina, pojawia się subtelny „problem” związany z otrzymaniem pochodnej funkcji śledzenia (co nie jest w pełni wyjaśnione w artykule na Wikipedii). @Sangchul Lee zajmuje się tym wyraźnie w tym konkretnym przypadku, ale chciałbym myśleć, że powinno to być możliwe do zrobienia bardziej ogólnie. Dlatego zamieściłem tutaj kolejne pytanie .
Odpowiedzi
W tej odpowiedzi napiszemy
$$ D^+_{B}F(A) := \lim_{\epsilon \to 0^+} \frac{F(A+\epsilon B) - F(A)}{\epsilon} $$
zawsze, gdy istnieje limit. Wtedy przyda się następujący lemat:
Lemat. Mamy$$ D^+_{B}\exp(A) = \int_{0}^{1} e^{sA}Be^{(1-s)A} \, \mathrm{d}s. $$
Dowód. Mamy
$$ D^+_{B}\exp(A) = \sum_{n=1}^{\infty} \frac{1}{n!} D^+_{B}(A^n) = \sum_{n=1}^{\infty} \frac{1}{n!} \sum_{k=0}^{n-1} A^k B A^{n-1-k} = \sum_{k,l\geq 0} \frac{A^k B A^l}{(k+l+1)!}. $$
Następnie twierdzenie wynika z całki beta $\int_{0}^{1} u^k(1-u)^l \, \mathrm{d}s = \frac{k!l!}{(k+l+1)!} $. $\square$
Teraz pozwól $\Gamma_0$ i $\Gamma_1$ być takimi samosprzężonymi macierzami $0 \leq \Gamma_k \leq 1$ dla $k = 0, 1$. Interpolować$\Gamma_0$ i $\Gamma_1$ pozwalając
$$ \Gamma_t = (1-t)\Gamma_0 + t\Gamma_1, \quad 0 \leq t \leq 1. $$
Piszemy też $\Delta = \frac{\mathrm{d}}{\mathrm{d}t} \Gamma_t = \Gamma_1 - \Gamma_0$ponieważ będzie się to często pojawiać. Następnie przez całkę Frullaniego i rachunek funkcjonalny,
\begin{align*} \frac{\mathrm{d}}{\mathrm{d}t} \log \Gamma_{t} &= \frac{\mathrm{d}}{\mathrm{d}t} \int_{0}^{\infty} \frac{e^{-x} - e^{-x\Gamma_t}}{x} \, \mathrm{d}x \\ &= \int_{0}^{\infty} (D^+_{\Delta}\exp)(-x\Gamma_t) \, \mathrm{d}x \\ &= \int_{0}^{\infty} \int_{0}^{1} e^{-sx\Gamma_t}\Delta e^{-(1-s)x\Gamma_t} \, \mathrm{d}s \mathrm{d}x. \end{align*}
Z tego otrzymujemy
\begin{align*} \operatorname{Tr}\left( \Gamma_t \frac{\mathrm{d}}{\mathrm{d}t} \log\Gamma_t \right) &= \operatorname{Tr}\left( \int_{0}^{\infty} \int_{0}^{1} \Gamma_t e^{-sx\Gamma_t}\Delta e^{-(1-s)x\Gamma_t} \, \mathrm{d}s \mathrm{d}x \right) \\ &= \int_{0}^{\infty} \int_{0}^{1} \operatorname{Tr}\left( \Gamma_t e^{-sx\Gamma_t}\Delta e^{-(1-s)x\Gamma_t} \right) \, \mathrm{d}s \mathrm{d}x \\ &= \int_{0}^{\infty} \int_{0}^{1} \operatorname{Tr}\left( \Gamma_t e^{-x\Gamma_t}\Delta \right) \, \mathrm{d}s \mathrm{d}x \\ &= \operatorname{Tr}(\Delta), \end{align*}
i podobnie
$$ \operatorname{Tr}\left( (1-\Gamma_t) \frac{\mathrm{d}}{\mathrm{d}t} \log(1-\Gamma_t) \right) = -\operatorname{Tr}(\Delta). $$
Więc otrzymujemy
$$ \frac{\mathrm{d}}{\mathrm{d}t} F(\Gamma_t) = \operatorname{Tr}\left( H\Delta + \Delta\log(\Gamma_t) - \Delta\log(1-\Gamma_t) \right) \tag{1} $$
Zróżnicowanie obu stron w odniesieniu do $t$ jeszcze raz,
\begin{align*} \frac{\mathrm{d}^2}{\mathrm{d}t^2} F(\Gamma_t) &= \operatorname{Tr}\left(\Delta \frac{\mathrm{d}}{\mathrm{d}t}\log(\Gamma_t) - \Delta \frac{\mathrm{d}}{\mathrm{d}t}\log(1-\Gamma_t) \right) \\ &= \operatorname{Tr}\left( \int_{0}^{\infty} \int_{0}^{1} \Delta e^{-sx\Gamma_t}\Delta e^{-(1-s)x\Gamma_t} \, \mathrm{d}s \mathrm{d}x \right) \\ &\qquad + \operatorname{Tr}\left( \int_{0}^{\infty} \int_{0}^{1} \Delta e^{-sx(1-\Gamma_t)}\Delta e^{-(1-s)x(1-\Gamma_t)} \, \mathrm{d}s \mathrm{d}x \right) \\ &= \int_{0}^{\infty} \int_{0}^{1} \left\| e^{-\frac{1}{2}sx\Gamma_t}\Delta e^{-\frac{1}{2}(1-s)x\Gamma_t} \right\|^2 \, \mathrm{d}s \mathrm{d}x \\ &\qquad + \int_{0}^{\infty} \int_{0}^{1} \left\| e^{-\frac{1}{2}sx(1-\Gamma_t)}\Delta e^{-\frac{1}{2}(1-s)x(1-\Gamma_t)} \right\|^2 \, \mathrm{d}s \mathrm{d}x \tag{2} \end{align*}
gdzie $\| X \|^2 = \operatorname{Tr}(X^* X)$ jest zawsze nieujemną liczbą rzeczywistą.
Teraz jesteśmy gotowi, aby udowodnić roszczenie.
Od $\text{(2)}$, wiemy to $\frac{\mathrm{d}^2}{\mathrm{d}t^2} F(\Gamma_t) \geq 0$, co z kolei implikuje $F$ jest wypukły.
$\text{(1)}$ można to pokazać $\Gamma_{\text{m}} = \frac{1}{e^H + 1}$ jest lokalnym ekstremum $F$. Następnie przez wypukłość jest to lokalne minimum$F$.
W związku z tym $\Gamma_{\text{m}}$ minimalizuje $F$.