Đạo hàm của hàm theo dõi
$\DeclareMathOperator{\tr}{tr}$ Để cho $A,B$ là ma trận tự liền kề và $f$ là một chức năng thực sự có thể phân biệt trên $\mathbb{R}$ với phái sinh $f'$. Vậy tại sao nó lại là sự thật$$ \left.\ \frac{d}{dt}\right|_0 \tr f(A+tB)=\tr (f'(A)B) $$
Điều này được sử dụng trong https://en.wikipedia.org/wiki/Trace_inequality#Klein%27s_inequality. Tuy nhiên, tôi không chắc tại sao nói chung điều này lại đúng. Khá rõ ràng tại sao nó đúng với các phân thức vì chúng ta có thể sử dụng quan hệ giao hoán của hàm dấu vết, nhưng nói chung thì khó biện minh hơn. Tôi cũng đã kiểm tra tài liệu tham khảo được liên kết (E. Carlen, Trace Inequalities và Quantum Entropy: An Introductory Course, Contemp. Math. 529 (2010) 73–140) mà không may mắn, vì tác giả không đưa ra nhiều giải thích.
CHỈNH SỬA : Sau khi suy nghĩ thêm, hãy để tôi cung cấp một bằng chứng không đầy đủ về những gì tôi nhận được cho đến nay. Hy vọng rằng ai đó có kiến thức tốt hơn có thể hoàn thành việc chứng minh.
Vì đơn giản, hãy $\lambda_i(A)$ biểu thị các giá trị riêng của $A$ theo thứ tự giảm dần, tức là $\lambda_1(A) \ge \cdots \ge \lambda_d (A)$. Sau đó$$ \tr \left( \frac{f(A+tB)-f(A)}{t}\right) = \sum_i \frac{1}{t}[f(\lambda_i(A+tB)-f(\lambda_i(A))] $$ Lưu ý rằng bằng bất đẳng thức Weyl (tính ổn định của các giá trị riêng), chúng ta thấy rằng $|\lambda_i(A+tB)-\lambda_i(A)|\le t||B||$. Do đó, sử dụng một$\epsilon,\delta$ lập luận, chúng ta có thể thay thế ở trên bằng $$ \sum_i \frac{1}{t}(\lambda_i(A+tB)-\lambda_i(A)) f'(\lambda_i(A)) $$ Bây giờ trước tiên giả sử rằng $A$ có một phổ đơn giản, sau đó $A+tB$ cũng đơn giản cho đủ nhỏ $t$. Sau đó, bằng công thức biến thể của Hadarmard, chúng ta thấy rằng$$ \frac{1}{t}(\lambda_i(A+tB)-\lambda_i(A)) \to \langle i|B| i\rangle $$ Ở đâu $|i\rangle$ là eigenvector tương ứng (duy nhất cho đến giai đoạn vì chúng tôi đang giả định rằng $A$ là đơn giản) để $\lambda_i(A)$. Cắm lại tất cả những điều này, chúng tôi thấy rằng công thức ít nhất giữ được khi$A$ Thì đơn giản.
CHỈNH SỬA 2 . Tôi nghĩ bây giờ tôi đã có một cách để đối phó với các giá trị đặc biệt thoái hóa. Tôi sẽ cung cấp bản phác thảo và điền chi tiết sau (nếu người khác không chỉ ra lỗi).
Để cho $\lambda_1 (A)=\cdots =\lambda_r(A)$là các giá trị suy giảm. Sau đó cho đủ nhỏ$t$, các giá trị riêng $\lambda_i (A+tB),i=1,...,r$sẽ không chạm vào các giá trị riêng khác (lại bất bình đẳng của Weyl). Hãy để chúng tôi sử dụng máy chiếu Riesz$$ P_A =\frac{1}{2\pi i} \oint_\Gamma \frac{dz}{A-z} $$ Ở đâu $\Gamma$ là một số đường viền "mịn" xung quanh $\lambda_1 (A)=\cdots =\lambda_r(A)$và bên trong của nó không chứa bất kỳ giá trị nào khác. Theo bất đẳng thức Weyl, chúng ta có thể giả định rằng$\lambda_i(A+tB),i=1,...,r$ vẫn còn trong nội thất của $\Gamma$ đủ nhỏ $t$. Thông báo rằng$$ \frac{d}{dt} \Big|_0 \tr {((A+tB)P_{A+tB})} = \tr(BP_A) $$nơi tôi lấy một số cảm hứng từ nhận xét của @ Ruy và sử dụng thực tế là \ begin {align} \ frac {d} {dt} \ Big | _0 \ tr {(A (P_ {A + tB} -P_A))} & = \ tr A \ oint_ \ Gamma \ frac {dz} {(zA) ^ 2} B \\ & = \ sum_ {i = 1} ^ r \ oint_ \ Gamma \ lambda_i (A) \ frac {1} {(z - \ lambda_i (A)) ^ 2} dz \ langle i | B | i \ rangle \\ & = 0 \ end {align} Do đó, nếu chúng ta kết hợp phần này với phần trước, chúng ta thấy rằng bằng nhau.
Bằng chứng của tôi hơi phức tạp, vì vậy tôi vẫn hy vọng sẽ thấy một cách tiếp cận đơn giản hơn
Trả lời
Bổ đề 1 . Để cho$f$ và $g$ là các hàm có giá trị thực của lớp $C^1$ được xác định trên một vùng lân cận $(a-\delta , a+\delta )$ của số thực $a$, như vậy mà $$ f(a)=g(a),\quad \text{and}\quad f'(a)=g'(a). $$ Cũng để $\lambda :U\to (a-\delta , a+\delta )$ là bất kỳ chức năng nào được xác định trên một vùng lân cận $U$ của 0 như vậy $$ |\lambda (t)-a|\leq c|t|, \quad \forall t\in U, $$ Ở đâu $c$là một hằng số dương cho trước. Sau đó$$ \lim_{t\to 0} \frac{f(\lambda _t) - g(\lambda _t)}t = 0. $$
Bằng chứng . Theo Định lý giá trị trung bình, cho mỗi$t$ trong $U$, chúng tôi có thể viết $$ f(\lambda _t) = f(a) + f'(\xi _t)(\lambda _t-a), $$ và $$ g(\lambda _t) = g(a) + g'(\eta _t)(\lambda _t-a), $$ Ở đâu $\xi _t$ và $\eta _t$ nằm giữa $\lambda _t$ và $a$. vì thế$$ |f(\lambda _t) - g(\lambda _t)| = $$ $$ = |f'(\xi _t)-g'(\eta _t)||\lambda _t-a| \leq c|f'(\xi _t)-g'(\eta _t)| |t|. $$ Từ khi cả hai $\xi _t$ và $\eta _t$ hội tụ với $a$, như $t\to 0$, chúng tôi nhận được $$ \lim_{t\to 0} \left|\frac{f(\lambda _t) - g(\lambda _t)}t\right| \leq $$ $$ \leq \lim_{t\to 0} c|f'(\xi _t)-g'(\eta _t)| = c|f'(a)-g'(a)| = 0. $$ QED
Bổ đề 2 . Để cho$A$ và $B$ là $n\times n$ ma trận phức hợp tự kết hợp và để $f$ và $g$ là các hàm có giá trị thực của lớp $C^1$ được xác định trên một vùng lân cận của $\sigma (A)$, như vậy mà $$ f(a)=g(a),\quad \text{and}\quad f'(a)=g'(a), \quad \forall a\in \sigma (A). $$ Sau đó $$ \lim_{t\to 0} \frac{f(A+tB)-g(A+tB)}t = 0. $$
Bằng chứng . Để cho$a_1\leq a_2\leq \cdots \leq a_n$ là giá trị riêng của $A$, và để $\lambda _1(t)\leq \lambda _2(t)\leq \cdots \leq \lambda _n(t)$ là giá trị riêng của $A+tB$. Theo bất đẳng thức Weyl (tính ổn định của các giá trị riêng), chúng ta có$$ |\lambda _i(t)-a_i|\leq |t| \|B\|. $$ Vì thế $$ \lim_{t\to 0}\left\|\frac{f(A+tB)-g(A+tB)}t\right\| = $$ $$ = \lim_{t\to 0}\max_{1\leq i\leq n} \left|\frac{f(\lambda _i(t))-g(\lambda _i(t))}t\right| = 0, $$bởi Bổ đề (1). QED
Định lý 3 . Để cho$A$ và $B$ là $n\times n$ ma trận phức hợp tự kết hợp và để $f$ là một hàm có giá trị thực của lớp $C^1$ được xác định trên một vùng lân cận của $\sigma (A)$. Sau đó$$ \frac d{dt}\Big|_{t=0} \text{tr}(f(A+tB)) = \hbox{tr}(f'(A)B). $$
Bằng chứng . Giả sử trước rằng$f$ thừa nhận một phần mở rộng holomorphic đến một vùng lân cận phức tạp của phổ $A$. Sau đó$$ \frac d{dt}\Big|_{t=0} f(A+tB) = \frac d{dt}\Big|_{t=0} \frac{1}{2\pi}\oint f(z)(z-A-tB)^{-1}\,d z = $$ $$ = \frac{1}{2\pi}\oint f(z)(z-A)^{-1} B(z-A)^{-1}\,d z $$ ... có cùng dấu vết với ... $$ \frac{1}{2\pi}\oint f(z)(z-A)^{-2} B\,d z = $$ $$ = \left(\frac{1}{2\pi}\oint f(z)(z-A)^{-2} \,d z\right) B = f'(A)B. $$
Quay lại trường hợp chung, hãy $p$ là một đa thức thực sao cho $$ p(a)=f(a),\quad \text{and}\quad p'(a)=f'(a), \quad \forall a\in \sigma (A). $$ Sau đó chúng tôi có điều đó $$ \left\|\frac{f(A+tB) - f(A)}t -\frac{p(A+tB) - p(A)}t \right\| = $$ $$ = \left\|\frac{f(A+tB) - p(A+tB)}t \right\|, $$mà hội tụ về 0 bởi Bổ đề (2). Lấy giới hạn là$t\to 0$, nó sau đó theo sau đó $$ \frac d{dt}\Big|_{t=0} \text{tr}(f(A+tB)) = \frac d{dt}\Big|_{t=0} \text{tr}(p(A+tB)) = $$ $$ = \hbox{tr}(p'(A)B) = \hbox{tr}(f'(A)B). $$ QED