Risoluzione di un'equazione tensoriale di base e conversione in notazione indice
Sto guardando la lezione 8 di gravità e serie di luci di Schuller, che introduce il tensore di curvatura di Riemann. È un$(1,3)$ tensore $\mathbf{R}$ definito come $$\mathbf{R}(\omega, Z, X, Y):=\omega(\nabla_X\nabla_YZ-\nabla_Y\nabla_XZ-\nabla_{[X,Y]}Z)$$ Vogliamo ottenere un'espressione per $(\nabla_X\nabla_YZ-\nabla_Y\nabla_XZ)$. Quindi possiamo dire$$\omega(\nabla_X\nabla_YZ-\nabla_Y\nabla_XZ)=\mathbf{R}(\omega, Z, X, Y)+\omega(\nabla_{[X,Y]}Z)$$ Poiché questo vale per arbitrario $\omega$, per me ha un senso intuitivo$$\nabla_X\nabla_YZ-\nabla_Y\nabla_XZ=\mathbf{R}(\_, Z, X, Y)+\nabla_{[X,Y]}Z$$ ma non riesco a capire la rigorosa giustificazione di questa implicazione.
Domanda 1. Quale risultato / concetto abbiamo utilizzato per derivare la terza equazione dalla seconda?
Diventa più strano quando il docente converte quanto sopra in notazione indice. In un grafico$(U,x)$, $$(\nabla_a\nabla_bZ)^m-(\nabla_b\nabla_aZ)^m=R^m_{\ \ nab}Z^n+\nabla_{\big[\frac{\partial}{\partial x^a},\frac{\partial}{\partial x^b}\big]}Z$$
(il pedice nell'ultimo termine legge $\big[\frac{\partial}{\partial x^a},\frac{\partial}{\partial x^b}\big]$, nel caso sia difficile da vedere)
Domanda 2. Come è derivata questa equazione della notazione dell'indice dalla terza equazione? Quali linee guida / concetti generali vengono utilizzati per scrivere un'equazione tensoriale nella notazione dell'indice corrispondente?
Mi scuso in anticipo se è una domanda molto ingenua.
Risposte
La prima domanda non ha nulla a che fare con la geometria, e tutto a che fare con l'algebra lineare; in particolare l'interazione tra$V,V^*, V^{**}$ quando $V$ è uno spazio vettoriale a dimensione finita (su qualsiasi campo $\Bbb{F}$, non deve nemmeno esserlo $\Bbb{R}$). Quindi, questa è la situazione su cui ci concentreremo.
Spero che tu lo sappia se $\dim V <\infty$, poi $\dim V = \dim V^* = \dim V^{**}$, quindi gli spazi sono tutti isomorfi. Quello che è veramente bello è questo$V$ e $V^{**}$ sono canonicamente isomorfe: la mappa $\iota:V \to V^{**}$ definito da impostazione per tutti $v\in V, \omega \in V^*$, $[\iota(v)](\omega) := \omega(v)$è facilmente visibile come lineare e iniettiva (ad esempio utilizzando una base); poi per teorema di nullità di rango segue$\iota$ è in realtà un isomorfismo lineare.
Supponiamo $v\in V$, e $\rho:V^* \to \Bbb{F}$ è tale per tutti $\omega \in V^*$, \begin{align} \rho(\omega) &= \omega(v) \in \Bbb{F} \end{align} Quindi, se rilasci la definizione di $\iota$, Lo vediamo $\rho(\omega) = \omega(v) = [\iota(v)](\omega)$. Poiché questo è vero per tutti$\omega$, ce l'abbiamo $\rho = \iota(v)$, e questa è un'uguaglianza di elementi in $V^{**}$ (cioè è un'uguaglianza di $(1,0)$-tensori accesi $V$). Allo stesso modo, possiamo riscriverlo come$v =\iota^{-1}(\rho)$, e questa è ora una corretta uguaglianza di elementi in $V$ (e in Lecture $3$, Credo che passi un po 'di tempo cercando di spiegarlo $V\cong V^{**}$ quando si cerca di spiegare perché ogni vettore "è" o piuttosto "può essere considerato" come un $(1,0)$ tensore).
Quello che di solito accade è quello nel caso di dimensione finita, poiché l'isomorfismo $V\cong V^{**}$ utilizzando $\iota$ è naturale, trattiamo semplicemente gli spazi come uguali, $V=V^{**}$. Naturalmente, in teoria degli insiemi, questi sono spazi diversi, ma ogni volta che abbiamo tali isomorfismi naturali, diventa (a volte) piuttosto macchinoso continuare a dover distinguere gli spazi. È un po 'come cercare di distinguere gli spazi$\Bbb{R}\times \Bbb{R}\times \Bbb{R}$ vs $\Bbb{R}^2\times \Bbb{R}$ vs $\Bbb{R}\times \Bbb{R}^2$ vs $\Bbb{R}^3$. Impostati teoricamente, questi sono oggetti diversi, ma nella maggior parte delle circostanze li chiamiamo semplicemente tutti questi$\Bbb{R}^3$, e invece di dire "c'è una corrispondenza biunivoca tra i quattro spazi", diciamo semplicemente "i quattro spazi sono uguali".
Nel tuo caso, il file $\rho$ è solo il tensore di curvatura pieno $R(\cdot, Z,X,Y)$ (se lo desideri, valuta tutto in un punto $p\in M$, allora lo spazio vettoriale è $V=T_pM$), mentre il $v$ è $\nabla_X\nabla_YZ-\nabla_X\nabla_YZ-\nabla_{[X,Y]}Z$. Ancora una volta, se vuoi essere molto preciso sulle cose, allora per ciascuna$p\in M$, permettere $\iota_p: T_pM \to (T_pM)^{**}$essere l'isomorfismo canonico; poi\begin{align} \iota_p\bigg((\nabla_X\nabla_YZ)(p)-(\nabla_X\nabla_YZ)(p)-(\nabla_{[X,Y]}Z)(p)\bigg) &= R_p(\cdot, Z(p), X(p), Y(p)). \end{align} Ma, come ho detto, specialmente in questa situazione di dimensione finita, non ha senso (una volta compreso l'isomorfismo) cercare di tenerne traccia (perché con un po 'di pratica dovrebbe essere abbastanza facile capire dove va esattamente).
Un altro modo per descrivere l'isomorfismo $\iota$è come segue. Dato qualsiasi spazio vettoriale$V$, possiamo sempre definire la "mappa di valutazione" $\text{ev}:V \times V^* \to \Bbb{F}$ IMPOSTANDO $\text{ev}(v,\omega):= \omega(v)$. Perché si chiama mappa di valutazione? Perché il suo scopo è valutare letteralmente l'elemento dato di$V^*$ sul dato elemento di $V$per produrre un elemento di campo. Questa è facilmente verificabile come una mappa bilineare.
A volte, questo è spesso chiamato "accoppiamento dualistico" ed è indicato con parentesi angolari $\langle \cdot, \cdot \rangle$, ma non deve essere confuso con un prodotto interno, perché un prodotto interno di solito richiede un campo scalare reale o complesso ed è una mappa $V\times V \to \Bbb{R}$ o in $\Bbb{C}$.
Essendo bilineare, induce due mappe lineari. Il primo è la mappatura$V\to V^{**}$ dato da $v\mapsto \text{ev}(v,\cdot)$e il secondo è la mappatura $V^* \to V^*$ dato da $\omega \mapsto \text{ev}(\cdot, \omega)$. La prima mappatura è proprio la mappa$\iota$ che ho descritto sopra, mentre la seconda mappatura è semplicemente l'identità su $V^*$ quindi non è interessante.
Solo per portare a casa il punto di cosa $\iota$ fa notare che possiamo sempre valutare i covettori $\omega$ su un vettore $v$ per ottenere un elemento di campo $\omega(v)\in \Bbb{F}$. Che cosa$\iota$ ti permette di fare altro che associarti $v$, un elemento $\iota(v)$, che può mangiare i covettori per produrre un elemento di campo $\iota(v)[\omega]:= \omega(v) \in \Bbb{F}$. Adesso, da allora$\iota:V\to V^{**}$ è un isomorfismo, ciò che questo ci permette di fare è essere leggermente sciatti con la notazione e non scrivere $\iota$ affatto nelle nostre formule, e diciamo che "un covettore può agire su un vettore per produrre uno scalare", e anche che "un vettore può agire su un covettore per produrre uno scalare", e i due danno lo stesso risultato: \begin{align} \omega(v) = v(\omega) \in \Bbb{F} \end{align}
Per domanda $2$, stai solo collegando un caso speciale di $X=\frac{\partial}{\partial x^a}, Y=\frac{\partial}{\partial x^b}$, e $\omega = dx^m$. Quindi, partendo dalla prima equazione, abbiamo:\begin{align} R\left(dx^m, Z^n\frac{\partial}{\partial x^n}, \frac{\partial}{\partial x^a}, \frac{\partial}{\partial x^b}\right) &= dx^m\left( \nabla_a \nabla_b Z - \nabla_b \nabla_a Z - \nabla_{\left[\frac{\partial}{\partial x^a}, \frac{\partial}{\partial x^b}\right]}Z\right) \end{align} Ora, usa la multilinearità su entrambi i lati e la definizione di indici tensoriali: $T^{i_1,\dots, i_r}_{\qquad j_1, \dots, j_s} := T\left(dx^{i_1}, \dots, dx^{i_r}, \frac{\partial}{\partial x^{j_1}}, \dots, \frac{\partial}{\partial x^{j_s}}\right)$ (vedi lezione $3$) ottenere \begin{align} R^{m}_{\,\, nab}Z^n &= (\nabla_a\nabla_bZ)^m-(\nabla_b\nabla_aZ)^m - \left(\nabla_{\left[\frac{\partial}{\partial x^a}, \frac{\partial}{\partial x^b}\right]}Z\right)^m. \end{align}
In generale, se si desidera estrarre l'equazione in forma di indice, è sufficiente collegare i campi del vettore di base e i campi covettore appropriati.