Perché alcune operazioni sui tensori non danno un tensore?
Il gradiente è un tensore$\nabla f:\mathbf{V} \to \mathbf{R}$dove le derivate parziali vengono valutate ad un certo punto$(x_0, y_0, z_0)$. E valutazione di questa forma lineare in qualche vettore$v=(v_1,v_2,v_3)$dà
$$ (\nabla f)(\mathbf{v}) = \partial_x f v_1 + \partial_y f v_2 + \partial_z f v_3 $$Inoltre, passando a un nuovo sistema di coordinate, queste derivate parziali si trasformano nel modo previsto.
Ma che dire di una funzione$g:\mathbf{V} \to \mathbf{R}$che è definito solo usando la derivata parziale di$f$nel$x$direzione.$$ g(\mathbf{v}) = \partial_x f v_1 + \partial_x f v_2 + \partial_x f v_3 $$A quanto ho capito, questo non è considerato un tensore perché spostandosi su un nuovo sistema di coordinate non si trasforma correttamente.
Questo mi ha confuso all'infinito. La definizione rigorosa considera una mappa come$f:\mathbf{V} \to \mathbf{R}$un tensore se la linearità vale in ogni parametro. La funzione$g$sopra certamente lo soddisfa. Mi sembra che questa definizione non sia usata e che la definizione di tensore effettivamente usata sia composta da due parti.
- linearità in ogni parametro (cioè forma multilineare),
- e la struttura algebrica dei coefficienti è mantenuta in trasformazione di coordinate
Perché una volta che abbiamo calcolato$\partial_x f$è solo uno scalare e abbiamo appena colpito$(\partial_x f,\partial_x f,\partial_x f)$con la solita trasformazione per un vettore covariante per ottenere i nuovi coefficienti$g$nel nuovo sistema di coordinate. Il fatto che questi nuovi coefficienti non abbiano la giusta struttura algebrica non ne fa multilinearità$g$andare via. È del tutto corretto?
Risposte
Una cosa fondamentale da ricordare sui vettori e le loro rappresentazioni dipendenti dalla base è che la base è arbitraria. Chiunque ha il diritto di esprimere qualsiasi vettore in uno spazio vettoriale in termini di qualsiasi base di sua scelta. Quando espresso in base, un vettore ha l'aspetto di an$n$-tupla di scalari, ma a meno che non venga con quella promessa di quel cambio di formula di base, un arbitrario$n$-tupla di scalari non definisce effettivamente un vettore.
Un tensore è lo stesso, tranne che ora la promessa deve essere che il cambiamento della formula di base coinvolge più fattori del cambiamento della matrice di base.
Il modo preferito dai matematici per ottenere ciò è fornire definizioni prive di coordinate di cose come spazi vettoriali e tensori costruiti da essi. Ma va bene pensare a vettori e tensori anche in base alle loro componenti di coordinate, purché ricordi che in realtà non hai vettori e tensori a meno che non si comportino correttamente al cambio di base.
E questi sono solo vettori e tensori di uno spazio vettoriale. Quando consideriamo campi vettoriali e campi tensoriali su una varietà, invece di cambiamenti arbitrari di base sullo spazio tangente, consideriamo i cambiamenti di coordinate della varietà, e ciò induce un cambiamento di base nello spazio tangente e tensori fuori dallo spazio tangente. I tensori sono diversi dai campi tensoriali, ma per brevità le persone spesso li chiamano anche tensori, quindi affrontiamoli entrambi.
In algebra lineare, puoi creare tensori da uno spazio vettoriale$V$, un tensore di tipo$(p,q)$è un elemento del prodotto tensoriale di$p$-molte copie di$V$e$q$-molti del suo doppio spazio$V^*$. Nel tuo caso, una mappa$V\to \mathbb{R}$è un tensore di rango$(0,1)$, noto anche come funzionale lineare o doppio vettore su$V$. Se volessi, per qualche funzione fissa$f(x,y,z)$e alcune coordinate$(a,b,c)$, potresti calcolare le derivate e valutare a quelle coordinate e ottenere numeri$\frac{\partial f}{\partial x}(a,b,c),\frac{\partial f}{\partial y}(a,b,c),\frac{\partial f}{\partial z}(a,b,c)$. Potresti quindi assemblarli in una tripla$\left(\frac{\partial f}{\partial x}(a,b,c),\frac{\partial f}{\partial y}(a,b,c),\frac{\partial f}{\partial z}(a,b,c)\right)$e dichiara che è un funzionale lineare sul tuo spazio vettoriale.
Dalla tua funzione$f$e le tue coordinate$(a,b,c)$non ha nulla a che fare con il tuo spazio vettoriale, puoi dichiarare che i suoi componenti sono questo in una base. Se qualcuno vuole sapere cosa sono in un'altra base, applica semplicemente il cambio di matrice di base. così$\frac{\partial f}{\partial x}(a,b,c),\frac{\partial f}{\partial y}(a,b,c),\frac{\partial f}{\partial z}(a,b,c)$è un funzionale lineare valido sul tuo spazio vettoriale tridimensionale. È un tensore di tipo$(0,1).$
Non importa in particolare come hai scelto i componenti del tuo tensore nella tua base di partenza, quindi potresti anche aver scelto tre numeri diversi, inclusi$\left(\frac{\partial f}{\partial x}(a,b,c),\frac{\partial f}{\partial x}(a,b,c),\frac{\partial f}{\partial x}(a,b,c)\right).$Anche questo è un tensore di tipo valido$(0,1).$
Quindi, per riassumere, per quanto riguarda l'algebra lineare di un solo spazio vettoriale, entrambi$(\partial_xf,\partial_yf,\partial_zf)$e$(\partial_xf,\partial_xf,\partial_xf)$sono tensori.
Il problema sorgerà quando proveremo a considerarli campi tensoriali su una varietà.
Nella geometria differenziale, fai la stessa cosa, crei tensori da uno spazio vettoriale. Solo che ora lo spazio vettoriale è lo spazio tangente di una varietà$M$. E varia da punto a punto. Un tensore è un elemento del prodotto tensoriale di un certo numero di copie dello spazio tangente$T_xM$a un certo punto$x$e un certo numero di copie dello spazio cotangente$T_xM^*$.
Per creare un campo tensoriale sulla varietà, dobbiamo scegliere un tensore dal prodotto tensoriale dello spazio tangente in ogni punto della varietà.
Una varietà liscia è qualcosa che assomiglia localmente$\mathbb{R}^n$, quindi ammette coordinate locali. Espresso in quelle coordinate locali, un tensore di tipo$(p,q)$è un array di$n^pn^q$funziona su$M$. Ma possiamo scegliere coordinate diverse attorno a qualsiasi punto e abbiamo la scrittura per esprimere i nostri tensori in qualsiasi coordinata. La modifica delle coordinate cambia anche la base dello spazio tangente e del suo spazio duale. Quindi è come l'operazione di cambio di base nell'algebra lineare, così come un cambio di coordinate nelle funzioni di coordinate allo stesso tempo.
Questo è un vincolo su come può apparire un tensore. Il cambio di base deve corrispondere al cambio di coordinate. Non puoi scambiare i due vettori di base senza scambiare anche le due coordinate. Se modifichi le coordinate con una funzione, allora la base per lo spazio tangente cambia con il jacobiano di quella funzione.
Quindi questo è il motivo$(\partial_xf,\partial_xf,\partial_xf)$non è un tensore nel senso della geometria differenziale. Quando cambi le coordinate, un tensore dovrebbe trasformare il$z$-componente da parte del$z$-derivata parziale della funzione di cambio di coordinate. Ma il tuo oggetto ridimensiona ogni componente del$x$-derivato.
È anche il motivo per cui i simboli di Christoffel non sono un tensore. In quanto derivate di un tensore, cambiano con un termine aggiuntivo, piuttosto che con un puro cambio di matrice di base, richiesto per i tensori. Il modo più semplice per vederlo è che un tensore che è zero in un sistema di coordinate deve essere zero in ogni sistema di coordinate, cosa che i simboli di Christoffel non sono sicuri.
C'è un teorema secondo cui un array di funzioni lisce è un tensore se lo sono$C^\infty(M)$lineare, se visto come una funzione sui campi vettoriali. Anche i simboli Christoffel falliscono questo test.
Prima di tutto se abbiamo una funzione$f:\Omega\to\mathbb R$, dove diciamo$\Omega$è un dominio in$\mathbb R^3$, poi$\nabla f(p)$è un campo vettoriale$$\Omega\to\mathbb R^3$$che assegnano una freccia$\nabla f(p)$a$p$. Ma anche una mappa$\Omega\to L(\mathbb R^3,\mathbb R)$che assegna a ciascuno$p$in$\Omega$una mappa lineare$\nabla f(p):\mathbb R^3\to\mathbb R$dato da$$\nabla f(p)\cdot \mathbf v=\mathbf v^1\frac{\partial f}{\partial x}(p)+ \mathbf v^2\frac{\partial f}{\partial y}(p)+ \mathbf v^3\frac{\partial f}{\partial z}(p), $$e si può capire come$f$varia nella direzione$\mathbf v$a$p$.
In secondo luogo, supponiamo ora di avere un cambio di coordinate$\Phi:\Gamma\to\Omega$, che è una mappa differenziabile con derivata$J\Phi$di rango tre ovunque a$\Gamma\subseteq\mathbb R^3$, dove abbiamo$\Phi(q)=p$per un unico$q$in$\Gamma$.
Così$f\circ\Phi:\Gamma\to\mathbb R$(è differenziabile se$f$is) e dalla regola della catena$\nabla(f\circ\Phi)=\nabla f\cdot J\Phi$attraverso$\Gamma$, e a$q$ $$\nabla(f\circ\Phi)(q)=\nabla f(p)\cdot J\Phi(q).$$
Se lo pensiamo$\Phi:(u,v,w)^{\top}\mapsto(x,y,z)^{\top}$è la dipendenza delle vecchie coordinate in quelle nuove, quindi
$$\left[ \frac{\partial f\circ\Phi}{\partial u}(q)\quad \frac{\partial f\circ\Phi}{\partial v}(q)\quad \frac{\partial f\circ\Phi}{\partial w}(q)\right] =$$ $$ \left[\frac{\partial f}{\partial x}(p)\quad \frac{\partial f}{\partial y}(p)\quad \frac{\partial f}{\partial z}(p) \right] \left[ \begin{array}{ccc} \dfrac{\partial x}{\partial u}(q)&\dfrac{\partial x}{\partial v}(q)&\dfrac{\partial x}{\partial w}(q)\\ \dfrac{\partial y}{\partial u}(q)&\dfrac{\partial y}{\partial v}(q)&\dfrac{\partial y}{\partial w}(q)\\ \dfrac{\partial z}{\partial u}(q)&\dfrac{\partial z}{\partial v}(q)&\dfrac{\partial z}{\partial w}(q)\\ \end{array} \right], $$che significa che$$\frac{\partial f\circ\Phi}{\partial u}(q)= \frac{\partial f}{\partial x}(p)\frac{\partial x}{\partial u}(q)+ \frac{\partial f}{\partial y}(p)\frac{\partial y}{\partial u}(q)+ \frac{\partial f}{\partial z}(p)\frac{\partial z}{\partial u}(q), $$ $$\frac{\partial f\circ\Phi}{\partial v}(q)= \frac{\partial f}{\partial x}(p)\frac{\partial x}{\partial v}(q)+ \frac{\partial f}{\partial y}(p)\frac{\partial y}{\partial v}(q)+ \frac{\partial f}{\partial z}(p)\frac{\partial z}{\partial v}(q), $$e$$\frac{\partial f\circ\Phi}{\partial w}(q)= \frac{\partial f}{\partial x}(p)\frac{\partial x}{\partial w}(q)+ \frac{\partial f}{\partial y}(p)\frac{\partial y}{\partial w}(q)+ \frac{\partial f}{\partial z}(p)\frac{\partial z}{\partial w}(q), $$sono i componenti di$\nabla(f\circ\Phi)$a$q$(chi controlla cosa succede a$p$con le nuove coordinate). Così,$\nabla f$è un tensore di rango uno .
Terzo, per le mappe$\mathbf V\times\mathbf V\to\mathbb R$che soddisfano qualcosa di simile, verrebbero chiamati tensori di rango due , caso che non è presente nell'operazione gradiente.