Cosa hanno a che fare i coni con le quadratiche? Perché 2 è speciale?
Sono sempre stato tormentato dalle due definizioni estremamente non ovviamente correlate di sezioni coniche (cioè sembra così misterioso / magico che in qualche modo le fette di un cono siano correlate alle equazioni di grado 2 in 2 variabili). Recentemente mi sono imbattuto nelle seguenti pagine / video:
- Questo video 3B1B sulle ellissi , che ha riacceso il mio desiderio di comprendere le coniche
- Perché le equazioni quadratiche sono le stesse delle sezioni coniche circolari rette? , che offre un approccio molto computazionale per cercare di risolvere questa domanda
- Un altro video 3B1B sulla visualizzazione delle triple pitagoriche (ovvero trovare i punti razionali di un cerchio)
- e la conferenza di Manjul Bhargava sulla congettura di Birch-Swinnerton-Dyer , in cui i minuti ~ 10-15 discutono la soluzione completa ai problemi dei punti razionali sulle coniche.
Sebbene il video di 3B1B abbia molto senso ed è molto bello da un punto di vista geometrico, non parla di nessuna delle altre coniche, né discute la relazione con il "grado 2". Inoltre, il 2 ° video 3B1B che ho collegato e poi la conferenza di Bhargava evidenzia il "grado 2" come qualcosa che comprendiamo bene, rispetto ai gradi superiori (mi ricorda un po 'l'ultimo teorema di Fermat e l'inesistenza di soluzioni per$n>2$).
Quindi, suppongo che le mie domande siano le seguenti:
- Perché, da un punto di vista intuitivo, dovremmo aspettarci che i coni siano profondamente correlati agli insiemi di zero delle equazioni algebriche di grado 2?
e più in generale:
- C'è qualche motivo profondo per cui "2" è così speciale? Ho sentito spesso la battuta che "la matematica consiste nel trasformare cose confuse in algebra lineare" perché l'algebra lineare è "l'unica materia che i matematici comprendono completamente"; ma sembra che comprendiamo anche molte cose carine sulla quadratica: abbiamo la suddetta relazione con i coni, una comprensione completa dei punti razionali e il teorema di Pitagora (oh! e ho pensato solo alla reciprocità quadratica).
È anche interessante notare che molte equazioni in fisica sono correlate a 2 (la derivata seconda), anche se potrebbe essere un allungamento. Apprezzo tutte le idee che condividi!
Risposte
Un cono stesso è un quadratico! Solo in tre variabili anziché in due. Più precisamente, le superfici coniche sono " iperboloidi degeneri ", come
$$x^2 + y^2 - z^2 = 0.$$
Prendere sezioni coniche corrisponde all'intersezione di un cono con un piano $ax + by + cz = d$, che equivale a sostituire una delle tre variabili con una combinazione lineare delle altre due più una costante, che produce un quadratico in due variabili. Il più facile da vedere è che se$z$ è sostituito da una costante $r$ quindi otteniamo un cerchio $x^2 + y^2 = r^2$ (che è il modo in cui puoi trovare l'equazione precedente; un cono è una forma la cui fetta a $z = \pm r$ è un cerchio di raggio $r$). Allo stesso modo se$x$ o $y$ viene sostituito da una costante otteniamo un'iperbole.
Non so di avere un quadro completo da presentare sul motivo per cui le quadratiche sono molto più facili da capire rispetto alle cubiche e così via. Forse la cosa più semplice da dire è che le forme quadratiche sono strettamente correlate alle matrici quadrate (simmetriche)$M$, poiché possono essere scritti $q(x) = x^T M x$. E abbiamo molti strumenti per comprendere le matrici quadrate, che possono poi essere utilizzati per comprendere le forme quadratiche, ad esempio il teorema dello spettro . Gli oggetti corrispondenti per le forme cubiche sono un grado$3$ tensore che è più difficile da analizzare.
Forse è un modo abbastanza sciocco per dirlo $2$ è speciale perché è il più piccolo numero intero positivo che non è uguale a $1$. Quindi le quadratiche sono le cose più semplici che non sono lineari e così via.
Cos'è un cono?
È un solido in modo che ogni sezione trasversale perpendicolare al suo asse centrale sia un cerchio, e i raggi di questi cerchi di sezione sono proporzionali alla distanza dal vertice del cono.
E questo è tutto. la superficie del cono sono i punti$(x,y,z)$ dove $z = h= $ l'altezza della sezione trasversale $= r = $il raggio della sezione trasversale. E$(x,y)$ sono i punti del cerchio con raggio $r = h = z$.
Come è l'equazione di un cerchio $\sqrt{x^2 +y^2} = r$ o $x^2 + y^2 = r^2$ l'equazione di un cono è $x^2 + y^2 = z^2$.
Ogni sezione conica è una materia che interseca il cono con un piano. Un piano è una restrizione delle tre variabili da mettere in relazione per vincolo$ax +by + cz= k$ e si tratta di esprimere una qualsiasi terza variabile come una combinazione lineare delle altre due.
Quindi la sezione trasversale di un piano e di un cono sarà una derivazione dell'equazione di 2 gradi $x^2 = y^2 = z^2$dove una delle variabili sarà una combinazione lineare delle altre due. In altre parole un'equazione di secondo grado con due variabili.
E questo è tutto quello che c'è da fare.
Ovviamente la vera domanda è perché è l'equazione di un cerchio $x^2 + y^2 =r^2$? e perché è che una rappresentazione così importante di un'equazione di secondo grado?
E questo è interamente a causa del teorema di Pitagora. Se prendiamo qualsiasi punto$(x,y)$ su un piano e considera i tre punti $(x,y), (x,0)$ e $(0,0)$essi per i tre vertici di un triangolo rettangolo. Le gambe di questo triangolo sono lunghe$x$ e $y$ e quindi per il teorema di Pitagora l'ipotenusa avrà lunghezza $\sqrt{x^2 + y^2}=h$ e questa è la distanza di $(x,y)$ per $(0,0)$.
Ora un cerchio è la raccolta di punti da cui la distanza $(x,y)$ per $(0,0)$ è il valore costante $r = h$. E così saranno tutti i punti$(x,y)$ dove $\sqrt{x^2 + y^2} =r$.
E questo è tutto. Ecco perché: le distanze sono legate ai triangoli rettangoli, i triangoli rettangoli sono legati alle equazioni di 2 ° grado, i cerchi sono legati alle distanze, i coni sono legati ai cerchi e tutti sono legati alle equazioni di 2 ° grado.
Questo è tutto.
La ragione prossima è che i coni sono basati su cerchi e i cerchi, a loro volta, sono dati dall'equazione quadratica
$$x^2 + y^2 = r^2$$
. Ora, come per la ragione per cui i cerchi hanno questa equazione, è perché sono legati alla funzione di distanza euclidea, essendo l'insieme di tutti i punti a distanza costante da un dato centro, qui convenzionalmente preso come origine. In particolare,
$$d(P, Q) = \sqrt{|Q_x - P_x|^2 + |Q_y - P_y|^2}$$
Nella misura in cui la metrica euclidea ha questa forma, direi che si riduce a quanto segue. Per avere un'idea più chiara di questo, è utile considerare la forma un po 'più generale di metriche
$$d_p(P, Q) := \left(|Q_x - P_x|^p + |Q_y - P_y|^p\right)^{1/p}$$
chiamato il $p$-metriche che, in effetti, risultano dalla domanda "beh, cosa succede se lasciamo che la potenza non sia 2?", e quindi sono giuste per rispondere a questa domanda.
E si scopre che $d_2$ha una proprietà molto speciale. È l'unico per cui puoi prendere un oggetto geometrico, dichiarare un punto su di esso un perno, quindi prendere qualsiasi altro punto su quell'oggetto e taggarlo, misurare la distanza dal perno al punto del tag e ora trasformare quell'oggetto in tal modo il centro rimane fisso, mentre il tag point si trova ad affrontare una direzione diversa alla stessa distanza, eppure la dimensione e la forma complessiva dell'intero oggetto rimangono invariate. O, per dirla in altro modo, che una cosa come la "rotazione" ha senso geometrico come un movimento rigido.
Allora, qual è la ragione ultima per cui i coni sono quadratici? Perché nello spazio euclideo puoi ruotare le cose nel modo che preferisci senza cambiarne le dimensioni e la forma.
C'è un documento di David Mumford che può essere difficile da leggere a seconda del tuo livello di preparazione.
L'essenza di questo articolo è dire che qualsiasi sistema di equazioni polinomiali può essere sostituito (aggiungendo più variabili e più equazioni) a un sistema di equazioni quadratiche e lineari.
Si può probabilmente generalizzare ulteriormente questo per mostrare che se il sistema polinomiale ha parametri, allora si può garantire che questi parametri compaiano solo nelle equazioni lineari.
Il primo caso molto speciale di questo è quello che hai menzionato.
Una ragione per cui "2" è speciale per la fisica è la seconda legge di Newton, che mette in relazione la forza con l' accelerazione (non la velocità) e questa è una seconda derivata. Bene, c'è anche il ruolo di "2" nelle leggi del quadrato inverso.
Il motivo per cui "2" è speciale nella geometria attraverso forme quadratiche in diverse variabili è che le forme quadratiche in diverse variabili hanno alcune proprietà interessanti.
- Ogni forma quadratica può essere diagonalizzata per rimuovere tutti i termini incrociati, così puoi concentrarti sul caso delle forme quadratiche diagonali $a_1x_1^2 + \cdots + a_nx_n^2$. (A rigor di termini questo non è vero per le forme quadratiche su campi di caratteristica$2$, ma non si ottiene l'intuizione geometrica dalla caratteristica $2$.) In contrasto con ciò, le forme cubiche potrebbero non essere in grado di essere diagonalizzate, anche oltre $\mathbf C$. Ad esempio, la forma cubica$y^2z - x^3 + xz^2$ (il cui zero impostato in forma deomogeneizzata è dato dall'equazione $y^2 = x^3 - x$) non può essere diagonalizzato $\mathbf C$: vedi i miei commenti qui
Ogni forma quadratica non singolare ha un grande gruppo di automorfismi grazie alla costruzione dei riflessi. Si chiama gruppo ortogonale della forma quadratica. Al contrario, il "gruppo ortogonale" di un polinomio omogeneo di grado superiore$f(\mathbf x)$ (che significa il gruppo di trasformazioni lineari $A$ preservando il polinomio: $f(A\mathbf x) = f(\mathbf x)$) è spesso finito, ad esempio, le uniche isometrie di $x_1^n + \cdots + x_n^n$ per $n \geq 3$ sono permutazioni di coordinate e moltiplicando le coordinate per $n$le radici dell'unità.
Fondamentale per la geometria è il concetto di ortogonalità, che vuoi essere una relazione bilineare simmetrica: $v \perp w$ se e solo se $w \perp v$, e se $v \perp w$ e $v \perp w'$ poi $v \perp (ax + a'w')$ per tutti gli scalari $a$ e $a'$. Questo suggerisce di guardare le forme bilineari$B(v,w)$ su uno spazio vettoriale e chiedendo quando la relazione $B(v,w) = 0$ (una versione astratta di "$v \perp w$") è simmetrica. Si scopre che questo accade se e solo se $B$è simmetrico o alternato. Il primo caso è, al di fuori della caratteristica$2$, strettamente correlato allo studio della forma quadratica $Q(v) = B(v,v)$.
Il numero di indice 2 è speciale in relazione al modo in cui gli angoli possono essere definiti dalle distanze.
Esistono molte possibili funzioni di distanza (norme) che possono essere definite, ma la maggior parte di esse non consente di definire gli angoli in modo coerente. Gli angoli sono definiti da un prodotto interno (prodotto scalare) e questo è definito solo se la norma obbedisce all'espressione quadratica$$||u+v||^2+||u-v||^2=2||u||^2+2||v||^2$$ per qualsiasi vettore $u$ e $v$.
In uno spazio con una norma diversa ci sono meno rotazioni. Può esserci solo un numero finito di possibili rotazioni di un cerchio o di una sfera. Un "cono" in 3d$(x,y,z)$ definito da $||x+y||=||z||$ può ancora essere intersecato da piani e una famiglia di curve (non quadratiche) trovate.
Nella solita geometria gli angoli sono definiti, quindi c'è un'espressione quadratica che deve essere soddisfatta dalle lunghezze.