Qu'est-ce que les cônes ont à voir avec les quadratiques? Pourquoi 2 est-il spécial?
J'ai toujours été harcelé par les deux définitions extrêmement non manifestement liées des sections coniques (c'est-à-dire que cela semble si mystérieux / magique que les tranches d'un cône sont liées aux équations de degré 2 en 2 variables). Récemment, je suis tombé sur les pages / vidéos suivantes:
- Cette vidéo 3B1B sur les ellipses , qui a ravivé mon désir de comprendre les coniques
- Pourquoi les équations quadratiques sont-elles les mêmes que les sections coniques circulaires droites? , qui offre une approche très computationnelle pour tenter de résoudre cette question
- Une autre vidéo 3B1B sur la visualisation des triplets de Pythagore (c.-à-d. Trouver les points rationnels d'un cercle)
- et la conférence de Manjul Bhargava sur la conjecture de Birch-Swinnerton-Dyer , où les minutes ~ 10-15 discutent de la solution complète aux problèmes des points rationnels sur les coniques.
Bien que la vidéo de 3B1B ait beaucoup de sens et soit très belle d'un point de vue géométrique, elle ne parle d'aucune des autres coniques, ni ne discute de la relation avec le «degré 2». De plus, la 2ème vidéo 3B1B que j'ai liée, puis la conférence de Bhargava met en évidence le «degré 2» comme quelque chose que nous comprenons bien, par rapport aux diplômes supérieurs (me rappelle un peu le dernier théorème de Fermat et la non-existence de solutions pour$n>2$).
Donc, je suppose que mes questions sont les suivantes:
- Pourquoi, d'un point de vue intuitif, devrions-nous nous attendre à ce que les cônes soient profondément liés aux ensembles zéro d'équations algébriques de degré 2?
et plus généralement:
- Y a-t-il une raison profonde pour laquelle "2" est si spécial? J'ai souvent entendu dire que "les mathématiques consistent à transformer des choses confuses en algèbre linéaire" parce que l'algèbre linéaire est "la seule matière que les mathématiciens comprennent complètement"; mais il semble que nous comprenions aussi beaucoup de belles choses à propos de la quadratique - nous avons la relation susmentionnée avec les cônes, une compréhension complète des points rationnels et le théorème de Pythagore (oh! et je viens de penser à la réciprocité quadratique).
Il est également intéressant de noter que de nombreuses équations en physique sont liées à 2 (la deuxième dérivée), bien que cela puisse être un étirement. J'apprécie toutes les idées que vous partagez!
Réponses
Un cône lui-même est un quadratique! Seulement trois variables plutôt que deux. Plus précisément, les surfaces coniques sont des « hyperboloïdes dégénérés », tels que
$$x^2 + y^2 - z^2 = 0.$$
Prendre des sections coniques correspond à l'intersection d'un cône avec un plan $ax + by + cz = d$, ce qui revient à remplacer l'une des trois variables par une combinaison linéaire des deux autres plus une constante, ce qui produit une quadratique à deux variables. Le plus simple à voir est que si$z$ est remplacé par une constante $r$ alors nous obtenons un cercle $x^2 + y^2 = r^2$ (c'est ainsi que vous pouvez trouver l'équation ci-dessus; un cône est une forme dont la tranche à $z = \pm r$ est un cercle de rayon $r$). De même si$x$ ou $y$ est remplacé par une constante on obtient une hyperbole.
Je ne sais pas si j'ai une image complète à présenter sur les raisons pour lesquelles les quadratiques sont tellement plus faciles à comprendre que les cubiques et ainsi de suite. La chose la plus simple à dire est peut-être que les formes quadratiques sont étroitement liées aux matrices carrées (symétriques)$M$, puisqu'ils peuvent être écrits $q(x) = x^T M x$. Et nous avons de nombreux outils pour comprendre les matrices carrées, qui peuvent tous être utilisés pour comprendre les formes quadratiques, par exemple le théorème spectral . Les objets correspondants pour les formes cubiques sont un degré$3$ tenseur qui est plus difficile à analyser.
Peut-être une façon assez stupide de dire que c'est que $2$ est spécial car c'est le plus petit entier positif qui n'est pas égal à $1$. Les quadratiques sont donc les choses les plus simples qui ne sont pas linéaires, etc.
Qu'est-ce qu'un cône?
C'est un solide de sorte que chaque section transversale perpendiculaire à son axe central est un cercle, et les rayons de ces cercles de section transversale sont proportionnels à la distance du sommet du cône.
Et c'est tout. la surface du cône sont les points$(x,y,z)$ où $z = h= $ la hauteur de la section transversale $= r = $le rayon de la section transversale. Et$(x,y)$ sont les points du cercle de rayon $r = h = z$.
Comme l'équation d'un cercle est $\sqrt{x^2 +y^2} = r$ ou $x^2 + y^2 = r^2$ l'équation d'un cône est $x^2 + y^2 = z^2$.
Chaque section conique est une matière coupant le cône avec un plan. Un avion est une restriction des trois variables à relier par contrainte$ax +by + cz= k$ et c'est une question d'exprimer toute troisième variable comme une combinaison linéaire des deux autres.
Ainsi, la section transversale d'un plan et d'un cône sera une dérivation de l'équation à 2 degrés $x^2 = y^2 = z^2$où l'une des variables sera une combinaison linéaire des deux autres. En d'autres termes, une équation du second degré avec deux variables.
Et c'est tout ce qu'il y a à faire.
Bien sûr, la vraie question est de savoir pourquoi l'équation d'un cercle $x^2 + y^2 =r^2$? et pourquoi est - ce une représentation si importante d'une équation du deuxième degré?
Et c'est entièrement à cause du théorème de Pythagore. Si nous prenons un point$(x,y)$ dans un avion et considérez les trois points $(x,y), (x,0)$ et $(0,0)$ils pour les trois sommets d'un triangle rectangle. Les jambes de ce triangle sont de longueurs$x$ et $y$ et donc par le théorème de Pythagore l'hypoténuse aura la longueur $\sqrt{x^2 + y^2}=h$ et c'est la distance de $(x,y)$ à $(0,0)$.
Maintenant, un cercle est la collection de points d'où la distance de $(x,y)$ à $(0,0)$ est la valeur constante $r = h$. Et donc ce sera tous les points$(x,y)$ où $\sqrt{x^2 + y^2} =r$.
Et c'est tout. C'est pourquoi: les distances sont liées aux triangles rectangles, les triangles rectangles sont liés aux équations du 2ème degré, les cercles sont liés aux distances, les cônes sont liés aux cercles et tous sont liés aux équations du 2ème degré.
C'est tout.
La raison immédiate est que les cônes sont basés sur des cercles , et les cercles, à leur tour, sont donnés par l' équation quadratique
$$x^2 + y^2 = r^2$$
. Or, comme pour la raison pour laquelle les cercles ont cette équation, c'est parce qu'ils sont liés à la fonction de distance euclidienne, étant l'ensemble de tous les points à distance constante d'un centre donné, ici conventionnellement pris comme origine. En particulier,
$$d(P, Q) = \sqrt{|Q_x - P_x|^2 + |Q_y - P_y|^2}$$
Dans la mesure où la métrique euclidienne a cette forme, je dirais qu'elle revient à ce qui suit. Pour avoir un peu plus d'informations à ce sujet, il est utile de considérer la forme un peu plus générale des métriques
$$d_p(P, Q) := \left(|Q_x - P_x|^p + |Q_y - P_y|^p\right)^{1/p}$$
appelé le $p$- des métriques qui, en effet, résultent de la demande "eh bien, que se passe-t-il si on laisse la puissance ne pas être 2?", et sont donc justes pour répondre à cette question.
Et il s'avère que $d_2$a une propriété très spéciale. C'est le seul pour lequel vous pouvez prendre un objet géométrique, déclarer un point sur celui-ci comme pivot, puis prendre n'importe quel autre point sur cet objet et le marquer, mesurer la distance du pivot au point d'étiquette, et maintenant transformer cet objet de cette manière, le centre reste fixe, tandis que le point d'étiquette vient à faire face à une direction différente à la même distance, et pourtant la taille et la forme globales de l'objet entier restent inchangées. Ou, pour le dire autrement, qu'une telle chose comme «rotation» a un sens géométrique comme étant un mouvement rigide.
Alors, quelle est la raison ultime pour laquelle les cônes sont quadratiques? Parce que dans l'espace euclidien, vous pouvez faire pivoter les choses comme bon vous semble sans changer leur taille et leur forme.
Il existe un article de David Mumford qui peut être difficile à lire selon votre niveau de préparation.
L'essentiel de cet article est de dire que tout système d'équations polynomiales peut être remplacé (en ajoutant plus de variables et plus d'équations) à un système d' équations quadratiques et linéaires.
On peut sans doute généraliser cette plus loin pour montrer que si le système polynôme a des paramètres, alors on peut faire en sorte que ces paramètres n'apparaissent dans les équations linéaires.
Le cas précoce très particulier de ceci est celui que vous avez mentionné.
Une raison «2» est spéciale pour la physique est la deuxième loi de Newton, qui relie la force à l' accélération (pas à la vitesse) et c'est une deuxième dérivée. Eh bien, il y a aussi le rôle de "2" dans les lois des carrés inverses.
La raison pour laquelle «2» est spécial en géométrie à travers des formes quadratiques à plusieurs variables est que les formes quadratiques à plusieurs variables ont quelques propriétés intéressantes.
- Chaque forme quadratique peut être diagonalisée pour supprimer tous les termes croisés, vous pouvez donc vous concentrer sur le cas des formes quadratiques diagonales $a_1x_1^2 + \cdots + a_nx_n^2$. (Strictement parlant, cela n'est pas vrai pour les formes quadratiques sur des champs de$2$, mais vous n'obtenez pas l'intuition géométrique de la caractéristique $2$.) Contrairement à cela, les formes cubiques peuvent ne pas pouvoir être diagonalisées, même sur $\mathbf C$. Par exemple, la forme cubique$y^2z - x^3 + xz^2$ (dont le zéro sous forme déshomogénéisée est donné par l'équation $y^2 = x^3 - x$) ne peut pas être diagonalisé $\mathbf C$: voir mes commentaires ici
Chaque forme quadratique non singulière a un grand groupe d'automorphismes grâce à la construction de réflexions. C'est ce qu'on appelle le groupe orthogonal de la forme quadratique. Contrairement à cela, le «groupe orthogonal» d'un polynôme homogène de degré supérieur$f(\mathbf x)$ (cela signifie le groupe de transformations linéaires $A$ préserver le polynôme: $f(A\mathbf x) = f(\mathbf x)$) est souvent finie, par exemple, les seules isométries de $x_1^n + \cdots + x_n^n$ pour $n \geq 3$ sont des permutations de coordonnées et des coordonnées multipliées par $n$racines de l’unité.
Le concept d'orthogonalité est fondamental pour la géométrie, que vous voulez être une relation bilinéaire symétrique: $v \perp w$ si et seulement si $w \perp v$, et si $v \perp w$ et $v \perp w'$ puis $v \perp (ax + a'w')$ pour tous les scalaires $a$ et $a'$. Cela suggère de regarder les formes bilinéaires$B(v,w)$ sur un espace vectoriel et demandant quand la relation $B(v,w) = 0$ (une version abstraite de "$v \perp w$") est symétrique. Il s'avère que cela se produit si et seulement si $B$est symétrique ou alterné. Le premier cas est, en dehors de la caractéristique$2$, étroitement lié à l'étude de la forme quadratique $Q(v) = B(v,v)$.
Le numéro d'index 2 est spécial en relation avec la façon dont les angles peuvent être définis à partir des distances.
Il existe de nombreuses fonctions de distance (normes) possibles qui peuvent être définies, mais la plupart d'entre elles ne permettent pas de définir les angles de manière cohérente. Les angles sont définis à partir d'un produit interne (produit scalaire) et ceci n'est défini que si la norme obéit à l'expression quadratique$$||u+v||^2+||u-v||^2=2||u||^2+2||v||^2$$ pour tous les vecteurs $u$ et $v$.
Dans un espace avec une norme différente, il y a moins de rotations. Il ne peut y avoir qu'un nombre fini de rotations possibles d'un cercle ou d'une sphère. Un "cône" en 3D$(x,y,z)$ Défini par $||x+y||=||z||$ peuvent encore être intersectées par des plans et une famille de courbes (non quadratiques) trouvées.
Dans la géométrie habituelle, les angles sont définis, il existe donc une expression quadratique qui doit être satisfaite par les longueurs.