¿Qué tienen que ver los conos con las cuadráticas? ¿Por qué 2 es especial?

Jan 05 2021

Siempre me han molestado las dos definiciones de secciones cónicas extremadamente no obviamente relacionadas (es decir, parece tan misterioso / mágico que de alguna manera las rodajas de un cono están relacionadas con ecuaciones de grado 2 en 2 variables). Recientemente me encontré con las siguientes páginas / videos:

  • Este video 3B1B sobre elipses , que reavivó mi deseo de entender las cónicas
  • ¿Por qué las ecuaciones cuadráticas son iguales a las secciones cónicas circulares rectas? , que ofrece un enfoque muy computacional para tratar de resolver esta cuestión
  • Otro video 3B1B sobre la visualización de triples pitagóricos (es decir, encontrar los puntos racionales de un círculo)
  • y la conferencia de Manjul Bhargava sobre la Conjetura de Birch-Swinnerton-Dyer , donde los minutos ~ 10-15 discuten la solución completa a los problemas de los puntos racionales en las cónicas.

Si bien el video de 3B1B tiene mucho sentido y es muy hermoso desde un punto de vista geométrico, no habla de ninguna de las otras cónicas ni discute la relación con el "grado 2". Además, el segundo video 3B1B que vinculé y luego la conferencia de Bhargava destaca el "grado 2" como algo que entendemos bien, en comparación con los grados superiores (me recuerda un poco el último teorema de Fermat y la inexistencia de soluciones para$n>2$).

Entonces, supongo que mis preguntas son las siguientes:

  1. ¿Por qué, desde un punto de vista intuitivo, deberíamos esperar que los conos estén profundamente relacionados con conjuntos de ceros de ecuaciones algebraicas de grado 2?

y más en general:

  1. ¿Hay alguna razón profunda por la que "2" sea tan especial? A menudo he escuchado la broma de que "las matemáticas tratan de convertir cosas confusas en álgebra lineal" porque el álgebra lineal es "la única materia que los matemáticos comprenden completamente"; pero parece que también entendemos muchas cosas buenas sobre las cuadráticas: tenemos la relación antes mencionada con los conos, una comprensión completa de los puntos racionales y el teorema de Pitágoras (¡oh! y acabo de pensar en la reciprocidad cuadrática).

También es interesante notar que muchas ecuaciones en física están relacionadas con 2 (la segunda derivada), aunque eso puede ser exagerado. ¡Aprecio cualquier idea que comparta!

Respuestas

80 QiaochuYuan Jan 05 2021 at 13:14

¡Un cono en sí mismo es cuadrático! Solo en tres variables en lugar de dos. Más precisamente, las superficies cónicas son " hiperboloides degenerados ", como

$$x^2 + y^2 - z^2 = 0.$$

Tomar secciones cónicas corresponde a intersecar un cono con un plano $ax + by + cz = d$, lo que equivale a reemplazar una de las tres variables con una combinación lineal de las otras dos más una constante, lo que produce una cuadrática en dos variables. La más fácil de ver es que si$z$ es reemplazado por una constante $r$ entonces tenemos un circulo $x^2 + y^2 = r^2$ (que es como se puede llegar a la ecuación anterior; un cono es una forma cuya rebanada en $z = \pm r$ es un círculo de radio $r$). Similarmente si$x$ o $y$ se reemplaza por una constante, obtenemos una hipérbola.

No sé si tengo una imagen completa que presentar sobre por qué las cuadráticas son mucho más fáciles de entender que las cúbicas y demás. Quizás lo más simple de decir es que las formas cuadráticas están estrechamente relacionadas con las matrices cuadradas (simétricas)$M$, ya que se pueden escribir $q(x) = x^T M x$. Y tenemos muchas herramientas para comprender las matrices cuadradas, todas las cuales se pueden utilizar para comprender las formas cuadráticas, por ejemplo, el teorema espectral . Los objetos correspondientes para formas cúbicas es un grado$3$ tensor que es más difícil de analizar.

Tal vez una forma bastante tonta de decirlo es que $2$ es especial porque es el entero positivo más pequeño que no es igual a $1$. Entonces, las cuadráticas son las cosas más simples que no son lineales y así sucesivamente.

13 fleablood Jan 05 2021 at 13:48

¿Qué es un cono?

Es un sólido de modo que cada sección transversal perpendicular a su eje central es un círculo, y los radios de estos círculos de sección transversal son proporcionales a la distancia desde el vértice del cono.

Y eso es. la superficie del cono son los puntos$(x,y,z)$ dónde $z = h= $ la altura de la sección transversal $= r = $el radio de la sección transversal. Y$(x,y)$ son los puntos del círculo con radio $r = h = z$.

Como la ecuación de un círculo es $\sqrt{x^2 +y^2} = r$ o $x^2 + y^2 = r^2$ la ecuación de un cono es $x^2 + y^2 = z^2$.

Cada sección cónica es una cuestión que cruza el cono con un plano. Un plano es una restricción de las tres variables relacionadas por restricción$ax +by + cz= k$ y eso es cuestión de expresar cualquier tercera variable como una combinación lineal de las otras dos.

Entonces, la sección transversal de un plano y un cono será una derivación de la ecuación de 2 grados $x^2 = y^2 = z^2$donde una de las variables será una combinación lineal de las otras dos. Es decir, una ecuación de segundo grado con dos variables.

Y eso es todo lo que hay que hacer.

Por supuesto, la verdadera pregunta es por qué la ecuación de un círculo $x^2 + y^2 =r^2$? y ¿por qué es esa una representación tan importante de una ecuación de segundo grado?

Y eso se debe enteramente al teorema de Pitágoras. Si tomamos algún punto$(x,y)$ en un avión y considere los tres puntos $(x,y), (x,0)$ y $(0,0)$ellos para los tres vértices de un triángulo rectángulo. Los catetos de este triángulo son de longitudes$x$ y $y$ y por lo tanto, según el teorema de Pitágoras, la hipotenusa tendrá longitud $\sqrt{x^2 + y^2}=h$ y esa es la distancia de $(x,y)$ a $(0,0)$.

Ahora, un círculo es la colección de puntos donde la distancia desde $(x,y)$ a $(0,0)$ es el valor constante $r = h$. Y así serán todos los puntos$(x,y)$ dónde $\sqrt{x^2 + y^2} =r$.

Y eso es. Por eso: las distancias están relacionadas con los triángulos rectángulos, los triángulos rectángulos están relacionados con las ecuaciones de segundo grado, los círculos están relacionados con las distancias, los conos están relacionados con los círculos y todos están relacionados con las ecuaciones de segundo grado.

Eso es todo.

7 The_Sympathizer Jan 06 2021 at 00:26

La razón aproximada es que los conos se basan en círculos y los círculos, a su vez, están dados por la ecuación cuadrática

$$x^2 + y^2 = r^2$$

. Ahora bien, en cuanto a la razón por la que los círculos tienen esta ecuación, es porque están relacionados con la función de distancia euclidiana, siendo el conjunto de todos los puntos a una distancia constante de un centro dado, aquí convencionalmente tomado como origen. En particular,

$$d(P, Q) = \sqrt{|Q_x - P_x|^2 + |Q_y - P_y|^2}$$

En la medida en que la métrica euclidiana tiene esta forma, diría que se reduce a lo siguiente. Para obtener un poco más de información sobre esto, es útil considerar la forma algo más general de métricas

$$d_p(P, Q) := \left(|Q_x - P_x|^p + |Q_y - P_y|^p\right)^{1/p}$$

llamó al $p$-métricas que, en efecto, resultan de preguntar "bueno, ¿qué pasa si dejamos que la potencia no sea ​​2?", y por lo tanto son las adecuadas para responder esta pregunta.

Y resulta que $d_2$Tiene una propiedad muy especial. Es el único para el que puede tomar un objeto geométrico, declarar un punto en él como un pivote, luego tomar cualquier otro punto en ese objeto y etiquetarlo, medir la distancia desde el pivote hasta el punto de la etiqueta, y ahora transformar ese objeto de tal manera, el centro permanece fijo, mientras que el punto de la etiqueta se orienta en una dirección diferente a la misma distancia y, sin embargo, el tamaño y la forma general del objeto permanecen sin cambios. O, para decirlo de otra manera, que algo como "rotación" tiene sentido geométrico como movimiento rígido.

Entonces, ¿cuál es la razón fundamental por la que los conos son cuadráticos? Porque en el espacio euclidiano, puede rotar las cosas de la forma que desee sin cambiar su tamaño y forma.

5 Kapil Jan 06 2021 at 09:25

Existe un artículo de David Mumford que puede ser difícil de leer dependiendo de su nivel de preparación.

La esencia de ese artículo es decir que cualquier sistema de ecuaciones polinomiales se puede reemplazar (agregando más variables y más ecuaciones) a un sistema de ecuaciones cuadráticas y lineales.

Probablemente se pueda generalizar esto aún más para mostrar que si el sistema polinomial tiene parámetros, entonces se puede asegurar que estos parámetros solo aparezcan en las ecuaciones lineales.

El primer caso muy especial de esto es el que ha mencionado.

2 KCd Jan 06 2021 at 05:49

Una razón por la que "2" es especial para la física es la segunda ley de Newton, que relaciona la fuerza con la aceleración (no la velocidad) y esa es una segunda derivada. Bueno, también está el papel del "2" en las leyes del cuadrado inverso.

La razón por la que "2" es especial en geometría a través de formas cuadráticas en varias variables es que las formas cuadráticas en varias variables tienen algunas propiedades agradables.

  1. Cada forma cuadrática se puede diagonalizar para eliminar todos los términos cruzados, por lo que puede centrarse en el caso de las formas cuadráticas diagonales $a_1x_1^2 + \cdots + a_nx_n^2$. (Estrictamente hablando, esto no es cierto para las formas cuadráticas sobre campos de características$2$, pero no obtienes la intuición geométrica de la característica $2$.) En contraste con eso, las formas cúbicas pueden no ser capaces de diagonalizarse, incluso sobre $\mathbf C$. Por ejemplo, la forma cúbica$y^2z - x^3 + xz^2$ (cuyo conjunto de cero en forma deshomogeneizada viene dado por la ecuación $y^2 = x^3 - x$) no se puede diagonalizar sobre $\mathbf C$: mira mis comentarios aquí
  1. Toda forma cuadrática no singular tiene un gran grupo de automorfismos gracias a la construcción de reflejos. Se llama grupo ortogonal de la forma cuadrática. En contraste con eso, el "grupo ortogonal" de un polinomio homogéneo de grado superior$f(\mathbf x)$ (eso significa el grupo de transformaciones lineales $A$ preservando el polinomio: $f(A\mathbf x) = f(\mathbf x)$) es a menudo finito, por ejemplo, las únicas isometrías de $x_1^n + \cdots + x_n^n$ para $n \geq 3$ son permutaciones de coordenadas y multiplicar coordenadas por $n$las raíces de la unidad.

  2. Fundamental para la geometría es el concepto de ortogonalidad, que desea que sea una relación bilineal simétrica: $v \perp w$ si y solo si $w \perp v$, y si $v \perp w$ y $v \perp w'$ entonces $v \perp (ax + a'w')$ para todos los escalares $a$ y $a'$. Esto sugiere mirar formas bilineales$B(v,w)$ en un espacio vectorial y preguntando cuándo la relación $B(v,w) = 0$ (una versión abstracta de "$v \perp w$") es simétrico. Resulta que esto sucede si y solo si $B$es simétrico o alterno. El primer caso es, fuera de la característica$2$, estrechamente relacionado con el estudio de la forma cuadrática $Q(v) = B(v,v)$.

2 Peter Jan 07 2021 at 14:03

El número de índice 2 es especial en relación con la forma en que los ángulos se pueden definir a partir de distancias.

Hay muchas funciones de distancia posibles (normas) que se pueden definir, pero la mayoría de ellas no permiten definir los ángulos de manera coherente. Los ángulos se definen a partir de un producto interno (producto escalar) y este solo se define si la norma obedece a la expresión cuadrática$$||u+v||^2+||u-v||^2=2||u||^2+2||v||^2$$ para cualquier vector $u$ y $v$.

En un espacio con una norma diferente hay menos rotaciones. Puede haber solo un número finito de posibles rotaciones de un círculo o una esfera. Un "cono" en 3d$(x,y,z)$ definido por $||x+y||=||z||$ todavía puede ser intersecado por planos y una familia de curvas (no cuadráticas) encontradas.

En la geometría habitual se definen ángulos, por lo que existe una expresión cuadrática que debe ser satisfecha por las longitudes.