O que cones têm a ver com quadráticas? Por que 2 é especial?
Eu sempre fui importunado sobre as duas definições de seções cônicas extremamente não obviamente relacionadas (isto é, parece tão misterioso / mágico que de alguma forma as fatias de um cone estão relacionadas a equações de grau 2 em 2 variáveis). Recentemente, encontrei as seguintes páginas / vídeos:
- Este vídeo 3B1B sobre elipses , que reacendeu meu desejo de entender as cônicas
- Por que as equações quadráticas são iguais às seções cônicas circulares retas? , que oferece uma abordagem bastante computacional para tentar resolver esta questão
- Outro vídeo 3B1B sobre a visualização de triplos pitagóricos (ou seja, encontrar os pontos racionais de um círculo)
- e a palestra de Manjul Bhargava sobre a conjectura de Birch-Swinnerton-Dyer , onde minutos ~ 10-15 discutem a solução completa para os problemas de pontos racionais em cônicas.
Embora o vídeo de 3B1B faça muito sentido e seja muito bonito do ponto de vista geométrico, ele não fala sobre nenhuma das outras cônicas, nem discute a relação com o "grau 2". Além disso, o segundo vídeo 3B1B que vinculei e, em seguida, a palestra de Bhargava destaca "grau 2" como algo que entendemos bem, em comparação com graus mais elevados (me lembra um pouco do último teorema de Fermat e a inexistência de soluções para$n>2$)
Então, suponho que minhas perguntas sejam as seguintes:
- Por que, de um ponto de vista intuitivo, deveríamos esperar que os cones estivessem profundamente relacionados com conjuntos de zero de equações algébricas de grau 2?
e mais geralmente:
- Existe alguma razão profunda pela qual "2" é tão especial? Já ouvi muitas vezes a piada de que "matemática é transformar coisas confusas em álgebra linear" porque a álgebra linear é "o único assunto que os matemáticos entendem completamente"; mas parece que também entendemos muitas coisas boas sobre quadrática - temos a relação mencionada com cones, uma compreensão completa dos pontos racionais e o teorema de Pitágoras (oh! e acabei de pensar na reciprocidade quadrática).
Também é interessante notar que muitas equações em física estão relacionadas a 2 (a segunda derivada), embora isso possa ser um exagero. Agradeço todas as ideias que você compartilhar!
Respostas
O próprio cone é um quadrático! Apenas em três variáveis, em vez de duas. Mais precisamente, as superfícies cônicas são " hiperbolóides degenerados ", como
$$x^2 + y^2 - z^2 = 0.$$
Tirar seções cônicas corresponde à intersecção de um cone com um plano $ax + by + cz = d$, o que equivale a substituir uma das três variáveis por uma combinação linear das outras duas mais uma constante, o que produz uma quadrática em duas variáveis. O mais fácil de ver é que se$z$ é substituído por uma constante $r$ então nós temos um círculo $x^2 + y^2 = r^2$ (que é como você pode chegar à equação acima; um cone é uma forma cuja fatia em $z = \pm r$ é um círculo de raio $r$) Da mesma forma se$x$ ou $y$ é substituído por uma constante, obtemos uma hipérbole.
Não sei se tenho um quadro completo para apresentar sobre por que os quadráticos são tão mais fáceis de entender do que os cúbicos e assim por diante. Talvez a coisa mais simples de dizer é que as formas quadráticas estão intimamente relacionadas às matrizes quadradas (simétricas)$M$, uma vez que podem ser escritos $q(x) = x^T M x$. E nós temos muitas ferramentas para entender matrizes quadradas, todas as quais podem então ser utilizadas para entender formas quadráticas, por exemplo, o teorema espectral . Os objetos correspondentes para formas cúbicas são um grau$3$ tensor que é mais difícil de analisar.
Talvez uma maneira bem boba de dizer isso $2$ é especial porque é o menor inteiro positivo que não é igual a $1$. Portanto, quadráticas são as coisas mais simples que não são lineares e assim por diante.
O que é um cone?
É um sólido de forma que cada seção transversal perpendicular ao seu eixo central é um círculo, e os raios dessas seções transversais são proporcionais à distância do vértice do cone.
E é isso. a superfície do cone são os pontos$(x,y,z)$ Onde $z = h= $ a altura da seção transversal $= r = $o raio da seção transversal. E$(x,y)$ são os pontos do círculo com raio $r = h = z$.
Como a equação de um círculo é $\sqrt{x^2 +y^2} = r$ ou $x^2 + y^2 = r^2$ a equação de um cone é $x^2 + y^2 = z^2$.
Cada seção cônica é uma questão que cruza o cone com um plano. Um plano é uma restrição das três variáveis a serem relacionadas por restrição$ax +by + cz= k$ e isso é uma questão de expressar qualquer terceira variável como uma combinação linear das outras duas.
Portanto, a seção transversal de um plano e cone será uma derivação da equação de 2 graus $x^2 = y^2 = z^2$onde uma das variáveis será uma combinação linear das outras duas. Em outras palavras, uma equação de segundo grau com duas variáveis.
E isso é tudo que há para fazer.
Claro que a verdadeira questão é por que a equação de um círculo $x^2 + y^2 =r^2$? e por que essa é uma representação tão importante de uma equação de segundo grau?
E isso se deve inteiramente ao teorema de Pitágoras. Se tomarmos qualquer ponto$(x,y)$ em um avião e considere os três pontos $(x,y), (x,0)$ e $(0,0)$eles para os três vértices de um triângulo retângulo. As pernas deste triângulo são compridas$x$ e $y$ e, portanto, pelo teorema de Pitágoras, a hipotenusa terá comprimento $\sqrt{x^2 + y^2}=h$ e essa é a distância de $(x,y)$ para $(0,0)$.
Agora, um círculo é a coleção de pontos onde a distância de $(x,y)$ para $(0,0)$ é o valor constante $r = h$. E assim serão todos os pontos$(x,y)$ Onde $\sqrt{x^2 + y^2} =r$.
E é isso. É por isso: distâncias estão relacionadas a triângulos retângulos, triângulos retângulos estão relacionados a equações de 2º grau, círculos estão relacionados a distâncias, cones estão relacionados a círculos e todos eles estão relacionados a equações de 2º grau.
É isso aí.
O motivo aproximado é que os cones são baseados em círculos , e os círculos, por sua vez, são dados pela equação quadrática
$$x^2 + y^2 = r^2$$
. Ora, quanto aos círculos terem esta equação, é porque estão relacionados com a função distância euclidiana, sendo o conjunto de todos os pontos a uma distância constante de um determinado centro, aqui convencionalmente tomado como origem. Em particular,
$$d(P, Q) = \sqrt{|Q_x - P_x|^2 + |Q_y - P_y|^2}$$
Quanto ao porquê da métrica euclidiana ter essa forma, eu diria que se resume ao seguinte. Para obter mais informações sobre isso, é útil considerar a forma um pouco mais geral de métricas
$$d_p(P, Q) := \left(|Q_x - P_x|^p + |Q_y - P_y|^p\right)^{1/p}$$
Chamou o $p$-metria que, na verdade, resulta da pergunta "bem, o que acontece se deixarmos a potência não ser 2?" e, portanto, é a certa para responder a essa pergunta.
E acontece que $d_2$tem uma propriedade muito especial. É o único para o qual você pode pegar um objeto geométrico, declarar um ponto nele como um pivô, em seguida, pegar qualquer outro ponto naquele objeto e marcá-lo, medir a distância do pivô ao ponto de marcação e agora transformar esse objeto desta forma, o centro permanece fixo, enquanto o ponto da etiqueta fica voltado para uma direção diferente na mesma distância, e ainda assim o tamanho e a forma geral do objeto permanecem inalterados. Ou, em outras palavras, que algo como "rotação" faz sentido geométrico como sendo um movimento rígido.
Então, qual é a razão final pela qual os cones são quadráticos? Porque no espaço euclidiano, você pode girar as coisas da maneira que quiser, sem alterar seu tamanho e forma.
Existe um artigo de David Mumford que pode ser difícil de ler dependendo do seu nível de preparação.
A essência desse artigo é dizer que qualquer sistema de equações polinomiais pode ser substituído (adicionando mais variáveis e mais equações) a um sistema de equações quadráticas e lineares.
Provavelmente, pode-se generalizar isso ainda mais para mostrar que se o sistema polinomial tem parâmetros, então pode-se garantir que esses parâmetros apareçam apenas nas equações lineares.
O caso inicial muito especial disso é o que você mencionou.
Um motivo pelo qual "2" é especial para a física é a segunda lei de Newton, que relaciona a força à aceleração (não a velocidade) e essa é uma segunda derivada. Bem, há também o papel de "2" nas leis do quadrado inverso.
A razão de "2" ser especial na geometria por meio de formas quadráticas em várias variáveis é que as formas quadráticas em várias variáveis têm algumas propriedades interessantes.
- Cada forma quadrática pode ser diagonalizada para remover todos os termos cruzados, então você pode se concentrar no caso de formas quadráticas diagonais $a_1x_1^2 + \cdots + a_nx_n^2$. (Estritamente falando, isso não é verdade para formas quadráticas sobre campos de características$2$, mas você não obtém intuição geométrica de características $2$.) Em contraste com isso, as formas cúbicas podem não ser diagonalizadas, mesmo sobre $\mathbf C$. Por exemplo, a forma cúbica$y^2z - x^3 + xz^2$ (cujo conjunto de zero na forma desomogenizada é dado pela equação $y^2 = x^3 - x$) não pode ser diagonalizado sobre $\mathbf C$: veja meus comentários aqui
Cada forma quadrática não singular possui um grande grupo de automorfismos graças à construção de reflexos. É chamado de grupo ortogonal da forma quadrática. Em contraste com isso, o "grupo ortogonal" de um polinômio homogêneo de alto grau$f(\mathbf x)$ (isso significa o grupo de transformações lineares $A$ preservando o polinômio: $f(A\mathbf x) = f(\mathbf x)$) é frequentemente finito, por exemplo, as únicas isometrias de $x_1^n + \cdots + x_n^n$ para $n \geq 3$ são permutações de coordenadas e multiplicação de coordenadas por $n$as raízes da unidade.
Fundamental para a geometria é o conceito de ortogonalidade, que você deseja que seja uma relação bilinear simétrica: $v \perp w$ se e apenas se $w \perp v$, e se $v \perp w$ e $v \perp w'$ então $v \perp (ax + a'w')$ para todos os escalares $a$ e $a'$. Isso sugere olhar para formas bilineares$B(v,w)$ em um espaço vetorial e perguntando quando a relação $B(v,w) = 0$ (uma versão abstrata de "$v \perp w$") é simétrico. Acontece que isso acontece se e somente se $B$é simétrico ou alternado. O primeiro caso é, fora da característica$2$, intimamente relacionado ao estudo da forma quadrática $Q(v) = B(v,v)$.
O número de índice 2 é especial em relação à maneira como os ângulos podem ser definidos a partir das distâncias.
Existem muitas funções de distância (normas) possíveis que podem ser definidas, mas a maioria delas não permite que os ângulos sejam definidos de forma consistente. Os ângulos são definidos a partir de um produto interno (produto escalar) e isso só é definido se a norma obedecer à expressão quadrática$$||u+v||^2+||u-v||^2=2||u||^2+2||v||^2$$ para quaisquer vetores $u$ e $v$.
Em um espaço com uma norma diferente, há menos rotações. Pode haver apenas um número finito de rotações possíveis de um círculo ou esfera. Um "cone" em 3D$(x,y,z)$ definido por $||x+y||=||z||$ ainda pode ser interseccionado por planos e uma família de curvas (não quadráticas) encontrada.
Na geometria usual, os ângulos são definidos, então há uma expressão quadrática que deve ser satisfeita por comprimentos.