¿Ejemplos de cálculos del reverso del sobre que conducen a una buena intuición?
Hace algún tiempo, leí acerca de un "enfoque aproximado" de la fórmula de Stirling en Street Fighting Mathematics de M.Sanjoy . En resumen, el libro utilizó una heurística de estimación integral de espectroscopía
$$\int_{\mathbb{R_{\ge 0}}} f(x) dx \approx \max(f) * (\text{point where}\ \frac{1}{2} \max(f)\ \text{is achieved}) $$
para estimar la función Gamma con $f(x) = f_t(x) = x^{t}e^{-x} $. Esto conduce a la estimación
$$\Gamma(n) = \int_{\mathbb{R}_{\ge 0}} x^{n}e^{-x} dx \approx \sqrt{8 n} \left(\frac{n}{e}\right)^n$$
que es una estimación extremadamente buena (la "constante de proporcionalidad" $\sqrt{8}$ es correcta dentro del 10% con el orden correcto de crecimiento). Esta heurística fue muy útil para comprender el crecimiento de la fórmula real $\Gamma(n) \approx \sqrt{2\pi n} \left(\frac{n}{e}\right)^n$.
Creo que las aproximaciones de este tipo son útiles porque
- Da una idea de cuál "debería" ser la respuesta.
- Cuando la aproximación se desvía de la respuesta real, es interesante pensar en qué parte de la aproximación falló.
Otro "cálculo del reverso del sobre" es el cálculo del Teorema de los números primos en Courant y Robbins, ¿Qué son las matemáticas?
Mi pregunta. Estoy buscando casos similares en matemáticas donde los "cálculos del reverso del sobre" como el anterior conduzcan a una buena intuición en matemáticas.
Para el propósito de mi pregunta, exijamos que el cálculo aborde preguntas en matemáticas puras (por lo tanto, nada de física, ingeniería, etc., ya que parece que ya hay mucha literatura sobre esto).
Editar: según los útiles comentarios de Peter LeFanu Lumsdaine, eliminé dos requisitos: "No requiere nada más allá, digamos matemáticas de pregrado" y "No se formaliza en una prueba rigurosa".
Edición 2 (según la útil discusión en los comentarios): parte de lo que me interesa es cómo la gente usa varias técnicas para calcular / aproximar objetos de interés. Por ejemplo, creo que todos podemos estar de acuerdo en que el uso de la aproximación integral demostrado anteriormente es bastante creativo (si no, una forma no estándar de acercarse a Stirling). En respuesta a Meow, los invariantes topológicos para "similar" (homotopía equivalente, homeomomorfo, etc.) equivalen principalmente al "mismo tipo" de argumento, por lo que lo contaría como "un" argumento de aproximación a menos que haya un ejemplo particular donde la heurística El argumento es muy no trivial.
Respuestas
Aunque requiere un poco más que matemáticas de pregrado, aproximadamente un primer curso en teoría algebraica de números, yo diría que los primeros cálculos de Pomerance para el tamiz de campo numérico general encajan en este marco. Aquí hay una cita de su artículo de 1996 en Notices of the AMS (en la mitad de la página 1480):
[el tamiz de campo numérico para] números generales? En el verano de 1989 iba a dar una charla en la reunión de la Asociación Canadiense de Teoría de Números ... En el avión camino a la reunión hice un análisis de complejidad del método sobre cómo funcionaría para números generales, suponiendo que no existieran innumerables dificultades técnicas ... estaba asombrado. La complejidad de este algoritmo que todavía no existía tenía la forma$\exp\bigl(c(\log n)^{1/3}(\log\log n)^{2/3}\bigr)$. ... ¡Claramente este método merecía una seria reflexión! No quiero dar la impresión de que con este análisis de complejidad, por mi cuenta, había encontrado una manera de aplicar el tamiz de campo numérico a compuestos generales. Lejos de ahi. Simplemente tuve un atisbo de emocionantes posibilidades para el futuro
Encontrar la primitiva del logaritmo
Encontrar una primitiva equivale a calcular una integral. Calcular una integral equivale a medir el área bajo una curva. ¿Cuál es el área bajo la curva de$\ln$? Queremos calcular el valor:$$\int_1^x \ln(t) \text{d}t$$
¿Qué sabemos sobre la función? $\ln$? Sabemos que el logaritmo es una función creciente que va al infinito, y sabemos que el logaritmo es una función "lenta".
¿Cómo se traduce "lento" en la parte posterior de un cálculo de envolvente y cómo nos ayuda a estimar el área bajo la curva?
En el reverso de nuestro sobre, escribiremos lo siguiente: la curva de $\ln$es plano . Es una línea horizontal.

La curva es tan plana que podemos decir: para una gran $x$, para casi todos los valores $x_2 < x$, $\ln(x_2) \approx \ln(x)$. En otras palabras, la gráfica de$\ln$ se compone de dos partes:
- una línea vertical corta que va desde $\ln(1) = 0$ a $\ln(1+\varepsilon) = \ln(x)$;
- una larga línea horizontal que va desde $\ln(1+\varepsilon) = \ln(x)$ a $\ln(x) = \ln(x)$.
Calcular el área debajo de la curva se vuelve fácil: es el área de un rectángulo. Así:$$\int_1^x \ln(t) \text{d}t \approx x \ln(x)$$
¡Tenemos un candidato para nuestro primitivo! Un posible primitivo para$\ln$ es función $F$ dada por: $F(x) = x \ln(x)$.
¿Qué tan cerca estuvo nuestra aproximación? Podemos comprobar nuestro resultado tomando la derivada de$F$: $$F'(x) = \ln(x) + 1$$
¡Estamos fuera por un término constante! Los términos constantes se eliminan fácilmente. Una primitiva correcta de$\ln$ es función $G$ dada por: $$G(x) = x \ln(x) - x$$
La "prueba" probabilística de Knuth de la fórmula de la longitud del gancho podría calificar, aunque no es una aproximación como tal.
Aquí tenemos una partición $\lambda$ de $n$. Recuerda un cuadro de forma estándar de Young$\lambda$ es un llenado de las casillas del diagrama de Ferrers de $\lambda$ con los numeros $1, \dots, n$de manera que las entradas en cada fila y columna aumentan cuando se leen de izquierda a derecha y de arriba a abajo, respectivamente. El gancho de una caja es el conjunto de cajas a la derecha o debajo de la caja, incluida la caja misma. Escribir$h(b)$ por el número de cajas en el gancho de una caja $b$. Claramente, un relleno es estándar si y solo si la entrada en cada caja es la más pequeña en el gancho de esa caja. Ahora hay$n!$ formas de llenar las casillas con los números $1, \dots, n$ y si elegimos tal relleno al azar, la probabilidad de que el cuadro $b$ contiene la entrada más pequeña en su gancho es claramente $1/h(b)$. Ingenuamente, podríamos concluir de esto que la probabilidad de que el relleno sea estándar es el producto de estos recíprocos de longitudes de gancho y, por lo tanto, el número de cuadros estándar es$$|\mathrm{SYT}(\lambda)| = \frac{n!}{\prod_b h(b)}$$pero, por supuesto, estos eventos no son independientes, por lo que es ilegítimo simplemente multiplicar sus probabilidades de esta manera. A pesar de esto, ¡la fórmula es exactamente correcta!
Creo que el argumento de Flory para el exponente del desplazamiento cuadrático medio para la caminata autodirigida (SAW) califica como un cálculo al revés que es sorprendentemente bueno. Dejar$\omega(n)$ ser la posición después $n$ pasos de la SIERRA comenzando en el origen, en la celosía $\mathbb{Z}^d$ (o alguna otra celosía como la hexagonal en $d=2$). Un simple argumento termodinámico de Flory (ver, por ejemplo, la página 6 de estas notas ) con respecto a la física de las cadenas de polímeros da la predicción$$ \mathbb{E}\ |\omega(n)|^2\ \simeq C\ n^{2\nu} $$ cuando $n\rightarrow\infty$ con $$ \nu=\frac{3}{d+2}\ . $$Puede que al OP no le guste esto ya que esto podría verse como "física" y no como "matemáticas puras", pero creo que el estudio riguroso de estas asintóticas (ver, por ejemplo, estas diapositivas ) es una matemática muy dura y muy pura.
Teorema de Minkowski
La fórmula de suma de Poisson escribe $$\sum_{n \in \mathbb Z^n} \phi(n) = \sum_{n \in \mathbb Z^n} \widehat{\phi}(n)$$
dónde $\hat{\phi}$ es la transformada de Fourier de $\phi$. Echemos$\phi = \mathbf 1_A$ la función característica de un conjunto $A$. Bien, se espera que el resultado sea$$ |A \cap \mathbb Z^n| = \sum_{x \in \mathbb Z^n} \mathbf{1}_A(x) = \sum_{x \in \mathbb Z^n} \widehat{\mathbf{1}_A}(x) \geqslant \widehat{\mathbf{1}_A}(0) = \mathrm{vol}(A), $$ y esto probaría que hay dos puntos distintos de la celosía $\mathbb Z^n$ en $A$ Tan pronto como $\mathrm{vol}(1)>1$: esta es la idea del teorema de Minkowski . Por supuesto,$\mathbf 1_A$no es una función admisible en la fórmula de suma de Poisson y esta idea debe ser modificada un poco. Al hacerlo, nos damos cuenta de que debemos asumir algunas propiedades agradables en$A$ (es decir, convexo y simétrico) y que el volumen tiene que ser un poco mayor (a saber. $2^n$).
Fórmulas de seguimiento
De manera más general, las fórmulas de trazas disfrutan mucho de estas heurísticas. Son igualdades distributivas de la forma$$\sum_{\lambda \in \mathrm{spec}} \phi(\lambda) = \sum_{\lambda \in \mathrm{geom}} \widehat{\phi}(\lambda)$$ donde la suma de la izquierda corre sobre términos "espectrales" (por ejemplo, formas automórficas, valores propios del laplaciano), la suma de la derecha sobre "términos geométricos" (por ejemplo, geodésicas, clases de conjugación) y $\hat{\phi}$ es una transformada integral explícitamente definida de $\phi$. Se utilizan en particular para establecer resultados en promedio, y el uso (ilegal) de funciones características en un lado a menudo le da el término principal correcto al estimar el término trivial en el otro lado (de manera similar a la$0 \in \mathbb Z^n$encima). Dos ejemplos sobre una superficie compacta$S$:
- si toma la función característica en el lado espectral, adivina la ley de Weyl contando los valores propios del laplaciano$\Delta$: $$|\{\lambda \in \mathrm{spec}(\Delta) \ : \ |\lambda| \leqslant X\}| \sim \frac{\mathrm{vol}(S)}{4\pi}X$$
- si toma la función característica en el lado geométrico, adivina el teorema geodésico principal contando las geodésicas cerradas de longitud limitada$\ell$ en $S$: $$|\{\gamma \text{ geodesic on } S \ : \ \exp(\ell(\gamma)) \leqslant X\}| \sim \mathrm{li}(X)$$
El alcance de estas ideas en geometría, teoría de números, formas automórficas, teoría espectral, etc. es impresionante, y estos cálculos del reverso de la envolvente son una guía sólida y confiable. (y, por supuesto, convertir estas heurísticas en pruebas es otro asunto)
Hay una parte posterior de un cálculo envolvente de Beckenstein al pensar cómo el área de un agujero negro se puede interpretar como una medida de entropía, y la suposición subyacente es que las leyes de la termodinámica son correctas.
Después de un cálculo más completo de Stephen Hawkings usando QFT en variedades curvas, un cálculo semiclásico, sabemos que estaba en lo correcto hasta un factor de proporcionalidad. El cálculo se menciona en Leonard Susskinds The Black Hole Wars: My Battle to Make The World Safe for Quantum Mechanics , un libro popular.
Newton hizo un tipo diferente de cálculo del reverso del sobre cuando Johann Bernoulli describió como un desafío el problema de Brachistochrone en 1696 en el Acta Eruditorium , dejando seis meses para una solución. Al no recibir ninguno, amplió el plazo un año más a petición de Leibniz. Poco después, Newton descubrió el problema después de regresar a casa de la casa de la moneda, se quedó despierto toda la noche para resolverlo y envió la solución por correo postal de forma anónima. Por qué, no tengo ni idea. Cuando Bernoulli vio la solución reconoció quién debía ser su autor y dijo:
Reconocemos a un león por sus marcas de garras.
Johann Bernoulli ya había resuelto el problema antes de ponerlo. Al parecer, le había llevado dos semanas resolverlo.
También hay una anécdota de Feynman en la que hizo una secuencia de cálculos rápidos cuando se enfrentó a un filósofo y sus estudiantes "adoradores" que le hicieron una secuencia de preguntas puntuales. No recuerdo los detalles ahora, pero dejaré esto como un marcador de posición hasta que lo haga.
Un cálculo no necesita ser numérico, podría ser algebraico: y uno de esos fue hecho por Peierls en su nota de 16 páginas que mostraba cómo definir un conmutador covariante en QFT a diferencia del conmutador de tiempos iguales que se usa con tanta frecuencia en QFT. De Witt llamó a esto el conmutador global.
El argumento de Peierls (1936) a favor de una transición de fase de primer orden en el modelo de Ising a una temperatura suficientemente baja se escribió originalmente en la línea de un cálculo no riguroso al revés. Creo que Dobrushin visitó a Peierls unos 20 años después para discutir su breve argumento en un intento exitoso de convertirlo en una base rigurosa para las transiciones de fase de primer orden en modelos de celosía que carecen de una simetría continua: esta línea luego evolucionó hacia la teoría de Pirogov-Sinaí. En cualquier caso, el argumento de Peierls es muy intuitivo y, en mi opinión, uno puede abandonar la creencia cruda de que "las funciones de partición de los sistemas finitos son analíticas, por lo que no hay transición de fase en el tamaño del sistema finito. Esta analiticidad probablemente se traslada al límite termodinámico "sin problemas de conciencia después de conocer este argumento.
No dude en editar esta publicación para completar la historiografía y obtener todas las anécdotas correctas.
Inspirado por la respuesta de Stef , aquí hay una idea que puede o no encajar en la factura. (Especialmente la versión anterior que pedía materiales que no iban más allá de las matemáticas de pregrado ...)
En un primer curso de cálculo, suponga que está tratando de encontrar la derivada de una función parabólica
$$f: x \mapsto ax^2 + bx + c$$
dónde $a,b,c \in \mathbb{R}$ y $a > 0$para simplificar la presentación aquí. Por "derivada" me refiero a una función de valor real tal que conecte una$x$-valor $p$ y obtenga como salida la pendiente de la recta tangente a la curva $f$ en el punto $(p, f(p))$.
Mirando la gráfica de la parábola, podemos ver que las rectas tangentes tienen pendiente que tiende al infinito negativo a la izquierda, al infinito positivo a la derecha y cero en el vértice. La intuición aquí comienza con, la función más simple para mi mente que va del infinito negativo al infinito positivo mientras pasa por cero una vez es una función lineal.
Además, sabemos por el álgebra de la escuela secundaria que el vértice de dicha parábola está en $h = -\frac{b}{2a}$.
Qué función lineal envía $h \rightarrow 0$? Una idea es simplemente agregarle su inverso aditivo (una comprobación de intuición indica que esto no funcionará); otra idea es simplemente multiplicar por cero (de nuevo: una comprobación de intuición indica que esto no funcionará); y luego está esta idea: limpiar el denominador y usar el inverso aditivo del numerador.
por $-\frac{b}{2a} \rightarrow 0$, esto significa multiplicar por $2a$ y luego agregando $-(-b)$. En particular, es la función lineal:
$$x \mapsto 2ax + b$$
que, de hecho, es la salida deseada para $f'$.
Si esta idea le interesa a alguien, entonces tengo un artículo más extenso en una revista de educación matemática; puede encontrar ese artículo, sin muro de pago, aquí: Mirada hacia atrás para apoyar la resolución de problemas ( profesor de matemáticas ).
Los argumentos de escala son extremadamente útiles en análisis, PDE y análisis geométrico. Un ejemplo sencillo son las desigualdades de Gagliardo-Nirenberg, que tienen la forma$$ \left(\int_{\mathbb{R}^n} |f|^a\,dx\right)^{\alpha}\left(\int_{\mathbb{R}^n}|f|^b\,dx\right)^{\beta} \le C\left(\int_{\mathbb{R}^n} |\nabla f|^c\,dx\right)^{\gamma} $$ Los dos lados deben escalar de la misma manera en las recalificaciones de ambos $f$ y espacio$x \mapsto \lambda x$). Esto te dice exactamente qué ecuaciones deben satisfacer los exponentes. En particular, la invariancia bajo cambio de escala de$f$ implica que $$ a\alpha + b\beta = c\gamma, $$ y el cambio de escala del espacio (es decir, el cambio de variables por una dilatación) implica que $$ n(\alpha +\beta) = (n-c)\gamma. $$ Además, debemos asumir que $a, b, c$ son positivos, $\gamma > 0$, y al menos uno de $\alpha$ y $\beta$ debe ser positivo.
En geometría diferencial, la existencia y la forma de los invariantes del tensor local se pueden identificar mediante la normalización de las coordenadas locales en un punto. Por ejemplo, puede "descubrir" el hecho de que no hay un tensor invariante de primer orden de una métrica de Riemann y "descubrir" el tensor de curvatura de Riemann como el único invariante de segundo orden posible a través de este proceso.
Lo que encuentro hermoso de esto es que, cuando profundizas más, descubres que esto se relaciona estrechamente con la teoría de la representación de $GL(n)$ y cuadros jóvenes.