Exemples de calculs de dos d'enveloppe menant à une bonne intuition?
Il y a quelque temps, j'ai lu une "approche approximative" de la formule de Stirling dans Street Fighting Mathematics de M.Sanjoy . En résumé, le livre a utilisé une heuristique d'estimation intégrale issue de la spectroscopie
$$\int_{\mathbb{R_{\ge 0}}} f(x) dx \approx \max(f) * (\text{point where}\ \frac{1}{2} \max(f)\ \text{is achieved}) $$
pour estimer la fonction Gamma avec $f(x) = f_t(x) = x^{t}e^{-x} $. Cela conduit à l'estimation
$$\Gamma(n) = \int_{\mathbb{R}_{\ge 0}} x^{n}e^{-x} dx \approx \sqrt{8 n} \left(\frac{n}{e}\right)^n$$
ce qui est une très bonne estimation (la "constante de proportionnalité" $\sqrt{8}$ est correcte à 10% près avec un ordre de croissance correct.) Cette heuristique a été très utile pour comprendre la croissance de la formule réelle $\Gamma(n) \approx \sqrt{2\pi n} \left(\frac{n}{e}\right)^n$.
Je pense que des approximations de ce genre sont utiles car
- Cela donne une idée de ce que la réponse «devrait» être.
- Lorsque l'approximation s'écarte de la réponse réelle, il est intéressant de penser à quelle partie de l'approximation a échoué.
Un autre "calcul en arrière-plan" est le calcul du théorème des nombres premiers dans Courant et Robbins, Qu'est-ce que les mathématiques?
Ma question. Je recherche des exemples similaires en mathématiques où des «calculs à l'envers» comme celui ci-dessus conduisent à une bonne intuition en mathématiques.
Pour les besoins de ma question, demandons que le calcul aborde des questions en mathématiques pures (donc, pas de physique, d'ingénierie, etc. car il semble déjà y avoir beaucoup de littérature à ce sujet).
Edit: selon les commentaires utiles de Peter LeFanu Lumsdaine, j'ai supprimé deux exigences: "ne nécessite rien au-delà, disons les mathématiques de premier cycle" et "ne se formalise pas dans une preuve rigoureuse."
Edit 2 (selon la discussion utile dans les commentaires): une partie de ce qui m'intéresse est la façon dont les gens utilisent diverses techniques pour calculer / approximer des objets d'intérêt. Par exemple, je pense que nous pouvons tous convenir que l'utilisation de l'approximation intégrale démontrée ci-dessus est assez créative (sinon, une manière non standard d'approcher Stirling). En réponse à Meow, les invariants topologiques pour «similaire» (homotopie équivalente, homéomomorphe, etc.) équivaut principalement au «même genre» d'argument, donc je compterais cela comme «un» argument d'approximation à moins qu'il n'y ait un exemple particulier où l'heuristique l'argument est hautement non trivial.
Réponses
Bien que nécessitant un peu plus que les mathématiques de premier cycle, à peu près un premier cours de théorie algébrique des nombres, je dirais que les premiers calculs de Pomerance pour le tamis de champ de nombre général s'inscrivent dans ce cadre. Voici une citation de son article de 1996 dans les Notices of the AMS (milieu de la page 1480):
[le tamis de champ numérique pour] les nombres généraux? À l'été 1989, je devais donner une conférence lors de la réunion de l'Association canadienne de la théorie des nombres ... Dans l'avion, en route vers la réunion, j'ai fait une analyse de complexité de la méthode pour savoir comment elle fonctionnerait pour les nombres généraux, en supposant qu'une myriade de difficultés techniques n'existaient pas ... J'étais stupéfaite. La complexité de cet algorithme-qui-n'existait-pas-encore-était de la forme$\exp\bigl(c(\log n)^{1/3}(\log\log n)^{2/3}\bigr)$. ... Clairement, cette méthode méritait une réflexion sérieuse! Je ne souhaite pas donner l'impression qu'avec cette analyse de complexité, j'avais trouvé à moi-même un moyen d'appliquer le tamis de champ numérique aux composites généraux. Loin de là. J'ai simplement eu un aperçu des possibilités passionnantes pour l'avenir
Trouver la primitive du logarithme
Trouver une primitive revient à calculer une intégrale. Le calcul d'une intégrale revient à mesurer l'aire sous une courbe. Quelle est l'aire sous la courbe de$\ln$? Nous voulons calculer la valeur:$$\int_1^x \ln(t) \text{d}t$$
Que savons-nous de la fonction $\ln$? Nous savons que le logarithme est une fonction croissante qui va à l'infini, et nous savons que le logarithme est une fonction "lente".
Comment «lent» se traduit-il au verso d'un calcul d'enveloppe et comment cela nous aide-t-il à estimer l'aire sous la courbe?
Au dos de notre enveloppe, nous écrirons la chose suivante: la courbe de $\ln$est plat . C'est une ligne horizontale.

La courbe est si plate qu'on peut dire: pour un très grand $x$, pour presque chaque valeur $x_2 < x$, $\ln(x_2) \approx \ln(x)$. En d'autres termes, le graphique de$\ln$ est composé de deux parties:
- une courte ligne verticale qui va de $\ln(1) = 0$ à $\ln(1+\varepsilon) = \ln(x)$;
- une longue ligne horizontale qui va de $\ln(1+\varepsilon) = \ln(x)$ à $\ln(x) = \ln(x)$.
Le calcul de l'aire sous la courbe devient facile: c'est l'aire d'un rectangle. Donc:$$\int_1^x \ln(t) \text{d}t \approx x \ln(x)$$
Nous avons un candidat pour notre primitif! Une primitive possible pour$\ln$ est la fonction $F$ donné par: $F(x) = x \ln(x)$.
À quel point notre approximation était-elle proche? Nous pouvons vérifier notre résultat en prenant la dérivée de$F$: $$F'(x) = \ln(x) + 1$$
Nous sommes partis par un terme constant! Les termes constants sont facilement supprimés. Une primitive correcte de$\ln$ est la fonction $G$ donné par: $$G(x) = x \ln(x) - x$$
La «preuve» probabiliste de Knuth de la formule de la longueur de crochet pourrait être qualifiée, bien que ce ne soit pas une approximation en tant que telle.
Ici nous avons une partition $\lambda$ de $n$. Rappeler un tableau de forme Young standard$\lambda$ est un remplissage des cases du diagramme de Ferrers de $\lambda$ avec les chiffres $1, \dots, n$de sorte que les entrées de chaque ligne et colonne augmentent lors de la lecture de gauche à droite et de haut en bas respectivement. Le crochet d'une boîte est l'ensemble des boîtes à droite ou en dessous de la boîte, y compris la boîte elle-même. Écrire$h(b)$ pour le nombre de boîtes dans le crochet d'une boîte $b$. De toute évidence, un remplissage est standard si et seulement si l'entrée dans chaque case est la plus petite du crochet de cette case. Maintenant il y a$n!$ façons de remplir les cases avec les nombres $1, \dots, n$ et si on choisit un tel remplissage au hasard, la probabilité que la case $b$ contient la plus petite entrée dans son crochet est clairement $1/h(b)$. Naïvement, nous pourrions en conclure que la probabilité que le remplissage soit standard est le produit de ces réciproques de longueurs de crochet et donc le nombre de tableaux standard est$$|\mathrm{SYT}(\lambda)| = \frac{n!}{\prod_b h(b)}$$mais bien sûr, ces événements ne sont pas indépendants, il est donc illégitime de simplement multiplier leurs probabilités ainsi. Malgré cela, la formule est tout à fait correcte!
Je pense que l'argument de Flory pour l'exposant pour le déplacement quadratique moyen pour la marche auto-évitée (SAW) se qualifie comme un calcul en arrière-plan qui est étonnamment bon. Laisser$\omega(n)$ être la position après $n$ étapes de la SCIE à partir de l'origine, dans le treillis $\mathbb{Z}^d$ (ou un autre réseau comme celui hexagonal en $d=2$). Un simple argument thermodynamique de Flory (voir, par exemple, page 6 de ces notes ) concernant la physique des chaînes polymères donne la prédiction$$ \mathbb{E}\ |\omega(n)|^2\ \simeq C\ n^{2\nu} $$ quand $n\rightarrow\infty$ avec $$ \nu=\frac{3}{d+2}\ . $$L'OP n'aime peut-être pas cela, car cela pourrait être considéré comme de la «physique» et non comme des «mathématiques pures», mais je pense que l'étude rigoureuse de ces asymptotiques (voir, par exemple, ces diapositives ) est des mathématiques très dures et très pures.
Théorème de Minkowski
La formule de sommation de Poisson écrit $$\sum_{n \in \mathbb Z^n} \phi(n) = \sum_{n \in \mathbb Z^n} \widehat{\phi}(n)$$
où $\hat{\phi}$ est la transformée de Fourier de $\phi$. Prenons$\phi = \mathbf 1_A$ la fonction caractéristique d'un ensemble $A$. En gros, le résultat devrait être$$ |A \cap \mathbb Z^n| = \sum_{x \in \mathbb Z^n} \mathbf{1}_A(x) = \sum_{x \in \mathbb Z^n} \widehat{\mathbf{1}_A}(x) \geqslant \widehat{\mathbf{1}_A}(0) = \mathrm{vol}(A), $$ et cela prouverait qu'il y a deux points distincts du réseau $\mathbb Z^n$ dans $A$ dès que $\mathrm{vol}(1)>1$: c'est l'idée du théorème de Minkowski . Bien sûr,$\mathbf 1_A$n'est pas une fonction admissible dans la formule de sommation de Poisson et cette idée doit être un peu massée. Ce faisant, nous nous rendons compte que nous devons assumer de belles propriétés sur$A$ (à savoir convexe et symétrique) et que le volume doit être un peu plus grand (à savoir. $2^n$).
Formules de trace
Plus généralement, les formules de trace profitent beaucoup de ces heuristiques. Ce sont des égalités distributionnelles de la forme$$\sum_{\lambda \in \mathrm{spec}} \phi(\lambda) = \sum_{\lambda \in \mathrm{geom}} \widehat{\phi}(\lambda)$$ où la somme de gauche passe sur des termes "spectraux" (par exemple formes automorphes, valeurs propres du Laplacien), la somme de droite sur des "termes géométriques" (par exemple géodésiques, classes de conjugaison) et $\hat{\phi}$ est une transformée intégrale explicitement définie de $\phi$. Ils sont notamment utilisés pour établir des résultats en moyenne, et l'utilisation (illégale) de fonctions caractéristiques d'un côté vous donne souvent le bon terme principal lors de l'estimation du terme trivial de l'autre côté (de manière similaire à la$0 \in \mathbb Z^n$au dessus de). Deux exemples sur une surface compacte$S$:
- si vous prenez la fonction caractéristique côté spectral, vous devinez la loi de Weyl en comptant les valeurs propres du laplacien$\Delta$: $$|\{\lambda \in \mathrm{spec}(\Delta) \ : \ |\lambda| \leqslant X\}| \sim \frac{\mathrm{vol}(S)}{4\pi}X$$
- si vous prenez la fonction caractéristique du côté géométrique, vous devinez le théorème géodésique principal comptant les géodésiques fermées de longueur bornée$\ell$ sur $S$: $$|\{\gamma \text{ geodesic on } S \ : \ \exp(\ell(\gamma)) \leqslant X\}| \sim \mathrm{li}(X)$$
L'étendue de ces idées en géométrie, théorie des nombres, formes automorphes, théorie spectrale, etc. est impressionnante, et ces calculs de fond d'enveloppe sont un guide solide et fiable. (et, bien sûr, transformer ces heuristiques en preuves est une autre affaire)
Il y a un calcul d'enveloppe par Beckenstein en pensant comment l'aire d'un trou noir peut être interprétée comme une mesure d'entropie, l'hypothèse sous-jacente étant que les lois de la thermodynamique sont correctes.
Après un calcul plus approfondi de Stephen Hawkings utilisant QFT sur des variétés courbes, un calcul semi-classique, nous savons qu'il était correct jusqu'à un facteur de proportionnalité. Le calcul est mentionné dans Leonard Susskinds The Black Hole Wars: My Battle to Make The World Safe for Quantum Mechanics , un livre populaire.
Un autre type de calcul du dos de l'enveloppe a été fait par Newton lorsque Johann Bernoulli a décrit comme un défi le problème de la brachistochrone en 1696 dans l' Acta Eruditorium , accordant six mois pour une solution. Lorsqu'il n'y en a pas eu, il a prolongé le délai d'un an à la demande de Leibniz. Peu de temps après, Newton a découvert le problème après être rentré de la menthe, est resté debout toute la nuit pour le résoudre et a envoyé la solution par message suivant de manière anonyme. Pourquoi, je n'en ai aucune idée. Quand Bernoulli a vu la solution, il a reconnu qui devait être son auteur et a dit:
Nous reconnaissons un lion à ses griffes.
Johann Bernoulli avait déjà résolu le problème avant de le régler. Apparemment, il lui avait fallu deux semaines pour le résoudre.
Il y a aussi une anecdote de Feynman où il a fait une séquence de calculs rapides quand il a été confronté à un philosophe et à ses étudiants «adorateurs» qui lui ont posé une séquence de questions pointues. Je ne me souviens pas des détails maintenant - mais je laisserai cela comme un espace réservé jusqu'à ce que je le fasse.
Un calcul n'a pas besoin d'être numérique, il pourrait être algébrique: et l'un de ces calculs a été fait par Peierls dans sa note de 16 pages qui montrait comment définir un commutateur covariant dans QFT contrairement au commutateur à temps égal si souvent utilisé dans QFT. De Witt a appelé cela le commutateur global.
L'argument de Peierls (1936) pour une transition de phase du premier ordre dans le modèle d'Ising à une température suffisamment basse a été écrit à l'origine dans la veine d'un calcul non rigoureux du fond de l'enveloppe. Je crois que Dobrushin a rendu visite à Peierls une vingtaine d'années plus tard pour discuter de son bref argument dans une tentative réussie d'en faire une base rigoureuse pour les transitions de phase du 1er ordre dans les modèles de réseau dépourvus de symétrie continue: cette ligne a ensuite évolué vers la théorie de Pirogov-Sinaï. Quoi qu'il en soit, l'argument de Peierls est très intuitif et à mon avis, on peut abandonner la croyance grossière que «les fonctions de partition des systèmes finis sont analytiques, donc il n'y a pas de transition de phase à une taille de système finie. Cette analyticité se prolonge probablement jusqu'à la limite thermodynamique "sans problèmes de conscience après avoir pris connaissance de cet argument.
N'hésitez pas à éditer cet article pour compléter l'historiographie et corriger toutes les anecdotes.
Inspiré par la réponse de Stef , voici une idée qui peut ou non faire l'affaire. (Surtout la version précédente qui demandait des matériaux qui ne vont pas au-delà des mathématiques de premier cycle ...)
Dans un premier cours de calcul, supposons que vous essayez de trouver la dérivée d'une fonction parabolique
$$f: x \mapsto ax^2 + bx + c$$
où $a,b,c \in \mathbb{R}$ et $a > 0$pour la simplicité de présentation ici. Par «dérivé», j'entends une fonction à valeur réelle telle que vous branchez un$x$-valeur $p$ et obtenir en sortie la pente de la ligne tangente à la courbe $f$ à ce point $(p, f(p))$.
En regardant le graphique de la parabole, nous pouvons voir que les droites tangentes ont une pente tendant vers l'infini négatif à gauche, l'infini positif à droite et zéro au sommet. L'intuition ici commence par, la fonction la plus simple à mon avis qui va de l'infini négatif à l'infini positif en passant par zéro une fois est une fonction linéaire.
De plus, nous savons par l'algèbre du lycée que le sommet d'une telle parabole est à $h = -\frac{b}{2a}$.
Quelle fonction linéaire envoie $h \rightarrow 0$? Une idée est simplement d'ajouter son inverse additif (une vérification d'intuition indique que cela ne fonctionnera pas); une autre idée est simplement de multiplier par zéro (encore une fois: un contrôle d'intuition indique que cela ne fonctionnera pas); et puis il y a cette idée: effacer le dénominateur et utiliser l'inverse additif du numérateur.
Pour $-\frac{b}{2a} \rightarrow 0$, cela signifie multiplier par $2a$ puis en ajoutant $-(-b)$. En particulier, c'est la fonction linéaire:
$$x \mapsto 2ax + b$$
qui, en effet, est la sortie souhaitée pour $f'$.
Si cette idée intéresse quelqu'un, alors j'ai un article plus long dans un journal d'éducation mathématique; vous pouvez trouver cet article, sans paywall, ici: Retour sur Support Problem Solving ( Mathematics Teacher ).
Les arguments de mise à l'échelle sont extrêmement utiles dans l'analyse, les PDE et l'analyse géométrique. Un exemple simple est celui des inégalités de Gagliardo-Nirenberg, qui sont de la forme$$ \left(\int_{\mathbb{R}^n} |f|^a\,dx\right)^{\alpha}\left(\int_{\mathbb{R}^n}|f|^b\,dx\right)^{\beta} \le C\left(\int_{\mathbb{R}^n} |\nabla f|^c\,dx\right)^{\gamma} $$ Les deux côtés doivent être mis à l'échelle de la même manière sous les redimensionnements des deux $f$ et l'espace ($x \mapsto \lambda x$). Cela vous indique exactement quelles équations les exposants doivent satisfaire. En particulier, invariance sous remise à l'échelle de$f$ implique que $$ a\alpha + b\beta = c\gamma, $$ et la remise à l'échelle de l'espace (c'est-à-dire le changement de variables par une dilatation) implique que $$ n(\alpha +\beta) = (n-c)\gamma. $$ De plus, nous devons supposer que $a, b, c$ sont positifs, $\gamma > 0$, et au moins un des $\alpha$ et $\beta$ doit être positif.
En géométrie différentielle, l'existence et la forme d'invariants de tenseurs locaux peuvent être identifiées par la normalisation des coordonnées locales en un point. Par exemple, vous pouvez "découvrir" le fait qu'il n'y a pas d'invariant tenseur du premier ordre d'une métrique riemannienne et "découvrir" le tenseur de courbure de Riemann comme le seul invariant du second ordre possible à travers ce processus.
Ce que je trouve beau à ce sujet, c'est que, quand vous creusez plus profondément, vous découvrez que cela est étroitement lié à la théorie de $GL(n)$ et Young tableaux.