Las diferencias entre las notaciones derivadas de Lagrange y Leibniz
Un problema que encontré al aprender cálculo es que hay muchas formas diferentes de denotar la derivada. Si$y=f(x)=x^2$, entonces podríamos escribir
\begin{align} f'(x)&=2x \\ y'&=2x \\ \frac{df}{dx}(x)&=2x \\ \frac{df(x)}{dx}&=2x \\ \frac{d}{dx}f(x)&=2x \\ \frac{dy}{dx}&=2x \end{align}
Y estas son solo las notaciones de Lagrange y Leibniz. Lo que encuentro preocupante es que todos parecen estar sugiriendo cosas sutilmente diferentes sobre lo que es realmente la derivada . ¿Es una función, un límite de un cociente o ambos? Con el fin de que mi publicación sea breve, centraré mi atención en$f'(x)=2x$ y $\frac{dy}{dx}=2x$, ya que estas parecen ser las notaciones más comunes.
$$ f'(x)=2x $$
Tiene sentido pensar en la derivada como la función de gradiente: $$ f'\colon x\mapsto\lim_{\Delta x \to 0}\frac{f(x+\Delta x)-f(x)}{\Delta x} $$ En este caso, la expresión límite es igual a $2x$, y así podemos escribir $$ f' \colon x \mapsto 2x $$ Sin embargo, esta notación parece un poco contraintuitiva cuando consideramos lo que significa diferenciar una función con respecto a una variable distinta de $x$. Si pregunto cuál es la derivada de$f(x)$ con respecto a $\frac{x}{2}$, ¿Esta pregunta tiene sentido? Es simplemente$f'(\frac{x}{2})$? O tenemos que expresar$x^2$ en términos de $\frac{x}{2}$? ¿Y cómo podemos expresar esta derivada usando la notación de Lagrange?
$$ \frac{dy}{dx}=2x $$
Hay muchas cosas que son agradables sobre la notación de Leibniz, incluido el hecho de que es explícito con respecto a qué variable se está diferenciando. Sin embargo, en este caso, no está claro si estamos hablando de una función o de algo completamente distinto. Hay otros problemas. Algunas personas dicen que no les gusta la formulación de Leibniz de la regla de la cadena$$ \frac{dy}{dx}=\frac{dy}{du}\frac{du}{dx} $$diciendo que lo encuentran inexacto. Realmente no entiendo por qué este es el caso. ¿Podría alguien dar más detalles?
Respuestas
Las derivadas en un punto son números (y estos números se calculan como límites de un cierto cociente), y si para cada punto asigna un número que es la derivada en ese punto, entonces, por supuesto, obtiene una función $\Bbb{R}\to \Bbb{R}$. La notación de Leibniz es confusa porque no le dice dónde se evalúan las derivadas, por lo tanto, difumina la distinción entre funciones y valores de función. (Puede que no parezca tan importante, especialmente cuando se hacen problemas simples, pero te garantizo que rápidamente se volverá muy confuso en el cálculo multivariable si no se mantienen todos estos conceptos básicos).
Escribiendo la regla de la cadena como $\dfrac{dy}{dx} = \dfrac{dy}{du} \dfrac{du}{dx}$ es inexacto por varias razones:
- Introduce letras completamente irrelevantes en el denominador (un defecto irreparable con la notación de Leibniz)
- No te dice dónde se evalúan las derivadas (que son funciones como expliqué en mi párrafo anterior) (puedes intentar hacer esto más preciso, pero luego pierdes la "simplicidad" de la notación de Leibniz).
- los $y$ en el LHS tiene un significado completamente diferente del $y$ en el RHS (esto no sería un gran problema si no hubiera posibilidad de confusión ... pero desafortunadamente causa mucha confusión, especialmente en varias variables; vea el enlace a continuación)
El tercero es que creo que es el mayor problema, y trataré de explicarlo ahora. En la notación de Lagrange, la regla de la cadena se expresa como$(y\circ u)'(x) = y'(u(x)) \cdot u'(x)$, o si desea escribir una igualdad adecuada de funciones, es solo $(y\circ u)' = (y'\circ u)\cdot u'$. Entonces, en realidad hay tres funciones involucradas: hay$y$, Ahi esta $u$ y ahí está la composición $y\circ u$. La regla de la cadena nos dice cómo se relacionan las derivadas de estas tres funciones.
Sin embargo, cuando escribes $\dfrac{dy}{dx} = \dfrac{dy}{du}\cdot \dfrac{du}{dx}$, da la impresión incorrecta de que solo hay dos funciones, $y$ y $u$. Bueno, ahora podría argumentar que en el LHS deberíamos "considerar$y$ como una función de $x$"mientras está en el RHS"$y$ es una función de $u$"así que estas son cosas diferentes. Por supuesto, esto es correcto, las dos cosas son muy diferentes , pero todo esto está oculto en la notación. Una forma quizás un poco mejor de escribir sería$\dfrac{d(y\circ u)}{dx} = \dfrac{dy}{du} \cdot \dfrac{du}{dx}$. Pero esto tampoco es del todo correcto. Básicamente, cualquier intento de escribir formalmente la regla de la cadena es una gran pesadilla. Lo mejor que puedo hacer es decir que para cada$x\in \text{domain}(u)$, \begin{align} \dfrac{d(y\circ u)}{dx}\bigg|_x &= \dfrac{dy}{du}\bigg|_{u(x)}\cdot \dfrac{du}{dx}\bigg|_x \end{align} Esto soluciona problemas $(2)$ y $(3)$ mencionado anteriormente hasta cierto punto, pero $(1)$ sigue siendo un problema.
Dijiste en los comentarios que
No veo mucho problema con $y$ dependiendo de ambos $u$ y $x$, Dado que $u$ y $x$ también están relacionados.
Bueno, si originalmente $y$ "depende de $u$", ¿cómo puede de repente" depender de $x$"? Por supuesto, sé lo que quieres decir, pero la forma correcta de indicar esta dependencia es no decir eso"$y$ depende de $x$", sino que la función compuesta $y\circ u$ depende de $x$. En este caso, podría pensar que solo soy pedante con el lenguaje; y tienes razón. Sin embargo, la razón por la que soy pedante es porque el lenguaje y la notación deficientes conducen a conceptos erróneos ; esta ha sido mi experiencia al estudiar y también basada en lo que he observado en algunas preguntas de este sitio. Por ejemplo, en esta pregunta , el OP encuentra que$\frac{\partial F}{\partial y} = 0$ y $\frac{\partial F}{\partial y} = -1$. La razón de esta aparente contradicción es que los dos$F$En realidad, son cosas completamente diferentes (también recuerdo una pregunta en el contexto de una sola variable, pero parece que no puedo encontrarla).
Respecto a tu otra pregunta
Si pregunto cuál es la derivada de$f(x)$ con respecto a $\frac{x}{2}$, ¿Esta pregunta tiene sentido? Es simplemente$f'(\frac{x}{2})$? O tenemos que expresar$x^2$ en términos de $\frac{x}{2}$? ¿Y cómo podemos expresar esta derivada usando la notación de Lagrange?
Las respuestas sucesivas son "se podría entender esta pregunta", "no" y "sí". Déjame explicarlo. Entonces, aquí, asumimos que$f:\Bbb{R}\to \Bbb{R}$ se da como $f(x) = x^2$. Para precisar la noción de "diferenciar con respecto a$\frac{x}{2}$", hay que introducir una nueva función, $\phi:\Bbb{R}\to \Bbb{R}$, $\phi(t) = 2t$. Entonces, lo que realmente estás preguntando es cuál es la derivada de$f\circ \phi$? Para ver por qué esta es la forma correcta de formalizar su pregunta, tenga en cuenta que\begin{align} f(x) &= x^2 = \left(2 \cdot \dfrac{x}{2}\right)^2 = 4 \left(\frac{x}{2}\right)^2 \end{align} y eso $(f\circ \phi)(t) = f(2t) = (2t)^2 = 4t^2$. Entonces esto es de hecho lo que queremos.
Y en este caso \begin{align} (f\circ \phi)'(t) &= f'(\phi(t)) \cdot \phi'(t) \\ &= [2 \cdot \phi(t)] \cdot [2] \\ &= [2\cdot 2t] \cdot 2 \\ &= 8t \end{align}
Observe cómo esto es completamente diferente de $f'\left(\frac{x}{2}\right) = 2 \cdot \frac{x}{2} = x$.
En general, cuando tiene "___ en función de $\ddot{\smile}$ "y, en cambio, quiere" pensar en ___ como una función de @ ", lo que sucede es que debe usar una composición adicional. Por lo tanto, debe tener tres conjuntos $X,Y,Z$, una función dada $f:Y\to Z$ (es decir, pensamos en elementos $z\in Z$ como "funciones de" $y\in Y$) y si ahora quiere pensar en "z como una función de $x$", entonces lo que significa es que de alguna manera necesita obtener un mapeo $X\to Z$ El cual involucra $f$de algun modo. En otras palabras, necesitamos cierto mapeo$\phi:X \to Y$ y luego considera la composición $f\circ \phi$(vea, por ejemplo, los comentarios al final de esta respuesta ).
Las cosas pueden ser un poco confusas cuando todos los conjuntos son iguales $X=Y=Z = \Bbb{R}$, pero en este caso deberías pensar en los tres $\Bbb{R}$es como "copias diferentes" de la línea real, y que cada función le asigna desde una copia de la línea real a otra copia de la línea real.
Editar:
Aquí hay un pasaje del texto Cálculo de Spivak (Capítulo 10, Pregunta 33), donde aprendí por primera vez sobre el doble uso de la misma letra.

La diferenciación asigna lo que llamaré funciones "vanilla" (por ejemplo, funciones de reales a reales, pero las funciones que consideramos "vanilla" dependen del contexto) a funciones vanilla; la diferenciación en un punto obtiene una función de vainilla por diferenciación, luego evalúa esa función en dicho punto. Estos dos procesos se relacionan curry / no curry . Entonces$\frac{d}{dx}$es una función de vainilla a una función de vainilla, una función decididamente no vainilla que aquí podría denominarse funcional u operador en varios contextos.
Una nota adicional sobre las funciones no funcionales que llamé "vainilla": tales funciones pueden mapearse de un espacio de puntos a otro, y la diferenciación puede moverse de un espacio de tales funciones a otro. Por ejemplo ,$\nabla$ envía $f(x,\,y)$, función de $\Bbb R^2$ a $\Bbb R$, a una función de $\Bbb R^2$ a $\Bbb R^2$.
En cuanto a la regla de la cadena, es la abreviatura de$$\lim_{h\to0}\frac{y(x+h)-y(x)}{h}=\lim_{k\to0}\frac{y(u(x)+k)-y(u(x))}{k}\lim_{H\to0}\frac{u(x+H)-u(x)}{H}.$$La formulación de Leibniz pasa por alto la distinción entre $u$ siendo la variable independiente en $\frac{dy}{du}$ y es la variable dependiente en $\frac{du}{dx}$. De todos modos, podemos tener sentido diferenciar$y=x^2$ con respecto a $u=\frac{x}{2}$de esta manera. O puedes decir$$y=4u^2\implies\frac{dy}{du}=8u,$$o puede obtener el mismo resultado de$$\frac{dy}{du}=\frac{\frac{dy}{dx}}{\frac{du}{dx}}=\frac{2x}{\frac12}=4x=8u.$$