Le differenze tra le notazioni derivate di Lagrange e Leibniz

Aug 21 2020

Un problema che ho riscontrato durante l'apprendimento del calcolo è che ci sono molti modi diversi per denotare la derivata. Se$y=f(x)=x^2$, quindi potremmo scrivere

\begin{align} f'(x)&=2x \\ y'&=2x \\ \frac{df}{dx}(x)&=2x \\ \frac{df(x)}{dx}&=2x \\ \frac{d}{dx}f(x)&=2x \\ \frac{dy}{dx}&=2x \end{align}

E queste sono solo le notazioni di Lagrange e Leibniz. Quello che trovo preoccupante è che tutti sembrano suggerire cose leggermente diverse su ciò che è effettivamente il derivato . È una funzione, un limite di un quoziente o entrambi? Nell'interesse di mantenere il mio post breve, concentrerò la mia attenzione su$f'(x)=2x$ e $\frac{dy}{dx}=2x$, poiché queste sembrano essere le notazioni più comuni.

$$ f'(x)=2x $$

Ha senso pensare alla derivata come alla funzione gradiente: $$ f'\colon x\mapsto\lim_{\Delta x \to 0}\frac{f(x+\Delta x)-f(x)}{\Delta x} $$ In questo caso l'espressione limite è uguale a $2x$e così possiamo scrivere $$ f' \colon x \mapsto 2x $$ Tuttavia, questa notazione sembra un po 'controintuitiva se consideriamo cosa significa differenziare una funzione rispetto a una variabile diversa da $x$. Se chiedo qual è il derivato di$f(x)$ riguardo a $\frac{x}{2}$, questa domanda ha senso? È semplicemente$f'(\frac{x}{2})$? Oppure dobbiamo esprimere$x^2$ in termini di $\frac{x}{2}$? E come possiamo esprimere questa derivata usando la notazione di Lagrange?

$$ \frac{dy}{dx}=2x $$

Ci sono molte cose carine nella notazione di Leibniz, incluso il fatto che è esplicito quale variabile stai differenziando rispetto a. Tuttavia, in questo caso, non è chiaro se stiamo parlando di una funzione o di qualcos'altro completamente. Ci sono altri problemi. Alcune persone dicono di non gradire la formulazione di Leibniz della regola della catena$$ \frac{dy}{dx}=\frac{dy}{du}\frac{du}{dx} $$dicendo che lo trovano impreciso. Non capisco davvero perché sia ​​così. Qualcuno potrebbe elaborare?

Risposte

5 peek-a-boo Aug 21 2020 at 00:23

I derivati ​​in un punto sono numeri (e questi numeri sono calcolati come limiti di un certo quoziente), e se per ogni punto assegni un numero che è la derivata in quel punto, allora ovviamente ottieni una funzione $\Bbb{R}\to \Bbb{R}$. La notazione di Leibniz è confusa perché non ti dice dove vengono valutate le derivate, quindi offusca la distinzione tra funzioni e valori di funzione. (potrebbe non sembrare un grosso problema soprattutto quando si fanno problemi semplici, ma garantisco che diventerà rapidamente molto confuso nel calcolo multivariabile se tutti questi concetti di base non vengono mantenuti dritti).

Scrivere la regola della catena come $\dfrac{dy}{dx} = \dfrac{dy}{du} \dfrac{du}{dx}$ è impreciso per diversi motivi:

  1. Introduce lettere completamente irrilevanti nel denominatore (un difetto non risolvibile con la notazione di Leibniz)
  2. Non ti dice dove vengono valutate le derivate (che sono funzioni come ho spiegato nel paragrafo precedente) (puoi provare a renderlo più preciso, ma poi perdi la "semplicità" della notazione di Leibniz).
  3. Il $y$ sul LHS ha un significato completamente diverso dal $y$ sulla RHS (questo non sarebbe un grosso problema se non ci fosse possibilità di confusione ... ma sfortunatamente causa molta confusione soprattutto in diverse variabili; vedi link sotto)

Il terzo è penso che il problema più grande e cercherò di spiegarlo ora. Nella notazione di Lagrange, la regola della catena è espressa come$(y\circ u)'(x) = y'(u(x)) \cdot u'(x)$, o se vuoi scrivere una corretta uguaglianza di funzioni, è giusto $(y\circ u)' = (y'\circ u)\cdot u'$. Quindi, in realtà ci sono tre funzioni coinvolte: c'è$y$, c'è $u$ e c'è la composizione $y\circ u$. La regola della catena ci dice come sono correlate le derivate di queste tre funzioni.

Tuttavia, quando scrivi $\dfrac{dy}{dx} = \dfrac{dy}{du}\cdot \dfrac{du}{dx}$, dà l'impressione errata che ci siano solo due funzioni, $y$ e $u$. Bene, ora potresti sostenere che sul LHS dovremmo "considerare"$y$ come una funzione di $x$"mentre sulla RHS"$y$ è una funzione di $u$"quindi queste sono cose diverse. Questo è ovviamente giusto, le due cose sono molto diverse , ma questo è tutto nascosto nella notazione. Un modo forse leggermente migliore di scrivere sarebbe$\dfrac{d(y\circ u)}{dx} = \dfrac{dy}{du} \cdot \dfrac{du}{dx}$. Ma anche questo non è del tutto corretto. Fondamentalmente, qualsiasi tentativo di scrivere formalmente la regola della catena è un enorme incubo. Il meglio che posso fare è dirlo per tutti$x\in \text{domain}(u)$, \begin{align} \dfrac{d(y\circ u)}{dx}\bigg|_x &= \dfrac{dy}{du}\bigg|_{u(x)}\cdot \dfrac{du}{dx}\bigg|_x \end{align} Questo risolve i problemi $(2)$ e $(3)$ menzionato sopra in una certa misura, ma $(1)$ rimane ancora un problema.

L'hai detto nei commenti

Non vedo molti problemi con $y$ a seconda di entrambi $u$ e $x$, dato che $u$ e $x$ sono anche correlati.

Bene, se originariamente $y$ "dipende da $u$", come può tutto ad un tratto" dipendere da $x$"? Certo, so cosa intendi, ma il modo corretto per indicare questa dipendenza non è dirlo"$y$ dipende da $x$", ma piuttosto che la funzione composita $y\circ u$ dipende da $x$. Ecco, potresti pensare che sono solo io che sono pedante con il linguaggio; e hai ragione. Tuttavia, la ragione per cui sono pedante è perché quel linguaggio e la notazione scadenti portano a idee sbagliate concettuali ; questa è stata sia la mia esperienza durante lo studio che anche sulla base di ciò che ho osservato da alcune domande su questo sito. Ad esempio, in questa domanda , l'OP lo trova$\frac{\partial F}{\partial y} = 0$ e $\frac{\partial F}{\partial y} = -1$. La ragione di questa apparente contraddizione è che i due$F$In realtà sono cose completamente diverse (ricordo anche una domanda nel contesto della singola variabile, ma non riesco a trovarla).


Per quanto riguarda l'altra tua domanda

Se chiedo qual è il derivato di$f(x)$ riguardo a $\frac{x}{2}$, questa domanda ha senso? È semplicemente$f'(\frac{x}{2})$? Oppure dobbiamo esprimere$x^2$ in termini di $\frac{x}{2}$? E come possiamo esprimere questa derivata usando la notazione di Lagrange?

Le risposte in successione sono "si potrebbe dare un senso a questa domanda", "no" e "sì". Lasciami elaborare. Quindi, qui, lo stiamo assumendo$f:\Bbb{R}\to \Bbb{R}$ è dato come $f(x) = x^2$. Per rendere precisa la nozione di "differenziazione rispetto a$\frac{x}{2}$", è necessario introdurre una nuova funzione, $\phi:\Bbb{R}\to \Bbb{R}$, $\phi(t) = 2t$. Quindi, quello che stai veramente chiedendo è qual è il derivato di$f\circ \phi$? Per capire perché questo è il modo corretto di formalizzare la tua domanda, notalo\begin{align} f(x) &= x^2 = \left(2 \cdot \dfrac{x}{2}\right)^2 = 4 \left(\frac{x}{2}\right)^2 \end{align} e quello $(f\circ \phi)(t) = f(2t) = (2t)^2 = 4t^2$. Quindi questo è davvero quello che vogliamo.

E in questo caso \begin{align} (f\circ \phi)'(t) &= f'(\phi(t)) \cdot \phi'(t) \\ &= [2 \cdot \phi(t)] \cdot [2] \\ &= [2\cdot 2t] \cdot 2 \\ &= 8t \end{align}

Nota come questo sia completamente diverso da $f'\left(\frac{x}{2}\right) = 2 \cdot \frac{x}{2} = x$.

In generale, quando hai "___ in funzione di $\ddot{\smile}$ "e invece vuoi" pensare a ___ come una funzione di @ ", quello che sta succedendo è che devi usare una composizione extra. Quindi, devi avere tre set $X,Y,Z$, una data funzione $f:Y\to Z$ (cioè pensiamo agli elementi $z\in Z$ come "funzioni di" $y\in Y$) e se ora vuoi pensare a "z in funzione di $x$", allora ciò significa che in qualche modo hai bisogno di ottenere una mappatura $X\to Z$ che coinvolge $f$in qualche modo. In altre parole, abbiamo bisogno di una certa mappatura$\phi:X \to Y$ e poi considera la composizione $f\circ \phi$(vedi ad esempio le osservazioni verso la fine di questa risposta ).

Le cose possono creare un po 'di confusione quando tutti i set sono uguali $X=Y=Z = \Bbb{R}$, ma in questo caso dovresti pensare ai tre $\Bbb{R}$È come "copie diverse" della linea reale, e ogni funzione ti mappa da una copia della linea reale a un'altra copia della linea reale.


Modificare:

Ecco un passaggio dal testo Calculus di Spivak (Capitolo 10, Domanda 33), dove ho appreso per la prima volta del doppio uso della stessa lettera.

J.G. Aug 20 2020 at 22:47

La differenziazione mappa quelle che chiamerò funzioni "vanilla" (ad es. Funzioni da reals a reals, ma quali funzioni consideriamo "vanilla" dipendono dal contesto) a funzioni vanilla; la differenziazione in un punto ottiene una funzione vaniglia per differenziazione, quindi valuta quella funzione in quel punto. Questi due processi sono correlati da currying / uncurrying . Così$\frac{d}{dx}$è una funzione vaniglia-funzione-vaniglia-funzione, una funzione decisamente non-vaniglia che potresti qui chiamare funzionale o operatore in vari contesti.

Un'ulteriore nota sulle funzioni non funzionali che ho chiamato "vaniglia": tali funzioni potrebbero mappare da uno spazio di punti a un altro, e la differenziazione può spostarsi da uno spazio di tali funzioni a un altro. Ad esempio ,$\nabla$ invia $f(x,\,y)$, funzione da $\Bbb R^2$ per $\Bbb R$, a una funzione da $\Bbb R^2$ per $\Bbb R^2$.

Per quanto riguarda la regola della catena, è l'abbreviazione di$$\lim_{h\to0}\frac{y(x+h)-y(x)}{h}=\lim_{k\to0}\frac{y(u(x)+k)-y(u(x))}{k}\lim_{H\to0}\frac{u(x+H)-u(x)}{H}.$$La formulazione di Leibniz sorvola sulla distinzione tra $u$ essendo la variabile indipendente in $\frac{dy}{du}$ & essendo la variabile dipendente in $\frac{du}{dx}$. Tuttavia, possiamo dare un senso alla differenziazione$y=x^2$ riguardo a $u=\frac{x}{2}$per di qua. O puoi dire$$y=4u^2\implies\frac{dy}{du}=8u,$$oppure puoi ottenere lo stesso risultato da$$\frac{dy}{du}=\frac{\frac{dy}{dx}}{\frac{du}{dx}}=\frac{2x}{\frac12}=4x=8u.$$