Perdemos alguma solução ao aplicar a separação de variáveis a equações diferenciais parciais?
Por exemplo, considere o seguinte problema $$\frac{\partial u}{\partial t} = k\frac{\partial^2 u}{\partial x^2},\hspace{0.5cm} u(x,0)=f(x),\hspace{0.5cm} u(0,t)=0,\hspace{0.5cm} u(L,t)=0$$Livros didáticos (por exemplo, as notas online de Paulo ) geralmente aplicam separação de variáveis, assumindo que$u(x,t)=\varphi(x)G(t)$ sem qualquer explicação por que essa suposição pode ser feita.
Perdemos alguma solução dessa forma, dado que existem funções de duas variáveis $x$ e $t$ que não são produtos de funções de variáveis individuais?
A separação de variáveis fornece a seguinte solução quando consideramos apenas as condições de contorno: $$u_n(x,t) = \sin\left(\frac{n\pi x}{L}\right)e^{-k\left(\frac{n\pi}{L}\right)^2t},\hspace{0.5cm}n=1,2,3,\dotsc.$$
A equação é linear, então podemos fazer uma superposição de $u_n$: $$u(x,t) = \sum\limits_{n=1}^{\infty}B_n\sin\left(\frac{n\pi x}{L}\right)e^{-k\left(\frac{n\pi}{L}\right)^2t}$$ Onde $B_n$ são encontrados a partir da condição inicial: $$B_n = \frac{2}{L}\int\limits_0^Lf(x)\sin\left(\frac{n\pi x}{L}\right)dx,\hspace{0.5cm}n=1,2,3,\dotsc.$$
Existem soluções $u(x,t)$que não pode ser representado desta forma (não para este pde particular, mas em geral)? O que acontece no caso de equações não lineares? Podemos aplicar separação de variáveis aí?
Respostas
Considere sua suposta solução $u(x,t)$ em fixo $t$, ou seja, pense nisso como uma função apenas de $x$. Essa função pode ser expandida em um conjunto completo de funções$f_n (x)$, $$ u(x,t)=\sum_{n} u_n f_n (x) $$ O que acontece quando você escolhe um fixo diferente $t$? Contanto que as condições de limite no$x$ a direção não muda (que é o caso em seu exemplo), você ainda pode expandir no mesmo conjunto $f_n (x)$, então o único lugar onde o $t$-dependência entre está nos coeficientes $u_n $ - eles são o que muda quando você expande uma função diferente de $x$ no mesmo conjunto de $f_n (x)$. Portanto, a dependência funcional completa de$u(x,t)$ pode ser escrito como $$ u(x,t)=\sum_{n} u_n (t) f_n (x) $$Assim, quando fazemos um ansatz de separação, não estamos assumindo que nossas soluções são produtos. Estamos apenas afirmando que podemos construir uma base de forma de produto na qual nossas soluções podem ser expandidas. Isso não é uma restrição para uma grande classe de problemas. Como é evidente a partir do argumento anterior, isso dá errado quando as condições de contorno no$x$ direção depende de $t$ - então não podemos expandir no mesmo conjunto $f_n (x)$ para cada $t$. Por exemplo, se o domínio fosse triangular, de modo que o comprimento do$x$-intervalo depende de $t$, as frequências nas funções seno em seu exemplo se tornariam $t$-dependente.
Como você observou corretamente, no final escrevemos nossa solução como uma superposição de soluções separáveis, então a pergunta certa realmente 'podemos expressar cada solução para nosso PDE como uma soma de soluções separáveis'?
Uma resposta completa a esta pergunta requer um pouco de álgebra linear. O que queremos fazer é encontrar um conjunto de funções$\{\varphi_n(x): n \in \mathbb{N}\}$ de modo que para cada vez $t$ escreva nossa solução $f$ Como $f = \sum_{n=0}^{\infty} \varphi_n(x) G_n(t)$ onde o $G_n$são apenas alguns coeficientes que podem depender do tempo. Não apenas esse conjunto de funções existe, mas podemos realmente encontrar um conjunto dessas funções por meio do processo de separação de variáveis.
Vamos considerar a equação do calor novamente. Quando separamos as variáveis, reduzimos a situação a dois EDOs:
$$G'(t) = EG(t), \varphi''(x) = \frac{E}{k}\varphi(x) $$ Onde $E$ é alguma constante desconhecida.
Lembre-se de que a diferenciação é linear: isto é, para funções $f$ e $g$ e constantes $a,b$ temos $\frac{d}{dx}(af(x)+bg(x)) = a\frac{df}{dx} + b \frac{dg}{dx}$. O que isso significa é que nossos dois ODEs são problemas de autovalor: temos um problema de autovalor para o operador$\frac{d}{dx}$ com autovalor $E$, e um problema de autovalor para o operador $\frac{d^2}{dx^2}$ com autovalor $\frac{E}{k}$.
Precisamos dos vetores próprios de $\frac{d^2}{dx^2}$ (ou seja, as soluções para o nosso $\varphi$ODE) para formar uma base para o nosso espaço de funções. Felizmente, existe um teorema que faz exatamente esse tipo de coisa para nós.
Teorema espectral :
Deixei $V$ ser um espaço Hilbert e $T: V \to V$um mapa auto-adjunto (suficientemente bom). Então existe uma base ortonormal para$V$ que consiste em vetores próprios para $T$.
Para entender isso, precisamos de um ingrediente final: um produto interno. Isso é apenas algo que generaliza o familiar ` produto escalar 'em três dimensões. O produto interno de duas funções$f$, $g$ é um número real, definido como $$\langle f,g\rangle := \int_{0}^{\infty} f(x)g(x) dx$$.
Uma base de funções $\{f_n: n \in \mathbb{N}\}$é chamado de ortonormal se$\langle f_n, f_n \rangle = 1$ e $\langle f_n, f_m \rangle = 0$ quando $n \neq m$.
Por fim, só precisamos verificar se o operador $\frac{d}{dx}$é auto-adjunta. O que isso significa é que para quaisquer duas funções$f$, $g$ nós temos isso $\langle \frac{d^2 f}{dx^2},g\rangle = \langle f,\frac{d^2g}{dx^2} \rangle$. Isso pode ser feito por integração por partes:
$$\int_{0}^{L} f''(x)g(x) dx = - \int_{0}^{L} f'(x)g'(x) dx = \int_{0}^{L} f(x)g''(x) dx$$ onde descartamos os termos de contorno porque as condições de contorno nos dizem que eles são zero.
Portanto, o operador $\frac{d^2}{dx^2}$ é auto-adjunta, e assim o teorema espectral nos diz que seus autovetores formam uma base para nosso espaço de funções, então para qualquer $t$podemos expressar qualquer função escolhida como$$f = \sum_{n=0}^{\infty} \varphi_n(x) G_n(t)$$Assim, não perdemos nenhuma solução no sentido de que podemos escrever a equação assim. Eu pulei algumas questões técnicas aqui: Eu não disse a você o que é o espaço de Hilbert, e quando digo 'qualquer' função, realmente quero dizer 'qualquer função quadrada-integrável'. Mas não acho que esses detalhes técnicos sejam importantes para o entendimento.
Como um extra divertido, agora que temos nosso produto interno, podemos usá-lo para simplesmente derivar os coeficientes em nossa solução em série. Escrevemos nossa solução como$$f(x,t) = \sum_{n=0}^{\infty} \varphi_n(t) G_n(x)$$ e agora vamos pegar o produto interno de $f$ com o elemento básico $\varphi_n(x)$. Isso nos dá
$$\langle f(x,0), \varphi_n(x) = \langle \sum_{k=0}^{\infty} \varphi_k(x) G_k(0), \varphi_n(x) \rangle = \sum_{k=0}^{\infty} G_k(0) \langle \varphi_k(x) , \varphi_n(x) \rangle = \sum_{k=0}^{\infty} G_k(0) \langle \varphi_k(x) , \varphi_n(x) \rangle $$
Aqui trocamos integração e soma. Finalmente, a ortonormalidade da base$\{\varphi_k(x)\}$ significa que todos os termos, exceto um, são zero, então obtemos $$ \langle f(x,0), \varphi_n(x) = G_n(0) $$ Lembre-se disso $G_n(t) = B_n e^{-k\frac{n\pi}{L}^2 t}$, então $B_n = G_n(0)$ e escrever nossa fórmula de produto interna em termos de uma integral, obtemos $$\int_{0}^{L} f(x,0) \varphi_n(x) dx = \int_{0}^{L} f(x,0) \sin(\frac{n\pi x}{L}) dx $$ que é a nossa expressão usual para os coeficientes da série!
O método de separação de variáveis deriva das simetrias da equação, consulte, por exemplo, o livro de W. Miller Symmetry and Separation of Variables (esgotado, mas disponível aqui ).
A separação de variáveis para equações não lineares é tratada por Victor A. Galaktionov, Sergey R. Svirshchevskii em seu livro Soluções exatas e subespaços invariáveis de equações diferenciais parciais não lineares , Chapman e Hall / CRC 2007.