Metaciência de modelos neurais

Nov 29 2022
Um resumo informal de uma crítica formal da metodologia em neurociência computacional, “On logic inference over brain, behavior, and artificial neural networks” (2021) de Olivia Guest e Andrea Martin Costumo ir e voltar quando penso sobre o papel da modelagem computacional na explicar como o cérebro funciona. Sou influenciado por emoções e preconceitos, preferências por realismo lutando contra preferências por utilidade.

Um resumo informal de uma crítica formal da metodologia em neurociência computacional, “ Sobre a inferência lógica sobre o cérebro, o comportamento e as redes neurais artificiais ” (2021), de Olivia Guest e Andrea Martin

Costumo ir e voltar quando penso no papel da modelagem computacional na explicação de como o cérebro funciona. Sou influenciado por emoções e preconceitos, preferências por realismo lutando contra preferências por utilidade. Por um lado, a maioria dos algoritmos de redes neurais foi um tanto inspirada em observações da biologia, então eles deveriam ter algo a ver com isso, mas, por outro lado, as redes neurais são geralmente projetadas por engenheiros que trabalham com bancos de dados para outros engenheiros que trabalham com bancos de dados. . As redes neurais podem refletir mais o último do que o primeiro, mas noto uma tendência das pessoas quererem acreditar que são realmente artefatos semelhantes ao cérebro.

Vemos imagens de robôs humanóides usadas em muitos tutoriais de ML no Medium, cada vez mais nossos dispositivos são chamados de “inteligentes” e palavras da ciência cognitiva e da psicologia como “aprendizado” são usadas de forma intercambiável entre máquinas e seres vivos.

O que as pessoas tendem a pensar que AI/Machine Learning é
Uma representação mais precisa de uma rede neural deste capítulo do livro Springer https://link.springer.com/chapter/10.1007/978-981-15-9343-7_43

Parte disso pode ser apenas inspiração de ficção científica, um pouco de exagero, algo para fazer as pessoas se interessarem (e financiar) pesquisas em ciência da computação/estatística aplicada computacional. Talvez mais problemático seria se as pessoas que usam computadores para entender o cérebro, os neurocientistas computacionais, fossem pegos acreditando nisso. É exatamente isso que acontece e sobre o que trata o artigo de 2021 de Guest e Martin.

Quando um neurocientista computacional quer saber algo sobre como o cérebro funciona, eles tendem a fazer um modelo usando uma Rede Neural Artificial (ANN). Como há uma grande quantidade de dados coletados sobre e a partir dos cérebros, pode-se simplesmente jogar esses dados em um modelo de rede neural e, se os resultados se parecerem com os dados do cérebro, o modelo deve estar fornecendo algumas informações sobre o próprio cérebro. , certo?

As autoras do artigo, Andrea Martin (à esquerda) e Olivia Guest (à direita) em um meme que postaram em seu blog

Os autores mostram que não, não são equivalentes. Devido ao fenômeno da “realização múltipla”, várias coisas diferentes podem produzir o mesmo tipo de ação. Isso não significa que os dois são iguais, ou que um explique o outro. Isso é, na verdade, uma falácia lógica chamada afirmação do conseqüente .

Um exemplo clássico na lógica clássica de um argumento válido é Modus Ponens, ou “afirmando o antecedente”:

Modus Ponens: A proposição P implica a proposição Q, P (existe/é verdadeiro), portanto Q (existe/é verdadeiro)

Como você pode imaginar, afirmar o consequente é confundir os Ps e os Qs do lado direito da equação.

“Se alguém mora em San Diego, então mora na Califórnia. Joe mora na Califórnia. Portanto, Joe mora em San Diego” (exemplo da Wikipédia)

ou, da pág. 6 do papel:

“Se o modelo faz o que as pessoas fazem, então o modelo se aproxima dos dados comportamentais e/ou de neuroimagem humanos. (Q → P).”

Isso não é logicamente sólido, mas, como apontam os autores, é quase onipresente na modelagem computacional do cérebro. Tanto que os pesquisadores realmente parecem acreditar nisso, quando na verdade estão confundindo “poder de previsão” com “virtude explicativa”.

A falácia lógica de “afirmar o consequente” (em vez do antecedente). Este não é um argumento sólido

Os neurocientistas computacionais usam muito os modelos. Por exemplo, podemos consultar o livreto do programa da conferência 2021 COMPutational and SYstems NEuroscience ( COSYNE ) e ver quantas linhas contendo a palavra “model” são retornadas executando o pdf através da ferramenta de pesquisa grep e a ferramenta de contagem de palavras wc :

lesspipe Cosyne2021_program_book.pdf | grep [M,m]odel | wc

Modelos ainda são úteis! Eles são a base de muito do que a ciência é. A interpretação é, no entanto, outro aspecto vital da ciência. Qualquer pessoa “fazendo ciência” precisa ser capaz de analisar metacientificamente nossos métodos, teorias e interpretações para ter certeza de que nossas afirmações são válidas, e não simplesmente lançar analogias de sentimentos verdadeiros por aí. Na neurociência computacional cognitiva, destacam Guest e Martin, há uma enorme tentação de fazer isso, porque ainda não há consenso sobre o que a bolha gordurosa e eletrificada em nossas cabeças está realmente fazendo. As pessoas estão buscando a verdade quando tudo o que temos são dados.

“Os dados do cérebro não são inerentemente mecanicamente informativos por si só.”

As teorias certamente podem e devem ser informadas por dados, mas os dados não são suficientes para criar uma teoria de como algo funciona. Se isso for assumido, corre-se o risco de afirmar algo como verdadeiro quando na verdade era apenas uma suposição, o que não é ciência. A ciência procura explicar, ajudar as pessoas a entender o mundo. Previsão não é a mesma coisa que compreensão , embora seja uma ferramenta poderosa quando usada corretamente, como uma ferramenta de exploração e não de explicação.

Uma vez que, como apontam os autores, ainda não sabemos o que significa algo ser “biologicamente viável”, talvez possamos deixar de tentar misturar os conceitos de NN Biológica e NN Artificial, até que se aprenda mais sobre o primeiro e usar o último para fazer o que faz de melhor: processar grandes quantidades de dados computacionalmente.

Há uma série de aplicações de ANNs para dados de neurociência que não são enquadradas como explicações. Análise de séries temporais de EEG para prever coisas como convulsões, análise automática de dados de ressonância magnética para encontrar lesões difíceis de detectar, encontrar padrões temporais ocultos em ritmos de trem de pico, etc. Dessa forma, a neurociência teórica pode voltar à teoria e à criação de modelos com “plausibilidade neurocognitiva ” em mente desde o início, em vez de modelos nascidos de “objetivos de engenharia”.

A engenharia de robôs elegantes é o objetivo fundamental da neurociência computacional? Eu não acho que deveria ser. Espero que o objetivo seja entender o cérebro, a mente e as vidas que os usam. Trabalho metacientífico como este artigo é muito importante para manter os cientistas alinhados com esse objetivo. A ciência* tende a ser uma prática de “criar a verdade” na sociedade, portanto, garantir que seja realmente verdade e não apenas representações legais que parecem verdadeiras deve ser a principal prioridade.

(*incluindo ciência de dados)