Metaciencia de los modelos neuronales

Nov 29 2022
Un resumen informal de una crítica formal de la metodología en neurociencia computacional, "Sobre la inferencia lógica sobre el cerebro, el comportamiento y las redes neuronales artificiales" (2021) por Olivia Guest y Andrea Martin A menudo voy de un lado a otro cuando pienso en el papel del modelado computacional en explicando cómo funciona el cerebro. Me dejo llevar por las emociones y los prejuicios, las preferencias por el realismo luchan contra las preferencias por la utilidad.

Un resumen informal de una crítica formal de la metodología en neurociencia computacional, " Sobre la inferencia lógica sobre el cerebro, el comportamiento y las redes neuronales artificiales " (2021) por Olivia Guest y Andrea Martin

A menudo voy de un lado a otro cuando pienso en el papel del modelado computacional para explicar cómo funciona el cerebro. Me dejo llevar por las emociones y los prejuicios, las preferencias por el realismo luchan contra las preferencias por la utilidad. Por un lado, la mayoría de los algoritmos de redes neuronales se inspiraron un poco en las observaciones de la biología, por lo que deberían tener algo que ver con eso, pero por otro lado, las redes neuronales generalmente las diseñan ingenieros que trabajan con bases de datos para otros ingenieros que trabajan con bases de datos. . Las redes neuronales pueden reflejar más lo último que lo primero, pero noto una tendencia de las personas que quieren creer que son realmente artefactos parecidos al cerebro.

Vemos imágenes de robots humanoides utilizadas en muchos tutoriales de ML en Medium, cada vez más de nuestros dispositivos se denominan "inteligentes" y las palabras de la ciencia cognitiva y la psicología como "aprendizaje" se usan indistintamente entre máquinas y seres vivos.

Lo que la gente tiende a pensar que es AI/Machine Learning
Una representación más precisa de una red neuronal de este capítulo del libro de Springer https://link.springer.com/chapter/10.1007/978-981-15-9343-7_43

Algo de esto podría ser solo inspiración de ciencia ficción, un poco de exageración, algo para que la gente se interese en (y financie) la investigación en informática/estadística aplicada computacional. Tal vez sería más problemático si las personas que usan computadoras para comprender el cerebro, los neurocientíficos computacionales, quedaran atrapados creyendo eso. Esto es precisamente lo que sucede, y de lo que trata el artículo de 2021 de Guest y Martin.

Cuando un neurocientífico computacional quiere saber algo sobre cómo funciona el cerebro, tiende a hacer un modelo utilizando una red neuronal artificial (ANN). Dado que hay una gran cantidad de datos recopilados sobre y desde los cerebros, uno puede simplemente arrojar esos datos en un modelo de una red neuronal, y si los resultados se parecen a los datos del cerebro, entonces el modelo debe proporcionar alguna información sobre el cerebro en sí. , ¿Correcto?

Las autoras del artículo, Andrea Martin (izquierda) y Olivia Guest (derecha) en un meme que publicaron en su blog.

Los autores muestran que, no, no son equivalentes. Debido al fenómeno de la “realización múltiple”, múltiples cosas diferentes pueden producir el mismo tipo de acción. No significa que los dos sean iguales, o que uno explique al otro. Esto es en realidad una falacia lógica llamada afirmar el consecuente .

Un ejemplo clásico en la lógica clásica de un argumento válido es Modus Ponens, o "afirmar el antecedente":

Modus Ponens: La proposición P implica la proposición Q, P (existe/es verdadera) luego Q (existe/es verdadera)

Como puede suponer, afirmar el consecuente es confundir las P y las Q del lado derecho de la ecuación.

“Si alguien vive en San Diego, entonces vive en California. Joe vive en California. Por lo tanto, Joe vive en San Diego” (ejemplo de Wikipedia)

o, de la pág. 6 del papel:

“Si el modelo hace lo que hace la gente, entonces el modelo se aproxima a los datos de neuroimagen y/o comportamiento humano. (Q → P).”

Esto no es lógicamente sólido, pero, como señalan los autores, es casi omnipresente en el modelado computacional del cerebro. Tanto es así que los investigadores realmente parecen creerlo, cuando en realidad están confundiendo el "poder de predicción" con la "virtud explicativa".

La falacia lógica de “afirmar el consecuente” (en lugar del antecedente). Este no es un argumento sólido.

Los neurocientíficos computacionales usan mucho los modelos. Por ejemplo, podemos mirar el folleto del programa de la conferencia COmputational and Systems NEuroscience ( COSYNE ) de 2021 y ver cuántas líneas que contienen la palabra "modelo" se devuelven ejecutando el pdf a través de la herramienta de búsqueda grep y la herramienta de conteo de palabras wc :

lesspipe Cosyne2021_program_book.pdf | grep [M,m]odel | wc

¡Los modelos son útiles todavía! Son la base de gran parte de lo que es la ciencia. La interpretación es, sin embargo, otro aspecto vital de la ciencia. Cualquiera que “haga ciencia” necesita ser capaz de analizar metacientíficamente nuestros métodos, teorías e interpretaciones para asegurarse de que nuestras declaraciones sean válidas, y no simplemente arrojar analogías reales. En la neurociencia cognitiva computacional, señalan Guest y Martin, existe una gran tentación de hacer esto, porque todavía no hay consenso sobre lo que realmente está haciendo la masa grasa y electrificada en nuestras cabezas. La gente busca la verdad cuando todo lo que tenemos son datos.

"Los datos del cerebro no son intrínsecamente mecanicistas informativos en sí mismos".

Las teorías ciertamente pueden, y deben estar, basadas en datos, pero los datos no son suficientes para crear una teoría de cómo funciona algo. Si esto se asume, entonces se corre el riesgo de afirmar algo como cierto cuando en realidad era solo una suposición, lo cual no es ciencia. La ciencia busca explicar, ayudar a las personas a comprender el mundo. La predicción no es lo mismo que la comprensión , aunque es una herramienta poderosa cuando se usa correctamente, como una herramienta de exploración, no de explicación.

Dado que, como señalan los autores, todavía no sabemos qué significa que algo sea "biológicamente factible", tal vez podamos dejar de intentar combinar los conceptos de NN biológica y NN artificial, hasta que se aprenda más sobre la primero, y use el segundo para hacer lo que mejor sabe hacer: procesar grandes cantidades de datos computacionalmente.

Hay una serie de aplicaciones de ANN a los datos de neurociencia que no se enmarcan como explicaciones. Análisis de series de tiempo de EEG para predecir cosas como convulsiones, análisis automático de datos de resonancia magnética para encontrar lesiones difíciles de detectar, encontrar patrones temporales ocultos en ritmos de trenes de picos, etc. De esa manera, la neurociencia teórica puede volver a la teoría y la creación de modelos con "plausibilidad neurocognitiva". ” en mente desde el principio, en lugar de modelos nacidos de “objetivos de ingeniería”.

¿Es la ingeniería de robots elegantes el objetivo fundamental de la neurociencia computacional? No creo que deba serlo. Espero que el objetivo sea comprender el cerebro, la mente y las vidas que los usan. El trabajo metacientífico como este documento es muy importante para mantener a los científicos alineados con ese objetivo. La ciencia* tiende a ser una práctica de "crear la verdad" en la sociedad, por lo que debe ser la máxima prioridad asegurarse de que sea realmente cierto y no solo representaciones geniales que parecen verdaderas .

(*incluida la ciencia de datos)