Cómo funciona Google Deep Dream

Sep 01 2015

¿Los androides sueñan con ovejas eléctricas? Deep Dream de Google ciertamente evoca muchas imágenes de animales. Pero, ¿es esto realmente IA y por qué todo se ve tan alucinante?

Desde la distancia, las imágenes de Deep Dream parecen casi normales, pero luego te das cuenta de que todas las formas están formadas por extraños elementos compuestos.

Los millones de computadoras de nuestro planeta nunca necesitan dormir. Pero eso no les impide soñar. Mientras los humanos trabajamos, jugamos y descansamos, nuestras máquinas reinterpretan incesantemente datos antiguos e incluso escupen todo tipo de material nuevo y extraño, en parte gracias a Google Deep Dream.

Deep Dream es un programa de computadora que localiza y altera patrones que identifica en imágenes digitales. Luego, muestra esas imágenes radicalmente modificadas para que las vean los ojos humanos. Los resultados varían de tontos a artísticos y de pesadilla, según los datos de entrada y los parámetros específicos establecidos por la guía de los empleados de Google.

Una de las mejores formas de entender de qué se trata Deep Dream es probarlo usted mismo. Google hizo públicas sus computadoras de ensueño para comprender mejor cómo Deep Dream logra clasificar e indexar ciertos tipos de imágenes. Puede cargar cualquier imagen que desee en el programa de Google y, segundos después, verá una representación fantástica basada en su fotografía.

Los resultados son típicamente una imagen digital híbrida extraña que parece que Salvador Dalí tuvo una fiesta de pintura salvaje toda la noche con Hieronymus Bosch y Vincent van Gogh. Las hojas, las rocas y las montañas se transforman en remolinos de colores, rectángulos repetitivos y elegantes líneas resaltadas.

Donde antes había un paisaje vacío, Deep Dream crea pagodas, automóviles, puentes y partes del cuerpo humano. Y Deep Dream ve animales ... muchos, muchos animales. Sube un retrato de Tom Cruise y el programa de Google volverá a trabajar los pliegues y espacios como cabezas de perro, peces y otras criaturas familiares. Solo que estos no son animales de apariencia normal, son recreaciones fantásticas que parecen cruzadas con un caleidoscopio teñido de LSD. Son inquietantemente evocadores y, a menudo, más que un poco aterradoras.

Claramente, Google no está lanzando raves nocturnas y alimentando a sus computadoras con químicos alucinatorios. De alguna manera, la compañía está guiando a esos servidores a analizar imágenes y luego regurgitarlas como nuevas representaciones de nuestro mundo.

Cómo funciona todo habla de la naturaleza de la forma en que construimos nuestros dispositivos digitales y la forma en que esas máquinas digieren la cantidad inimaginable de datos que existe en nuestro mundo obsesionado con la tecnología.

Contenido

Neuronas en bits
Cerebros informáticos y bicicletas
Oscuridad en el borde

Neuronas en bits

Esas adorables fotos de vacaciones se convierten en combustible de pesadilla cuando se aplica el algoritmo de Deep Dream.

Las computadoras son productos inorgánicos, por lo que parece poco probable que sueñen en el mismo sentido que las personas. Sin embargo, Deep Dream es un ejemplo aislado de lo complejos que se vuelven los programas de computadora cuando se combinan con datos del mundo humano.

Los desarrolladores de software de Google originalmente concibieron y construyeron Deep Dream para el ImageNet Large Scale Visual Recognition Challenge , un concurso anual que comenzó en 2010. Cada año, decenas de organizaciones compiten para encontrar las formas más efectivas de detectar y clasificar automáticamente millones de imágenes. Después de cada evento, los programadores reevalúan sus métodos y trabajan para mejorar sus técnicas.

El reconocimiento de imágenes es un componente vital que en su mayoría falta en nuestra caja de herramientas de Internet. Nuestros motores de búsqueda están orientados principalmente a la comprensión de palabras clave y frases escritas en lugar de imágenes. Esa es una de las razones por las que debe etiquetar sus colecciones de imágenes con palabras clave como "gato", "casa" y "Tommy". Las computadoras simplemente luchan por identificar el contenido de las imágenes con precisión confiable. Los datos visuales están desordenados, desordenados y desconocidos, todo lo cual dificulta la comprensión de las computadoras.

Gracias a proyectos como Deep Dream, nuestras máquinas están mejorando para ver el mundo visual que las rodea. Para que Deep Dream funcione, los programadores de Google crearon una red neuronal artificial (ANN), un tipo de sistema informático que puede aprender por sí solo. Estas redes neuronales se basan en la funcionalidad del cerebro humano, que utiliza más de 100 mil millones de neuronas (células nerviosas) que transmiten los impulsos nerviosos que permiten todos nuestros procesos corporales.

En una red neuronal, las neuronas artificiales sustituyen a las biológicas, filtrando datos de múltiples formas, una y otra vez, hasta que el sistema llega a algún tipo de resultado. En el caso de Deep Dream, que normalmente tiene entre 10 y 30 capas de neuronas artificiales, el resultado final es una imagen.

¿Cómo reimagina Deep Dream sus fotografías, convirtiéndolas de escenas familiares en representaciones de arte por computadora que pueden perseguir sus pesadillas en los años venideros?

Cerebros informáticos y bicicletas

Puede ver que Deep Dream tomó una imagen de un escarabajo y usó sus datos sobre criaturas similares para reconstruir el sujeto y el fondo de la foto original.

Las redes neuronales no se dedican automáticamente a identificar datos. En realidad, requieren un poco de capacitación; necesitan ser alimentados con conjuntos de datos para usarlos como puntos de referencia. De lo contrario, simplemente examinarían los datos a ciegas, incapaces de encontrarles ningún sentido.

Según el blog oficial de Google, el proceso de formación se basa en la repetición y el análisis. Por ejemplo, si desea entrenar a una ANN para que identifique una bicicleta, le mostraría muchos millones de bicicletas. Además, especificaría claramente, en código de computadora, por supuesto, cómo se ve una bicicleta, con dos ruedas, un asiento y manubrio.

Luego, los investigadores sueltan la red para ver qué resultados puede encontrar. Habrá errores. El programa podría, por ejemplo, devolver una serie de imágenes que incluyan motocicletas y ciclomotores. En esos casos, los programadores pueden modificar el código para aclararle a la computadora que las bicicletas no incluyen motores ni sistemas de escape. Luego ejecutan el programa, una y otra vez, afinando el software hasta que arroja resultados satisfactorios.

El equipo de Deep Dream se dio cuenta de que una vez que una red puede identificar ciertos objetos, también podría recrear esos objetos por sí misma. Entonces, una red que conoce las bicicletas a la vista puede reproducir una imagen de bicicletas sin más información. La idea es que la red esté generando nuevas imágenes creativas gracias a su capacidad para clasificar y ordenar imágenes.

Curiosamente, incluso después de examinar millones de imágenes de bicicletas, las computadoras aún cometen errores críticos al generar sus propias imágenes de bicicletas. Pueden incluir manos humanas parciales en el manillar o pies en los pedales. Esto sucede porque muchas de las imágenes de prueba también incluyen personas, y la computadora finalmente no puede discernir dónde terminan las partes de la bicicleta y comienzan las partes de las personas.

Este tipo de errores ocurren por numerosas razones, e incluso los ingenieros de software no comprenden completamente todos los aspectos de las redes neuronales que construyen. Pero al saber cómo funcionan las redes neuronales, puede comenzar a comprender cómo ocurren estos defectos.

Las neuronas artificiales de la red operan en pilas. Deep Dream puede usar tan solo 10 o hasta 30. Cada capa recoge varios detalles de una imagen. Las capas iniciales pueden detectar elementos básicos como los bordes y los bordes dentro de una imagen. Otro podría identificar colores y orientación específicos . Otras capas pueden buscar formas específicas que se asemejen a objetos como una silla o una bombilla. Las capas finales pueden reaccionar solo a objetos más sofisticados como automóviles, hojas o edificios.

Los desarrolladores de Google llaman a este proceso inceptionism en referencia a esta arquitectura de red neuronal en particular. Incluso publicaron una galería pública para mostrar ejemplos del trabajo de Deep Dream.

Una vez que la red ha identificado varios aspectos de una imagen, pueden ocurrir muchas cosas. Con Deep Dream, Google decidió decirle a la red que creara nuevas imágenes.

Oscuridad en el borde

Cuando Deep Dream crea sus propias imágenes, los resultados son fascinantes pero no exactamente realistas.

Los ingenieros de Google realmente permiten que Deep Dream elija qué partes de una imagen identificar. Luego, esencialmente, les dicen a las computadoras que tomen esos aspectos de la imagen y los enfaticen. Si Deep Dream ve la forma de un perro en el patrón de tela de tu sofá, acentúa los detalles de ese perro.

Cada capa agrega más a la apariencia del perro, desde el pelaje hasta los ojos y la nariz. Lo que una vez fue inofensivo paisley en tu sofá se convierte en una figura canina completa con dientes y ojos. Deep Dream se acerca un poco con cada iteración de su creación, agregando cada vez más complejidad a la imagen. Piense en el perro dentro del perro dentro del perro.

Un ciclo de retroalimentación comienza cuando Deep Dream sobreinterpreta y enfatiza demasiado cada detalle de una imagen. Un cielo lleno de nubes se transforma de una escena idílica a una llena de saltamontes espaciales, formas psicodélicas y autos de colores del arco iris. Y perros. Hay una razón para la sobreabundancia de perros en los resultados de Deep Dream. Cuando los desarrolladores seleccionaron una base de datos para entrenar esta red neuronal, eligieron una que incluía 120 subclases de perros, todas clasificadas por expertos. Entonces, cuando Deep Dream busca detalles, es muy probable que vea caras y patas de cachorro en todos los lugares donde busca.

Deep Dream ni siquiera necesita una imagen real para crear imágenes. Si le da una imagen en blanco en blanco o una llena de estática, todavía "verá" partes de la imagen, usándolas como bloques de construcción para imágenes más raras y raras.

Es el intento del programa de revelar el significado y la forma a partir de datos que de otro modo no tienen forma. Eso habla de la idea detrás de todo el proyecto: tratar de encontrar mejores formas de identificar y contextualizar el contenido de las imágenes esparcidas en las computadoras de todo el mundo.

Entonces, ¿las computadoras pueden soñar realmente? ¿Se están volviendo demasiado inteligentes para su propio bien? ¿O es Deep Dream solo una forma fantástica de imaginar la forma en que nuestra tecnología procesa los datos?

Es difícil saber exactamente qué controla la producción de Deep Dream. Nadie está guiando específicamente el software para completar tareas preprogramadas. Es tomar algunas instrucciones bastante vagas (encontrar detalles y acentuarlos, una y otra vez) y completar los trabajos sin una guía humana abierta.

Las imágenes resultantes son una representación de ese trabajo. Quizás esas representaciones sean obras de arte creadas a máquina. Tal vez sea una manifestación de los sueños digitales, nacidos del silicio y los circuitos. Y tal vez sea el comienzo de una especie de inteligencia artificial que hará que nuestras computadoras dependan menos de las personas.

Puede temer el auge de las computadoras inteligentes que se apoderan del mundo. Pero por ahora, este tipo de proyectos están beneficiando directamente a cualquiera que use la Web. En el lapso de unos pocos años, el reconocimiento de imágenes ha mejorado drásticamente, lo que ayuda a las personas a examinar más rápidamente las imágenes y los gráficos para encontrar la información que necesitan. Al ritmo actual de avance, puede esperar grandes saltos en el reconocimiento de imágenes pronto, en parte gracias a las computadoras de ensueño de Google.

Mucha más información

Nota del autor: cómo funciona Google Deep Dream

Las computadoras no están haciendo arte. No todavía, de todos modos. Y tampoco están soñando. Ambos procesos son claramente humanos y se ven profundamente afectados por la cultura personal, la fisiología, la psicología, las experiencias de vida, la geografía y mucho más. Las computadoras pueden absorber una gran cantidad de datos con respecto a esas variables, pero no las experimentan ni las procesan de la misma manera que las personas. Entonces, si le preocupa que la tecnología esté haciendo que sus experiencias humanas sean obsoletas, no se preocupe todavía. Tu percepción del mundo es mucho más profunda que la de una red informática.

Cómo funciona Google Deep Dream

Neuronas en bits

Cerebros informáticos y bicicletas

Oscuridad en el borde

Mucha más información

Nota del autor: cómo funciona Google Deep Dream

Historias relacionadas

Más enlaces geniales

Fuentes