IA con Python - Guía rápida

Desde la invención de las computadoras o las máquinas, su capacidad para realizar diversas tareas ha experimentado un crecimiento exponencial. Los seres humanos han desarrollado el poder de los sistemas informáticos en términos de sus diversos dominios de trabajo, su velocidad creciente y su tamaño reducido con respecto al tiempo.

Una rama de la informática llamada Inteligencia Artificial persigue la creación de ordenadores o máquinas tan inteligentes como los seres humanos.

Concepto básico de inteligencia artificial (IA)

Según el padre de la Inteligencia Artificial, John McCarthy, se trata de “La ciencia y la ingeniería de hacer máquinas inteligentes, especialmente programas informáticos inteligentes”.

La inteligencia artificial es una forma de hacer que una computadora, un robot controlado por computadora o un software piensen de manera inteligente, de la misma manera que piensan los humanos inteligentes. La IA se logra mediante el estudio de cómo piensa el cerebro humano y cómo los humanos aprenden, deciden y trabajan mientras intentan resolver un problema, y ​​luego utilizan los resultados de este estudio como base para desarrollar software y sistemas inteligentes.

Mientras explota el poder de los sistemas informáticos, la curiosidad del ser humano, lo lleva a preguntarse: "¿Puede una máquina pensar y comportarse como lo hacen los humanos?"

Por lo tanto, el desarrollo de la IA comenzó con la intención de crear inteligencia similar en máquinas que encontramos y consideramos altas en los humanos.

La necesidad de aprender IA

Como sabemos, la IA persigue crear máquinas tan inteligentes como los seres humanos. Existen numerosas razones para que estudiemos la IA. Las razones son las siguientes:

La IA puede aprender a través de los datos

En nuestra vida diaria, tratamos con una gran cantidad de datos y el cerebro humano no puede realizar un seguimiento de tantos datos. Por eso necesitamos automatizar las cosas. Para hacer la automatización, necesitamos estudiar la IA porque puede aprender de los datos y puede realizar las tareas repetitivas con precisión y sin cansancio.

La IA puede enseñarse a sí misma

Es muy necesario que un sistema se enseñe a sí mismo porque los datos en sí cambian continuamente y el conocimiento que se deriva de dichos datos debe actualizarse constantemente. Podemos usar la IA para cumplir con este propósito porque un sistema habilitado para IA puede enseñarse a sí mismo.

La IA puede responder en tiempo real

La inteligencia artificial con la ayuda de redes neuronales puede analizar los datos con mayor profundidad. Debido a esta capacidad, la IA puede pensar y responder a las situaciones que se basan en las condiciones en tiempo real.

La IA logra precisión

Con la ayuda de redes neuronales profundas, la IA puede lograr una precisión tremenda. La IA ayuda en el campo de la medicina a diagnosticar enfermedades como el cáncer a partir de las resonancias magnéticas de los pacientes.

La IA puede organizar los datos para aprovecharlos al máximo

Los datos son propiedad intelectual de los sistemas que utilizan algoritmos de autoaprendizaje. Necesitamos IA para indexar y organizar los datos de una manera que siempre brinde los mejores resultados.

Entender la inteligencia

Con IA, se pueden construir sistemas inteligentes. Necesitamos comprender el concepto de inteligencia para que nuestro cerebro pueda construir otro sistema de inteligencia como él.

¿Qué es la inteligencia?

La capacidad de un sistema para calcular, razonar, percibir relaciones y analogías, aprender de la experiencia, almacenar y recuperar información de la memoria, resolver problemas, comprender ideas complejas, usar el lenguaje natural con fluidez, clasificar, generalizar y adaptar situaciones nuevas.

Tipos de inteligencia

Como lo describe Howard Gardner, un psicólogo del desarrollo estadounidense, la inteligencia se presenta en múltiples aspectos:

No Señor Inteligencia y descripción Ejemplo
1

Linguistic intelligence

La capacidad de hablar, reconocer y utilizar mecanismos de fonología (sonidos del habla), sintaxis (gramática) y semántica (significado).

Narradores, Oradores
2

Musical intelligence

La capacidad de crear, comunicarse y comprender los significados del sonido, comprensión del tono y el ritmo.

Músicos, cantantes, compositores
3

Logical-mathematical intelligence

La capacidad de utilizar y comprender las relaciones en ausencia de acciones u objetos. También es la capacidad de comprender ideas complejas y abstractas.

Matemáticos, científicos
4

Spatial intelligence

La capacidad de percibir información visual o espacial, cambiarla y recrear imágenes visuales sin hacer referencia a los objetos, construir imágenes en 3D y moverlas y rotarlas.

Lectores de mapas, astronautas, físicos
5

Bodily-Kinesthetic intelligence

La capacidad de utilizar parte del cuerpo o la totalidad del cuerpo para resolver problemas o crear productos, controlar la motricidad fina y gruesa y manipular los objetos.

Jugadores, bailarines
6

Intra-personal intelligence

La capacidad de distinguir entre los propios sentimientos, intenciones y motivaciones.

Gautam Buddhha
7

Interpersonal intelligence

La capacidad de reconocer y hacer distinciones entre los sentimientos, creencias e intenciones de otras personas.

Comunicadores de masas, entrevistadores

Se puede decir que una máquina o un sistema es artificialmente inteligente cuando está equipado con al menos una o todas las inteligencias.

¿De qué se compone la inteligencia?

La inteligencia es intangible. Está compuesto por:

  • Reasoning
  • Learning
  • Resolución de problemas
  • Perception
  • Inteligencia lingüística

Repasemos todos los componentes brevemente:

Razonamiento

Es el conjunto de procesos que nos permiten proporcionar una base para juzgar, tomar decisiones y predecir. En general, hay dos tipos:

Razonamiento inductivo Razonamiento deductivo
Realiza observaciones específicas para realizar declaraciones generales amplias. Comienza con una declaración general y examina las posibilidades de llegar a una conclusión lógica específica.
Incluso si todas las premisas son verdaderas en un enunciado, el razonamiento inductivo permite que la conclusión sea falsa. Si algo es cierto para una clase de cosas en general, también es cierto para todos los miembros de esa clase.
Example - "Nita es maestra. Nita es estudiosa. Por lo tanto, todos los maestros son estudiosos". Example - "Todas las mujeres mayores de 60 años son abuelas. Shalini tiene 65 años. Por lo tanto, Shalini es abuela".

Aprendizaje - l

La capacidad de aprendizaje la poseen los seres humanos, especies particulares de animales y sistemas habilitados por IA. El aprendizaje se clasifica de la siguiente manera:

Aprendizaje auditivo

Es aprender escuchando y escuchando. Por ejemplo, estudiantes que escuchan conferencias grabadas en audio.

Aprendizaje episódico

Aprender recordando secuencias de eventos que uno ha presenciado o experimentado. Esto es lineal y ordenado.

Aprendizaje motor

Se aprende mediante el movimiento preciso de los músculos. Por ejemplo, coger objetos, escribir, etc.

Aprendizaje mediante la observación

Aprender observando e imitando a los demás. Por ejemplo, el niño intenta aprender imitando a sus padres.

Aprendizaje perceptual

Es aprender a reconocer los estímulos que se han visto antes. Por ejemplo, identificar y clasificar objetos y situaciones.

Aprendizaje relacional

Implica aprender a diferenciar entre varios estímulos sobre la base de propiedades relacionales, en lugar de propiedades absolutas. Por ejemplo, agregando "un poco menos" de sal al momento de cocinar las papas que salieron saladas la última vez, cuando se cocieron agregando, digamos, una cucharada de sal.

  • Spatial Learning - Es aprender a través de estímulos visuales como imágenes, colores, mapas, etc. Por ejemplo, una persona puede crear una hoja de ruta en mente antes de seguir la ruta.

  • Stimulus-Response Learning- Es aprender a realizar una determinada conducta cuando se presenta un determinado estímulo. Por ejemplo, un perro levanta la oreja al escuchar el timbre.

Resolución de problemas

Es el proceso en el que uno percibe y trata de llegar a una solución deseada de una situación presente tomando algún camino, que está bloqueado por obstáculos conocidos o desconocidos.

La resolución de problemas también incluye decision making, que es el proceso de seleccionar la mejor alternativa adecuada entre múltiples alternativas para alcanzar la meta deseada.

Percepción

Es el proceso de adquirir, interpretar, seleccionar y organizar información sensorial.

La percepción supone sensing. En los seres humanos, los órganos sensoriales ayudan a la percepción. En el dominio de la IA, el mecanismo de percepción reúne los datos adquiridos por los sensores de manera significativa.

Inteligencia lingüística

Es la capacidad de uno para usar, comprender, hablar y escribir el lenguaje verbal y escrito. Es importante en la comunicación interpersonal.

Qué implica la IA

La inteligencia artificial es una vasta área de estudio. Este campo de estudio ayuda a encontrar soluciones a problemas del mundo real.

Veamos ahora los diferentes campos de estudio dentro de la IA:

Aprendizaje automático

Es uno de los campos más populares de la IA. El concepto básico de este campo es hacer que la máquina aprenda a partir de los datos, ya que los seres humanos pueden aprender de su experiencia. Contiene modelos de aprendizaje sobre la base de los cuales se pueden hacer predicciones sobre datos desconocidos.

Lógica

Es otro campo de estudio importante en el que se utiliza la lógica matemática para ejecutar los programas informáticos. Contiene reglas y hechos para realizar coincidencias de patrones, análisis semántico, etc.

buscando

Este campo de estudio se utiliza básicamente en juegos como el ajedrez, tic-tac-toe. Los algoritmos de búsqueda brindan la solución óptima después de buscar en todo el espacio de búsqueda.

Redes neuronales artificiales

Se trata de una red de sistemas informáticos eficientes cuyo tema central se toma prestado de la analogía de las redes neuronales biológicas. ANN se puede utilizar en robótica, reconocimiento de voz, procesamiento de voz, etc.

Algoritmo genético

Los algoritmos genéticos ayudan a resolver problemas con la ayuda de más de un programa. El resultado se basaría en seleccionar al más apto.

Representación del conocimiento

Es el campo de estudio con la ayuda del cual podemos representar los hechos de una manera que la máquina sea comprensible para la máquina. Se representa el conocimiento más eficientemente; el sistema más inteligente sería.

Aplicación de IA

En esta sección, veremos los diferentes campos admitidos por AI:

Juego de azar

La IA juega un papel crucial en juegos estratégicos como ajedrez, póquer, tic-tac-toe, etc., donde la máquina puede pensar en una gran cantidad de posiciones posibles basadas en el conocimiento heurístico.

Procesamiento natural del lenguaje

Es posible interactuar con la computadora que entiende el lenguaje natural hablado por los humanos.

Sistemas expertos

Hay algunas aplicaciones que integran máquinas, software e información especial para impartir razonamiento y asesoramiento. Proporcionan explicaciones y consejos a los usuarios.

Sistemas de visión

Estos sistemas comprenden, interpretan y comprenden información visual en la computadora. Por ejemplo,

  • Un avión espía toma fotografías, que se utilizan para descubrir información espacial o un mapa de las áreas.

  • Los médicos utilizan un sistema clínico experto para diagnosticar al paciente.

  • La policía usa software de computadora que puede reconocer el rostro del criminal con el retrato almacenado hecho por el artista forense.

Reconocimiento de voz

Algunos sistemas inteligentes son capaces de escuchar y comprender el lenguaje en términos de oraciones y sus significados mientras un humano le habla. Puede manejar diferentes acentos, jergas, ruido de fondo, cambios en el ruido humano debido al frío, etc.

Reconocimiento de escritura a mano

El software de reconocimiento de escritura a mano lee el texto escrito en papel con un bolígrafo o en la pantalla con un lápiz. Puede reconocer las formas de las letras y convertirlas en texto editable.

Robots inteligentes

Los robots pueden realizar las tareas encomendadas por un humano. Tienen sensores para detectar datos físicos del mundo real, como luz, calor, temperatura, movimiento, sonido, golpes y presión. Tienen procesadores eficientes, múltiples sensores y una gran memoria para exhibir inteligencia. Además, son capaces de aprender de sus errores y pueden adaptarse al nuevo entorno.

Modelado cognitivo: simulación del procedimiento de pensamiento humano

El modelado cognitivo es básicamente el campo de estudio dentro de la informática que se ocupa del estudio y simulación del proceso de pensamiento de los seres humanos. La principal tarea de la IA es hacer que las máquinas piensen como humanos. La característica más importante del proceso de pensamiento humano es la resolución de problemas. Es por eso que el modelado más o menos cognitivo intenta comprender cómo los humanos pueden resolver los problemas. Después de eso, este modelo se puede utilizar para varias aplicaciones de inteligencia artificial, como aprendizaje automático, robótica, procesamiento del lenguaje natural, etc. A continuación se muestra el diagrama de los diferentes niveles de pensamiento del cerebro humano:

Agente y entorno

En esta sección, nos centraremos en el agente y el entorno y cómo estos ayudan en la Inteligencia Artificial.

Agente

Un agente es cualquier cosa que pueda percibir su entorno a través de sensores y actúa sobre ese entorno a través de efectores.

  • UN human agent tiene órganos sensoriales como ojos, oídos, nariz, lengua y piel paralelos a los sensores, y otros órganos como manos, piernas, boca, para efectores.

  • UN robotic agent reemplaza cámaras y telémetros infrarrojos para los sensores, y varios motores y actuadores para los efectores.

  • UN software agent tiene cadenas de bits codificadas como sus programas y acciones.

Medio ambiente

Algunos programas operan en un artificial environment confinado a la entrada de teclado, base de datos, sistemas de archivos de computadora y salida de caracteres en una pantalla.

Por el contrario, algunos agentes de software (robots de software o softbots) existen en dominios ricos e ilimitados de softbots. El simulador tiene unvery detailed, complex environment. El agente de software debe elegir entre una amplia gama de acciones en tiempo real. Un softbot está diseñado para escanear las preferencias en línea del cliente y muestra elementos interesantes al cliente trabaja en elreal así como un artificial medio ambiente.

En este capítulo, aprenderemos cómo empezar con Python. También entenderemos cómo Python ayuda a la inteligencia artificial.

Por qué Python para IA

La inteligencia artificial se considera la tecnología de tendencia del futuro. Ya se han realizado una serie de aplicaciones. Debido a esto, muchas empresas e investigadores se están interesando en él. Pero la pregunta principal que surge aquí es ¿en qué lenguaje de programación se pueden desarrollar estas aplicaciones de IA? Existen varios lenguajes de programación como Lisp, Prolog, C ++, Java y Python, que se pueden utilizar para desarrollar aplicaciones de IA. Entre ellos, el lenguaje de programación Python gana una gran popularidad y las razones son las siguientes:

Sintaxis simple y menos codificación

Python implica muy menos codificación y una sintaxis simple entre otros lenguajes de programación que se pueden utilizar para desarrollar aplicaciones de IA. Debido a esta característica, las pruebas pueden ser más fáciles y podemos centrarnos más en la programación.

Bibliotecas integradas para proyectos de IA

Una gran ventaja de usar Python para IA es que viene con bibliotecas incorporadas. Python tiene bibliotecas para casi todo tipo de proyectos de IA. Por ejemplo,NumPy, SciPy, matplotlib, nltk, SimpleAI son algunas de las bibliotecas incorporadas importantes de Python.

  • Open source- Python es un lenguaje de programación de código abierto. Esto lo hace muy popular en la comunidad.

  • Can be used for broad range of programming- Python se puede utilizar para una amplia gama de tareas de programación, como pequeños scripts de shell para aplicaciones web empresariales. Esta es otra razón por la que Python es adecuado para proyectos de IA.

Características de Python

Python es un lenguaje de scripting de alto nivel, interpretado, interactivo y orientado a objetos. Python está diseñado para ser muy legible. Utiliza palabras clave en inglés con frecuencia, mientras que otros idiomas usan puntuación, y tiene menos construcciones sintácticas que otros idiomas. Las características de Python incluyen lo siguiente:

  • Easy-to-learn- Python tiene pocas palabras clave, estructura simple y una sintaxis claramente definida. Esto permite que el estudiante aprenda el idioma rápidamente.

  • Easy-to-read - El código Python está más claramente definido y es visible para los ojos.

  • Easy-to-maintain - El código fuente de Python es bastante fácil de mantener.

  • A broad standard library - La mayor parte de la biblioteca de Python es muy portátil y compatible con varias plataformas en UNIX, Windows y Macintosh.

  • Interactive Mode - Python tiene soporte para un modo interactivo que permite pruebas interactivas y depuración de fragmentos de código.

  • Portable - Python puede ejecutarse en una amplia variedad de plataformas de hardware y tiene la misma interfaz en todas las plataformas.

  • Extendable- Podemos agregar módulos de bajo nivel al intérprete de Python. Estos módulos permiten a los programadores agregar o personalizar sus herramientas para que sean más eficientes.

  • Databases - Python proporciona interfaces a las principales bases de datos comerciales.

  • GUI Programming - Python admite aplicaciones GUI que se pueden crear y portar a muchas llamadas al sistema, bibliotecas y sistemas Windows, como Windows MFC, Macintosh y el sistema X Window de Unix.

  • Scalable - Python proporciona una mejor estructura y soporte para programas grandes que los scripts de shell.

Características importantes de Python

Consideremos ahora las siguientes características importantes de Python:

  • Es compatible con métodos de programación estructurados y funcionales, así como con POO.

  • Se puede utilizar como lenguaje de programación o se puede compilar en código de bytes para crear aplicaciones grandes.

  • Proporciona tipos de datos dinámicos de muy alto nivel y admite la verificación dinámica de tipos.

  • Es compatible con la recolección automática de basura.

  • Se puede integrar fácilmente con C, C ++, COM, ActiveX, CORBA y Java.

Instalación de Python

La distribución de Python está disponible para una gran cantidad de plataformas. Debe descargar solo el código binario aplicable para su plataforma e instalar Python.

Si el código binario de su plataforma no está disponible, necesita un compilador C para compilar el código fuente manualmente. Compilar el código fuente ofrece más flexibilidad en cuanto a la elección de las funciones que necesita en su instalación.

Aquí hay una descripción general rápida de la instalación de Python en varias plataformas:

Instalación de Unix y Linux

Siga estos pasos para instalar Python en una máquina Unix / Linux.

  • Abra un navegador web y vaya a https://www.python.org/downloads

  • Siga el enlace para descargar el código fuente comprimido disponible para Unix / Linux.

  • Descarga y extrae archivos.

  • Editando el archivo Módulos / Configuración si desea personalizar algunas opciones.

  • ejecutar ./configure script

  • make

  • hacer instalar

Esto instala Python en la ubicación estándar / usr / local / bin y sus bibliotecas en / usr / local / lib / pythonXX donde XX es la versión de Python.

Instalación de Windows

Siga estos pasos para instalar Python en una máquina con Windows.

  • Abra un navegador web y vaya a https://www.python.org/downloads

  • Siga el enlace del archivo .msi del instalador de Windows python-XYZ , donde XYZ es la versión que necesita instalar.

  • Para utilizar este instalador python-XYZ .msi, el sistema Windows debe ser compatible con Microsoft Installer 2.0. Guarde el archivo de instalación en su máquina local y luego ejecútelo para averiguar si su máquina es compatible con MSI.

  • Ejecute el archivo descargado. Esto abre el asistente de instalación de Python, que es realmente fácil de usar. Simplemente acepte la configuración predeterminada y espere hasta que finalice la instalación.

Instalación en Macintosh

Si está en Mac OS X, se recomienda que utilice Homebrew para instalar Python 3. Es un gran instalador de paquetes para Mac OS X y es realmente fácil de usar. Si no tiene Homebrew, puede instalarlo usando el siguiente comando:

$ ruby -e "$(curl -fsSL
https://raw.githubusercontent.com/Homebrew/install/master/install)"

Podemos actualizar el administrador de paquetes con el siguiente comando:

$ brew update

Ahora ejecute el siguiente comando para instalar Python3 en su sistema:

$ brew install python3

Configurando PATH

Los programas y otros archivos ejecutables pueden estar en muchos directorios, por lo que los sistemas operativos proporcionan una ruta de búsqueda que enumera los directorios en los que el sistema operativo busca ejecutables.

La ruta se almacena en una variable de entorno, que es una cadena con nombre mantenida por el sistema operativo. Esta variable contiene información disponible para el shell de comandos y otros programas.

La variable de ruta se denomina PATH en Unix o Path en Windows (Unix distingue entre mayúsculas y minúsculas; Windows no).

En Mac OS, el instalador maneja los detalles de la ruta. Para invocar al intérprete de Python desde cualquier directorio en particular, debe agregar el directorio de Python a su ruta.

Configuración de ruta en Unix / Linux

Para agregar el directorio de Python a la ruta de una sesión en particular en Unix:

  • En el shell de csh

    Tipo setenv PATH "$PATH:/usr/local/bin/python" y presione Enter.

  • En el shell bash (Linux)

    Tipo export ATH = "$PATH:/usr/local/bin/python" y presione Enter.

  • En el caparazón sh o ksh

    Tipo PATH = "$PATH:/usr/local/bin/python" y presione Enter.

Note - / usr / local / bin / python es la ruta del directorio de Python.

Establecer ruta en Windows

Para agregar el directorio de Python a la ruta de una sesión en particular en Windows:

  • At the command prompt - tipo path %path%;C:\Python y presione Enter.

Note - C: \ Python es la ruta del directorio de Python.

Ejecutando Python

Veamos ahora las diferentes formas de ejecutar Python. Las formas se describen a continuación:

Intérprete interactivo

Podemos iniciar Python desde Unix, DOS o cualquier otro sistema que le proporcione un intérprete de línea de comandos o una ventana de shell.

  • Entrar python en la línea de comando.

  • Comience a codificar de inmediato en el intérprete interactivo.

$python # Unix/Linux

o

python% # Unix/Linux

o

C:> python # Windows/DOS

Aquí está la lista de todas las opciones de línea de comando disponibles:

S.No. Opción y descripción
1

-d

Proporciona salida de depuración.

2

-o

Genera código de bytes optimizado (resultando en archivos .pyo).

3

-S

No ejecute el sitio de importación para buscar rutas de Python al inicio.

4

-v

Salida detallada (seguimiento detallado en declaraciones de importación).

5

-x

Deshabilita las excepciones integradas basadas en clases (solo use cadenas); obsoleto a partir de la versión 1.6.

6

-c cmd

Ejecuta el script de Python enviado como una cadena de cmd.

7

File

Ejecute el script de Python desde el archivo dado.

Script de la línea de comandos

Se puede ejecutar un script de Python en la línea de comando invocando al intérprete en su aplicación, como se muestra a continuación:

$python script.py # Unix/Linux

o,

python% script.py # Unix/Linux

o,

C:> python script.py # Windows/DOS

Note - Asegúrese de que el modo de permiso de archivo permita la ejecución.

Entorno de desarrollo integrado

También puede ejecutar Python desde un entorno de interfaz gráfica de usuario (GUI), si tiene una aplicación GUI en su sistema que admita Python.

  • Unix - IDLE es el primer IDE de Unix para Python.

  • Windows - PythonWin es la primera interfaz de Windows para Python y es un IDE con una GUI.

  • Macintosh - La versión Macintosh de Python junto con IDLE IDE está disponible en el sitio web principal, descargable como archivos MacBinary o BinHex'd.

Si no puede configurar el entorno correctamente, puede pedir ayuda al administrador del sistema. Asegúrese de que el entorno de Python esté configurado correctamente y funcione perfectamente.

También podemos usar otra plataforma Python llamada Anaconda. Incluye cientos de paquetes de ciencia de datos populares y el paquete conda y el administrador de entorno virtual para Windows, Linux y MacOS. Puede descargarlo según su sistema operativo desde el enlacehttps://www.anaconda.com/download/.

Para este tutorial usamos la versión Python 3.6.3 en MS Windows.

El aprendizaje significa la adquisición de conocimientos o habilidades a través del estudio o la experiencia. En base a esto, podemos definir el aprendizaje automático (ML) de la siguiente manera:

Puede definirse como el campo de la informática, más específicamente una aplicación de inteligencia artificial, que proporciona a los sistemas informáticos la capacidad de aprender con datos y mejorar a partir de la experiencia sin ser programados explícitamente.

Básicamente, el enfoque principal del aprendizaje automático es permitir que las computadoras aprendan automáticamente sin intervención humana. Ahora surge la pregunta de cómo se puede iniciar y realizar dicho aprendizaje. Puede iniciarse con las observaciones de datos. Los datos pueden ser algunos ejemplos, instrucción o algunas experiencias directas también. Luego, sobre la base de esta entrada, la máquina toma una mejor decisión al buscar algunos patrones en los datos.

Tipos de aprendizaje automático (ML)

Los algoritmos de aprendizaje automático ayudan al sistema informático a aprender sin estar programado explícitamente. Estos algoritmos se clasifican en supervisados ​​o no supervisados. Veamos ahora algunos algoritmos:

Algoritmos de aprendizaje automático supervisados

Este es el algoritmo de aprendizaje automático más utilizado. Se llama supervisado porque el proceso de aprendizaje de algoritmos a partir del conjunto de datos de entrenamiento se puede considerar como un maestro que supervisa el proceso de aprendizaje. En este tipo de algoritmo ML, los posibles resultados ya se conocen y los datos de entrenamiento también se etiquetan con respuestas correctas. Se puede entender de la siguiente manera:

Supongamos que tenemos variables de entrada x y una variable de salida y y aplicamos un algoritmo para aprender la función de mapeo de la entrada a la salida, como:

Y = f(x)

Ahora, el objetivo principal es aproximar la función de mapeo tan bien que cuando tengamos nuevos datos de entrada (x), podamos predecir la variable de salida (Y) para esos datos.

Los problemas de apoyo principalmente supervisados ​​se pueden dividir en los siguientes dos tipos de problemas:

  • Classification - Un problema se denomina problema de clasificación cuando tenemos la salida categorizada como “negro”, “docente”, “no docente”, etc.

  • Regression - Un problema se denomina problema de regresión cuando tenemos la salida de valor real como "distancia", "kilogramo", etc.

Árbol de decisión, bosque aleatorio, knn, regresión logística son ejemplos de algoritmos de aprendizaje automático supervisados.

Algoritmos de aprendizaje automático no supervisados

Como sugiere el nombre, este tipo de algoritmos de aprendizaje automático no tienen ningún supervisor que proporcione ningún tipo de orientación. Es por eso que los algoritmos de aprendizaje automático no supervisados ​​están estrechamente alineados con lo que algunos llaman verdadera inteligencia artificial. Se puede entender de la siguiente manera:

Supongamos que tenemos la variable de entrada x, entonces no habrá variables de salida correspondientes como ocurre en los algoritmos de aprendizaje supervisado.

En palabras simples, podemos decir que en el aprendizaje no supervisado no habrá una respuesta correcta ni un maestro para la orientación. Los algoritmos ayudan a descubrir patrones interesantes en los datos.

Los problemas de aprendizaje no supervisados ​​se pueden dividir en los siguientes dos tipos de problemas:

  • Clustering- En los problemas de agrupación, necesitamos descubrir las agrupaciones inherentes a los datos. Por ejemplo, agrupar a los clientes por su comportamiento de compra.

  • Association- Un problema se denomina problema de asociación porque este tipo de problemas requiere descubrir las reglas que describen grandes porciones de nuestros datos. Por ejemplo, encontrar clientes que compren ambosx y y.

K-means para agrupación en clústeres, algoritmo Apriori para asociación son los ejemplos de algoritmos de aprendizaje automático no supervisados.

Algoritmos de aprendizaje automático de refuerzo

Este tipo de algoritmos de aprendizaje automático se utilizan menos. Estos algoritmos entrenan a los sistemas para que tomen decisiones específicas. Básicamente, la máquina está expuesta a un entorno en el que se entrena continuamente utilizando el método de prueba y error. Estos algoritmos aprenden de la experiencia pasada e intentan capturar el mejor conocimiento posible para tomar decisiones precisas. El proceso de decisión de Markov es un ejemplo de algoritmos de aprendizaje automático de refuerzo.

Algoritmos de aprendizaje automático más comunes

En esta sección, aprenderemos sobre los algoritmos de aprendizaje automático más comunes. Los algoritmos se describen a continuación:

Regresión lineal

Es uno de los algoritmos más conocidos en estadística y aprendizaje automático.

Concepto básico: la regresión principalmente lineal es un modelo lineal que asume una relación lineal entre las variables de entrada, digamos x, y la variable de salida única, digamos y. En otras palabras, podemos decir que y se puede calcular a partir de una combinación lineal de las variables de entrada x. La relación entre variables se puede establecer ajustando la mejor línea.

Tipos de regresión lineal

La regresión lineal es de los siguientes dos tipos:

  • Simple linear regression - Un algoritmo de regresión lineal se denomina regresión lineal simple si solo tiene una variable independiente.

  • Multiple linear regression - Un algoritmo de regresión lineal se denomina regresión lineal múltiple si tiene más de una variable independiente.

La regresión lineal se utiliza principalmente para estimar los valores reales en función de las variables continuas. Por ejemplo, la venta total de una tienda en un día, basada en valores reales, se puede estimar mediante regresión lineal.

Regresión logística

Es un algoritmo de clasificación y también conocido como logit regresión.

Principalmente, la regresión logística es un algoritmo de clasificación que se utiliza para estimar los valores discretos como 0 o 1, verdadero o falso, sí o no en función de un conjunto dado de variables independientes. Básicamente, predice la probabilidad, por lo que su salida se encuentra entre 0 y 1.

Árbol de decisión

El árbol de decisiones es un algoritmo de aprendizaje supervisado que se utiliza principalmente para problemas de clasificación.

Básicamente es un clasificador expresado como partición recursiva basada en las variables independientes. El árbol de decisión tiene nodos que forman el árbol enraizado. El árbol enraizado es un árbol dirigido con un nodo llamado "raíz". La raíz no tiene bordes entrantes y todos los demás nodos tienen un borde entrante. Estos nodos se denominan hojas o nodos de decisión. Por ejemplo, considere el siguiente árbol de decisiones para ver si una persona está en forma o no.

Máquina de vectores de soporte (SVM)

Se utiliza para problemas de clasificación y regresión. Pero principalmente se utiliza para problemas de clasificación. El concepto principal de SVM es trazar cada elemento de datos como un punto en el espacio n-dimensional con el valor de cada característica siendo el valor de una coordenada particular. Aquí n serían las características que tendríamos. A continuación se muestra una representación gráfica simple para comprender el concepto de SVM:

En el diagrama anterior, tenemos dos características, por lo tanto, primero debemos trazar estas dos variables en un espacio bidimensional donde cada punto tiene dos coordenadas, llamadas vectores de soporte. La línea divide los datos en dos grupos clasificados diferentes. Esta línea sería el clasificador.

Bayes ingenuo

También es una técnica de clasificación. La lógica detrás de esta técnica de clasificación es utilizar el teorema de Bayes para construir clasificadores. El supuesto es que los predictores son independientes. En palabras simples, asume que la presencia de una característica particular en una clase no está relacionada con la presencia de ninguna otra característica. A continuación se muestra la ecuación del teorema de Bayes:

$$ P \ left (\ frac {A} {B} \ right) = \ frac {P \ left (\ frac {B} {A} \ right) P \ left (A \ right)} {P \ left ( B \ right)} $$

El modelo Naïve Bayes es fácil de construir y particularmente útil para grandes conjuntos de datos.

K-Vecinos más cercanos (KNN)

Se utiliza tanto para la clasificación como para la regresión de los problemas. Se usa ampliamente para resolver problemas de clasificación. El concepto principal de este algoritmo es que solía almacenar todos los casos disponibles y clasifica los nuevos casos por mayoría de votos de sus k vecinos. Luego, el caso se asigna a la clase que es la más común entre sus K vecinos más cercanos, medida por una función de distancia. La función de distancia puede ser distancia euclidiana, de Minkowski y de Hamming. Considere lo siguiente para usar KNN:

  • Computacionalmente, los KNN son más costosos que otros algoritmos utilizados para problemas de clasificación.

  • La normalización de las variables necesarias, de lo contrario, las variables de rango superior pueden sesgarlo.

  • En KNN, tenemos que trabajar en una etapa de preprocesamiento como la eliminación de ruido.

Agrupación de K-medias

Como sugiere el nombre, se utiliza para resolver los problemas de agrupamiento. Básicamente es un tipo de aprendizaje no supervisado. La lógica principal del algoritmo de agrupación de K-Means es clasificar el conjunto de datos a través de una serie de agrupaciones. Siga estos pasos para formar clústeres por K-means:

  • K-means elige un número k de puntos para cada grupo conocido como centroides.

  • Ahora, cada punto de datos forma un grupo con los centroides más cercanos, es decir, k grupos.

  • Ahora, encontrará los centroides de cada grupo en función de los miembros del grupo existentes.

  • Necesitamos repetir estos pasos hasta que ocurra la convergencia.

Bosque aleatorio

Es un algoritmo de clasificación supervisado. La ventaja del algoritmo de bosque aleatorio es que se puede utilizar para problemas de clasificación y regresión. Básicamente es la colección de árboles de decisión (es decir, bosque) o puede decir conjunto de árboles de decisión. El concepto básico de bosque aleatorio es que cada árbol da una clasificación y el bosque elige las mejores clasificaciones de ellos. Las siguientes son las ventajas del algoritmo Random Forest:

  • El clasificador de bosque aleatorio se puede utilizar para tareas de clasificación y regresión.

  • Pueden manejar los valores perdidos.

  • No se ajustará demasiado al modelo incluso si tenemos más árboles en el bosque.

Ya hemos estudiado algoritmos de aprendizaje automático supervisados ​​y no supervisados. Estos algoritmos requieren datos formateados para iniciar el proceso de entrenamiento. Debemos preparar o formatear los datos de cierta manera para que se puedan suministrar como entrada a los algoritmos de ML.

Este capítulo se centra en la preparación de datos para algoritmos de aprendizaje automático.

Procesamiento previo de los datos

En nuestra vida diaria, tratamos con muchos datos, pero estos datos están en forma cruda. Para proporcionar los datos como entrada de algoritmos de aprendizaje automático, necesitamos convertirlos en datos significativos. Ahí es donde entra en escena el preprocesamiento de datos. En otras palabras simples, podemos decir que antes de proporcionar los datos a los algoritmos de aprendizaje automático, necesitamos preprocesar los datos.

Pasos de procesamiento previo de datos

Siga estos pasos para preprocesar los datos en Python:

Step 1 − Importing the useful packages - Si usamos Python, este sería el primer paso para convertir los datos a un formato determinado, es decir, preprocesar. Se puede hacer de la siguiente manera:

import numpy as np
import sklearn.preprocessing

Aquí hemos utilizado los siguientes dos paquetes:

  • NumPy - Básicamente, NumPy es un paquete de procesamiento de matrices de propósito general diseñado para manipular de manera eficiente matrices multidimensionales de registros arbitrarios sin sacrificar demasiada velocidad para matrices multidimensionales pequeñas.

  • Sklearn.preprocessing - Este paquete proporciona muchas funciones de utilidad comunes y clases de transformadores para cambiar los vectores de características sin procesar en una representación más adecuada para los algoritmos de aprendizaje automático.

Step 2 − Defining sample data - Después de importar los paquetes, necesitamos definir algunos datos de muestra para que podamos aplicar técnicas de preprocesamiento en esos datos. Ahora definiremos los siguientes datos de muestra:

input_data = np.array([2.1, -1.9, 5.5],
                      [-1.5, 2.4, 3.5],
                      [0.5, -7.9, 5.6],
                      [5.9, 2.3, -5.8])

Step3 − Applying preprocessing technique - En este paso, necesitamos aplicar alguna de las técnicas de preprocesamiento.

La siguiente sección describe las técnicas de preprocesamiento de datos.

Técnicas para el preprocesamiento de datos

Las técnicas para el preprocesamiento de datos se describen a continuación:

Binarización

Esta es la técnica de preprocesamiento que se utiliza cuando necesitamos convertir nuestros valores numéricos en valores booleanos. Podemos usar un método incorporado para binarizar los datos de entrada, digamos, usando 0.5 como el valor de umbral de la siguiente manera:

data_binarized = preprocessing.Binarizer(threshold = 0.5).transform(input_data)
print("\nBinarized data:\n", data_binarized)

Ahora, después de ejecutar el código anterior obtendremos el siguiente resultado, todos los valores por encima de 0.5 (valor de umbral) se convertirían a 1 y todos los valores por debajo de 0.5 se convertirían a 0.

Binarized data

[[ 1. 0. 1.]
[ 0. 1. 1.]
[ 0. 0. 1.]
[ 1. 1. 0.]]

Eliminación media

Es otra técnica de preprocesamiento muy común que se utiliza en el aprendizaje automático. Básicamente, se utiliza para eliminar la media del vector de características para que cada característica esté centrada en cero. También podemos eliminar el sesgo de las características en el vector de características. Para aplicar la técnica de preprocesamiento de eliminación media en los datos de muestra, podemos escribir el código Python que se muestra a continuación. El código mostrará la desviación media y estándar de los datos de entrada:

print("Mean = ", input_data.mean(axis = 0))
print("Std deviation = ", input_data.std(axis = 0))

Obtendremos el siguiente resultado después de ejecutar las líneas de código anteriores:

Mean = [ 1.75       -1.275       2.2]
Std deviation = [ 2.71431391  4.20022321  4.69414529]

Ahora, el siguiente código eliminará la desviación media y estándar de los datos de entrada:

data_scaled = preprocessing.scale(input_data)
print("Mean =", data_scaled.mean(axis=0))
print("Std deviation =", data_scaled.std(axis = 0))

Obtendremos el siguiente resultado después de ejecutar las líneas de código anteriores:

Mean = [ 1.11022302e-16 0.00000000e+00 0.00000000e+00]
Std deviation = [ 1.             1.             1.]

Escalada

Es otra técnica de preprocesamiento de datos que se utiliza para escalar los vectores de características. Es necesario escalar los vectores de características porque los valores de cada característica pueden variar entre muchos valores aleatorios. En otras palabras, podemos decir que escalar es importante porque no queremos que ninguna característica sea sintéticamente grande o pequeña. Con la ayuda del siguiente código de Python, podemos escalar nuestros datos de entrada, es decir, vector de características -

# Min max scaling

data_scaler_minmax = preprocessing.MinMaxScaler(feature_range=(0,1))
data_scaled_minmax = data_scaler_minmax.fit_transform(input_data)
print ("\nMin max scaled data:\n", data_scaled_minmax)

Obtendremos el siguiente resultado después de ejecutar las líneas de código anteriores:

Min max scaled data

[ [ 0.48648649  0.58252427   0.99122807]
[   0.          1.           0.81578947]
[   0.27027027  0.           1.        ]
[   1.          0. 99029126  0.        ]]

Normalización

Es otra técnica de preprocesamiento de datos que se utiliza para modificar los vectores de características. Este tipo de modificación es necesaria para medir los vectores de características en una escala común. Los siguientes son dos tipos de normalización que se pueden utilizar en el aprendizaje automático:

L1 Normalization

También se le conoce como Least Absolute Deviations. Este tipo de normalización modifica los valores de modo que la suma de los valores absolutos sea siempre hasta 1 en cada fila. Se puede implementar en los datos de entrada con la ayuda del siguiente código Python:

# Normalize data
data_normalized_l1 = preprocessing.normalize(input_data, norm = 'l1')
print("\nL1 normalized data:\n", data_normalized_l1)

La línea de código anterior genera la siguiente salida & miuns;

L1 normalized data:
[[ 0.22105263  -0.2          0.57894737]
[ -0.2027027    0.32432432   0.47297297]
[  0.03571429  -0.56428571   0.4       ]
[  0.42142857   0.16428571  -0.41428571]]

L2 Normalization

También se le conoce como least squares. Este tipo de normalización modifica los valores para que la suma de los cuadrados sea siempre hasta 1 en cada fila. Se puede implementar en los datos de entrada con la ayuda del siguiente código Python:

# Normalize data
data_normalized_l2 = preprocessing.normalize(input_data, norm = 'l2')
print("\nL2 normalized data:\n", data_normalized_l2)

La línea de código anterior generará el siguiente resultado:

L2 normalized data:
[[ 0.33946114  -0.30713151   0.88906489]
[ -0.33325106   0.53320169   0.7775858 ]
[  0.05156558  -0.81473612   0.57753446]
[  0.68706914   0.26784051  -0.6754239 ]]

Etiquetar los datos

Ya sabemos que los datos en un formato determinado son necesarios para los algoritmos de aprendizaje automático. Otro requisito importante es que los datos deben etiquetarse correctamente antes de enviarlos como entrada de algoritmos de aprendizaje automático. Por ejemplo, si hablamos de clasificación, hay muchas etiquetas en los datos. Esas etiquetas tienen forma de palabras, números, etc. Funciones relacionadas con el aprendizaje automático ensklearnEspere que los datos tengan etiquetas numéricas. Por lo tanto, si los datos están en otra forma, deben convertirse a números. Este proceso de transformar las etiquetas de las palabras en forma numérica se denomina codificación de etiquetas.

Pasos de codificación de etiquetas

Siga estos pasos para codificar las etiquetas de datos en Python:

Step1 − Importing the useful packages

Si usamos Python, este sería el primer paso para convertir los datos a cierto formato, es decir, preprocesar. Se puede hacer de la siguiente manera:

import numpy as np
from sklearn import preprocessing

Step 2 − Defining sample labels

Después de importar los paquetes, necesitamos definir algunas etiquetas de muestra para que podamos crear y entrenar el codificador de etiquetas. Ahora definiremos las siguientes etiquetas de muestra:

# Sample input labels
input_labels = ['red','black','red','green','black','yellow','white']

Step 3 − Creating & training of label encoder object

En este paso, necesitamos crear el codificador de etiquetas y entrenarlo. El siguiente código de Python ayudará a hacer esto:

# Creating the label encoder
encoder = preprocessing.LabelEncoder()
encoder.fit(input_labels)

Lo siguiente sería el resultado después de ejecutar el código Python anterior:

LabelEncoder()

Step4 − Checking the performance by encoding random ordered list

Este paso se puede utilizar para comprobar el rendimiento codificando la lista ordenada aleatoriamente. El siguiente código de Python se puede escribir para hacer lo mismo:

# encoding a set of labels
test_labels = ['green','red','black']
encoded_values = encoder.transform(test_labels)
print("\nLabels =", test_labels)

Las etiquetas se imprimirían de la siguiente manera:

Labels = ['green', 'red', 'black']

Ahora, podemos obtener la lista de valores codificados, es decir, etiquetas de palabras convertidas en números de la siguiente manera:

print("Encoded values =", list(encoded_values))

Los valores codificados se imprimirían de la siguiente manera:

Encoded values = [1, 2, 0]

Step 5 − Checking the performance by decoding a random set of numbers −

Este paso se puede utilizar para comprobar el rendimiento decodificando el conjunto aleatorio de números. El siguiente código de Python se puede escribir para hacer lo mismo:

# decoding a set of values
encoded_values = [3,0,4,1]
decoded_list = encoder.inverse_transform(encoded_values)
print("\nEncoded values =", encoded_values)

Ahora, los valores codificados se imprimirían de la siguiente manera:

Encoded values = [3, 0, 4, 1]
print("\nDecoded labels =", list(decoded_list))

Ahora, los valores decodificados se imprimirían de la siguiente manera:

Decoded labels = ['white', 'black', 'yellow', 'green']

Datos etiquetados v / s sin etiqueta

Los datos sin etiquetar consisten principalmente en muestras de objetos naturales o creados por humanos que se pueden obtener fácilmente del mundo. Incluyen audio, video, fotos, artículos de noticias, etc.

Por otro lado, los datos etiquetados toman un conjunto de datos no etiquetados y aumentan cada parte de esos datos no etiquetados con alguna etiqueta o etiqueta o clase que sea significativa. Por ejemplo, si tenemos una foto, entonces la etiqueta se puede poner en función del contenido de la foto, es decir, es una foto de un niño o una niña o un animal o cualquier otra cosa. El etiquetado de los datos requiere experiencia humana o juicio sobre un dato determinado sin etiquetar.

Hay muchos escenarios en los que los datos no etiquetados son abundantes y se obtienen fácilmente, pero los datos etiquetados a menudo requieren que un humano / experto los anote. El aprendizaje semi-supervisado intenta combinar datos etiquetados y no etiquetados para construir mejores modelos.

En este capítulo, nos centraremos en la implementación del aprendizaje supervisado: clasificación.

La técnica o modelo de clasificación intenta obtener alguna conclusión a partir de los valores observados. En el problema de clasificación, tenemos la salida categorizada como “Negro” o “blanco” o “Docente” y “No docente”. Mientras construimos el modelo de clasificación, necesitamos tener un conjunto de datos de entrenamiento que contenga puntos de datos y las etiquetas correspondientes. Por ejemplo, si queremos comprobar si la imagen es de un coche o no. Para comprobar esto, crearemos un conjunto de datos de entrenamiento con las dos clases relacionadas con "coche" y "sin coche". Luego, necesitamos entrenar el modelo usando las muestras de entrenamiento. Los modelos de clasificación se utilizan principalmente en reconocimiento facial, identificación de spam, etc.

Pasos para construir un clasificador en Python

Para construir un clasificador en Python, usaremos Python 3 y Scikit-learn, que es una herramienta para el aprendizaje automático. Siga estos pasos para construir un clasificador en Python:

Paso 1: Importar Scikit-learn

Este sería el primer paso para construir un clasificador en Python. En este paso, instalaremos un paquete de Python llamado Scikit-learn, que es uno de los mejores módulos de aprendizaje automático en Python. El siguiente comando nos ayudará a importar el paquete:

Import Sklearn

Paso 2: importar el conjunto de datos de Scikit-learn

En este paso, podemos comenzar a trabajar con el conjunto de datos para nuestro modelo de aprendizaje automático. Aquí vamos a utilizarthe Base de datos de diagnóstico de cáncer de mama de Wisconsin. El conjunto de datos incluye diversa información sobre los tumores de cáncer de mama, así como etiquetas de clasificación demalignant o benign. El conjunto de datos tiene 569 instancias, o datos, sobre 569 tumores e incluye información sobre 30 atributos o características, como el radio del tumor, la textura, la suavidad y el área. Con la ayuda del siguiente comando, podemos importar el conjunto de datos de cáncer de mama de Scikit-learn:

from sklearn.datasets import load_breast_cancer

Ahora, el siguiente comando cargará el conjunto de datos.

data = load_breast_cancer()

A continuación se muestra una lista de claves importantes del diccionario:

  • Nombres de etiquetas de clasificación (target_names)
  • Las etiquetas reales (objetivo)
  • Los nombres de atributos / características (feature_names)
  • El atributo (datos)

Ahora, con la ayuda del siguiente comando, podemos crear nuevas variables para cada conjunto importante de información y asignar los datos. En otras palabras, podemos organizar los datos con los siguientes comandos:

label_names = data['target_names']
labels = data['target']
feature_names = data['feature_names']
features = data['data']

Ahora, para que quede más claro, podemos imprimir las etiquetas de clase, la etiqueta de la primera instancia de datos, los nombres de nuestras características y el valor de la característica con la ayuda de los siguientes comandos:

print(label_names)

El comando anterior imprimirá los nombres de las clases que son malignos y benignos respectivamente. Se muestra como la salida a continuación:

['malignant' 'benign']

Ahora, el siguiente comando mostrará que se asignan a los valores binarios 0 y 1. Aquí 0 representa cáncer maligno y 1 representa cáncer benigno. Recibirá el siguiente resultado:

print(labels[0])
0

Los dos comandos que se dan a continuación producirán los nombres y valores de las funciones.

print(feature_names[0])
mean radius
print(features[0])
[ 1.79900000e+01 1.03800000e+01 1.22800000e+02 1.00100000e+03
  1.18400000e-01 2.77600000e-01 3.00100000e-01 1.47100000e-01
  2.41900000e-01 7.87100000e-02 1.09500000e+00 9.05300000e-01
  8.58900000e+00 1.53400000e+02 6.39900000e-03 4.90400000e-02
  5.37300000e-02 1.58700000e-02 3.00300000e-02 6.19300000e-03
  2.53800000e+01 1.73300000e+01 1.84600000e+02 2.01900000e+03
  1.62200000e-01 6.65600000e-01 7.11900000e-01 2.65400000e-01
  4.60100000e-01 1.18900000e-01]

De la salida anterior, podemos ver que la primera instancia de datos es un tumor maligno cuyo radio es 1.7990000e + 01.

Paso 3: organización de datos en conjuntos

En este paso, dividiremos nuestros datos en dos partes, a saber, un conjunto de entrenamiento y un conjunto de prueba. Dividir los datos en estos conjuntos es muy importante porque tenemos que probar nuestro modelo en los datos invisibles. Para dividir los datos en conjuntos, sklearn tiene una función llamadatrain_test_split()función. Con la ayuda de los siguientes comandos, podemos dividir los datos en estos conjuntos:

from sklearn.model_selection import train_test_split

El comando anterior importará el train_test_splitfunción de sklearn y el siguiente comando dividirá los datos en datos de entrenamiento y de prueba. En el ejemplo que se muestra a continuación, estamos usando el 40% de los datos para realizar pruebas y los datos restantes se usarían para entrenar el modelo.

train, test, train_labels, test_labels = train_test_split(features,labels,test_size = 0.40, random_state = 42)

Paso 4: construcción del modelo

En este paso, estaremos construyendo nuestro modelo. Vamos a utilizar el algoritmo Naïve Bayes para construir el modelo. Los siguientes comandos se pueden usar para construir el modelo:

from sklearn.naive_bayes import GaussianNB

El comando anterior importará el módulo GaussianNB. Ahora, el siguiente comando te ayudará a inicializar el modelo.

gnb = GaussianNB()

Entrenaremos el modelo ajustándolo a los datos usando gnb.fit ().

model = gnb.fit(train, train_labels)

Paso 5: evaluación del modelo y su precisión

En este paso, vamos a evaluar el modelo haciendo predicciones sobre nuestros datos de prueba. Entonces averiguaremos también su precisión. Para hacer predicciones, usaremos la función predict (). El siguiente comando te ayudará a hacer esto:

preds = gnb.predict(test)
print(preds)

[1 0 0 1 1 0 0 0 1 1 1 0 1 0 1 0 1 1 1 0 1 1 0 1 1 1 1 1 1
 0 1 1 1 1 1 1 0 1 0 1 1 0 1 1 1 1 1 1 1 1 0 0 1 1 1 1 1 0 
 0 1 1 0 0 1 1 1 0 0 1 1 0 0 1 0 1 1 1 1 1 1 0 1 1 0 0 0 0 
 0 1 1 1 1 1 1 1 1 0 0 1 0 0 1 0 0 1 1 1 0 1 1 0 1 1 0 0 0 
 1 1 1 0 0 1 1 0 1 0 0 1 1 0 0 0 1 1 1 0 1 1 0 0 1 0 1 1 0 
 1 0 0 1 1 1 1 1 1 1 0 0 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 0 
 1 1 0 1 1 1 1 1 1 0 0 0 1 1 0 1 0 1 1 1 1 0 1 1 0 1 1 1 0 
 1 0 0 1 1 1 1 1 1 1 1 0 1 1 1 1 1 0 1 0 0 1 1 0 1]

La serie anterior de 0 y 1 son los valores predichos para las clases de tumores: malignos y benignos.

Ahora, comparando las dos matrices a saber test_labels y preds, podemos averiguar la precisión de nuestro modelo. Vamos a utilizar elaccuracy_score()función para determinar la precisión. Considere el siguiente comando para esto:

from sklearn.metrics import accuracy_score
print(accuracy_score(test_labels,preds))
0.951754385965

El resultado muestra que el clasificador NaïveBayes tiene una precisión del 95,17%.

De esta forma, con la ayuda de los pasos anteriores podemos construir nuestro clasificador en Python.

Clasificador de construcción en Python

En esta sección, aprenderemos cómo construir un clasificador en Python.

Clasificador Naïve Bayes

Naïve Bayes es una técnica de clasificación utilizada para construir clasificadores usando el teorema de Bayes. El supuesto es que los predictores son independientes. En palabras simples, asume que la presencia de una característica particular en una clase no está relacionada con la presencia de ninguna otra característica. Para construir el clasificador Naïve Bayes, necesitamos usar la biblioteca de Python llamada scikit learn. Hay tres tipos de modelos Naïve Bayes llamadosGaussian, Multinomial and Bernoulli bajo el paquete scikit learn.

Para construir un modelo de clasificador de aprendizaje automático Naïve Bayes, necesitamos lo siguiente y menos

Conjunto de datos

Vamos a utilizar el conjunto de datos denominado Base de datos de diagnóstico de Wisconsin del cáncer de mama. El conjunto de datos incluye diversa información sobre los tumores de cáncer de mama, así como etiquetas de clasificación demalignant o benign. El conjunto de datos tiene 569 instancias, o datos, sobre 569 tumores e incluye información sobre 30 atributos o características, como el radio del tumor, la textura, la suavidad y el área. Podemos importar este conjunto de datos desde el paquete sklearn.

Modelo ingenuo de Bayes

Para construir el clasificador Naïve Bayes, necesitamos un modelo Naïve Bayes. Como se dijo anteriormente, hay tres tipos de modelos Naïve Bayes llamadosGaussian, Multinomial y Bernoullibajo el paquete scikit learn. Aquí, en el siguiente ejemplo vamos a utilizar el modelo Gaussiano Naïve Bayes.

Al utilizar lo anterior, vamos a construir un modelo de aprendizaje automático Naïve Bayes para usar la información del tumor para predecir si un tumor es maligno o benigno.

Para empezar, necesitamos instalar el módulo sklearn. Se puede hacer con la ayuda del siguiente comando:

Import Sklearn

Ahora, necesitamos importar el conjunto de datos denominado Base de datos de diagnóstico de Wisconsin de cáncer de mama.

from sklearn.datasets import load_breast_cancer

Ahora, el siguiente comando cargará el conjunto de datos.

data = load_breast_cancer()

Los datos se pueden organizar de la siguiente manera:

label_names = data['target_names']
labels = data['target']
feature_names = data['feature_names']
features = data['data']

Ahora, para que quede más claro, podemos imprimir las etiquetas de clase, la etiqueta de la primera instancia de datos, los nombres de nuestras características y el valor de la característica con la ayuda de los siguientes comandos:

print(label_names)

El comando anterior imprimirá los nombres de las clases que son malignos y benignos respectivamente. Se muestra como la salida a continuación:

['malignant' 'benign']

Ahora, el comando que se proporciona a continuación mostrará que se asignan a los valores binarios 0 y 1. Aquí 0 representa cáncer maligno y 1 representa cáncer benigno. Se muestra como la salida a continuación:

print(labels[0])
0

Los siguientes dos comandos producirán los nombres y valores de las funciones.

print(feature_names[0])
mean radius
print(features[0])

[ 1.79900000e+01 1.03800000e+01 1.22800000e+02 1.00100000e+03
  1.18400000e-01 2.77600000e-01 3.00100000e-01 1.47100000e-01
  2.41900000e-01 7.87100000e-02 1.09500000e+00 9.05300000e-01
  8.58900000e+00 1.53400000e+02 6.39900000e-03 4.90400000e-02
  5.37300000e-02 1.58700000e-02 3.00300000e-02 6.19300000e-03
  2.53800000e+01 1.73300000e+01 1.84600000e+02 2.01900000e+03
  1.62200000e-01 6.65600000e-01 7.11900000e-01 2.65400000e-01
  4.60100000e-01 1.18900000e-01]

De la salida anterior, podemos ver que la primera instancia de datos es un tumor maligno cuyo radio principal es 1.7990000e + 01.

Para probar nuestro modelo en datos invisibles, necesitamos dividir nuestros datos en datos de entrenamiento y de prueba. Se puede hacer con la ayuda del siguiente código:

from sklearn.model_selection import train_test_split

El comando anterior importará el train_test_splitfunción de sklearn y el siguiente comando dividirá los datos en datos de entrenamiento y de prueba. En el siguiente ejemplo, estamos usando el 40% de los datos para las pruebas y los datos de recordatorio se usarían para entrenar el modelo.

train, test, train_labels, test_labels = 
train_test_split(features,labels,test_size = 0.40, random_state = 42)

Ahora, estamos construyendo el modelo con los siguientes comandos:

from sklearn.naive_bayes import GaussianNB

El comando anterior importará el GaussianNBmódulo. Ahora, con el comando que se proporciona a continuación, necesitamos inicializar el modelo.

gnb = GaussianNB()

Entrenaremos el modelo ajustándolo a los datos usando gnb.fit().

model = gnb.fit(train, train_labels)

Ahora, evalúe el modelo haciendo una predicción sobre los datos de prueba y se puede hacer de la siguiente manera:

preds = gnb.predict(test)
print(preds)

[1 0 0 1 1 0 0 0 1 1 1 0 1 0 1 0 1 1 1 0 1 1 0 1 1 1 1 1 1
 0 1 1 1 1 1 1 0 1 0 1 1 0 1 1 1 1 1 1 1 1 0 0 1 1 1 1 1 0 
 0 1 1 0 0 1 1 1 0 0 1 1 0 0 1 0 1 1 1 1 1 1 0 1 1 0 0 0 0 
 0 1 1 1 1 1 1 1 1 0 0 1 0 0 1 0 0 1 1 1 0 1 1 0 1 1 0 0 0 
 1 1 1 0 0 1 1 0 1 0 0 1 1 0 0 0 1 1 1 0 1 1 0 0 1 0 1 1 0 
 1 0 0 1 1 1 1 1 1 1 0 0 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 0 
 1 1 0 1 1 1 1 1 1 0 0 0 1 1 0 1 0 1 1 1 1 0 1 1 0 1 1 1 0 
 1 0 0 1 1 1 1 1 1 1 1 0 1 1 1 1 1 0 1 0 0 1 1 0 1]

La serie anterior de 0 y 1 son los valores predichos para las clases de tumores, es decir, maligno y benigno.

Ahora, comparando las dos matrices a saber test_labels y preds, podemos averiguar la precisión de nuestro modelo. Vamos a utilizar elaccuracy_score()función para determinar la precisión. Considere el siguiente comando:

from sklearn.metrics import accuracy_score
print(accuracy_score(test_labels,preds))
0.951754385965

El resultado muestra que el clasificador de NaïveBayes tiene una precisión del 95,17%.

Ese era un clasificador de aprendizaje automático basado en el modelo gaussiano de Naïve Bayse.

Máquinas de vectores de soporte (SVM)

Básicamente, Support vector machine (SVM) es un algoritmo de aprendizaje automático supervisado que se puede usar tanto para regresión como para clasificación. El concepto principal de SVM es trazar cada elemento de datos como un punto en el espacio n-dimensional con el valor de cada característica siendo el valor de una coordenada particular. Aquí n serían las características que tendríamos. A continuación se muestra una representación gráfica simple para comprender el concepto de SVM:

En el diagrama anterior, tenemos dos características. Por lo tanto, primero debemos trazar estas dos variables en un espacio bidimensional donde cada punto tiene dos coordenadas, llamadas vectores de soporte. La línea divide los datos en dos grupos clasificados diferentes. Esta línea sería el clasificador.

Aquí, vamos a construir un clasificador SVM usando scikit-learn e iris dataset. La biblioteca Scikitlearn tiene lasklearn.svmmódulo y proporciona sklearn.svm.svc para la clasificación. A continuación se muestra el clasificador SVM para predecir la clase de planta de iris en función de 4 características.

Conjunto de datos

Usaremos el conjunto de datos de iris que contiene 3 clases de 50 instancias cada una, donde cada clase se refiere a un tipo de planta de iris. Cada instancia tiene las cuatro características, a saber, longitud del sépalo, ancho del sépalo, longitud del pétalo y ancho del pétalo. A continuación se muestra el clasificador SVM para predecir la clase de planta de iris en función de 4 características.

Núcleo

Es una técnica utilizada por SVM. Básicamente, estas son las funciones que toman el espacio de entrada de baja dimensión y lo transforman en un espacio de mayor dimensión. Convierte un problema no separable en un problema separable. La función del núcleo puede ser cualquiera entre lineal, polinomial, rbf y sigmoide. En este ejemplo, usaremos el kernel lineal.

Ahora importemos los siguientes paquetes:

import pandas as pd
import numpy as np
from sklearn import svm, datasets
import matplotlib.pyplot as plt

Ahora, cargue los datos de entrada -

iris = datasets.load_iris()

Tomaremos las dos primeras características:

X = iris.data[:, :2]
y = iris.target

Trazaremos los límites de la máquina del vector de soporte con los datos originales. Estamos creando una malla para trazar.

x_min, x_max = X[:, 0].min() - 1, X[:, 0].max() + 1
y_min, y_max = X[:, 1].min() - 1, X[:, 1].max() + 1
h = (x_max / x_min)/100
xx, yy = np.meshgrid(np.arange(x_min, x_max, h),
np.arange(y_min, y_max, h))
X_plot = np.c_[xx.ravel(), yy.ravel()]

Necesitamos dar el valor del parámetro de regularización.

C = 1.0

Necesitamos crear el objeto clasificador SVM.

Svc_classifier = svm_classifier.SVC(kernel='linear', 
C=C, decision_function_shape = 'ovr').fit(X, y)
Z = svc_classifier.predict(X_plot)
Z = Z.reshape(xx.shape)
plt.figure(figsize = (15, 5))
plt.subplot(121)
plt.contourf(xx, yy, Z, cmap = plt.cm.tab10, alpha = 0.3)
plt.scatter(X[:, 0], X[:, 1], c = y, cmap = plt.cm.Set1)
plt.xlabel('Sepal length')
plt.ylabel('Sepal width')
plt.xlim(xx.min(), xx.max())
plt.title('SVC with linear kernel')

Regresión logística

Básicamente, el modelo de regresión logística es uno de los miembros de la familia de algoritmos de clasificación supervisada. La regresión logística mide la relación entre las variables dependientes y las variables independientes estimando las probabilidades usando una función logística.

Aquí, si hablamos de variables dependientes e independientes, entonces la variable dependiente es la variable de clase objetivo que vamos a predecir y, por otro lado, las variables independientes son las características que usaremos para predecir la clase objetivo.

En regresión logística, estimar las probabilidades significa predecir la probabilidad de ocurrencia del evento. Por ejemplo, al propietario de la tienda le gustaría predecir que el cliente que ingresó a la tienda comprará la Play Station (por ejemplo) o no. Habría muchas características del cliente (género, edad, etc.) que el tendero observaría para predecir la probabilidad de que ocurra, es decir, comprar una estación de juegos o no. La función logística es la curva sigmoidea que se utiliza para construir la función con varios parámetros.

Prerrequisitos

Antes de construir el clasificador usando regresión logística, necesitamos instalar el paquete Tkinter en nuestro sistema. Se puede instalar desdehttps://docs.python.org/2/library/tkinter.html.

Ahora, con la ayuda del código que se proporciona a continuación, podemos crear un clasificador mediante regresión logística:

Primero, importaremos algunos paquetes:

import numpy as np
from sklearn import linear_model
import matplotlib.pyplot as plt

Ahora, necesitamos definir los datos de muestra que se pueden hacer de la siguiente manera:

X = np.array([[2, 4.8], [2.9, 4.7], [2.5, 5], [3.2, 5.5], [6, 5], [7.6, 4],
              [3.2, 0.9], [2.9, 1.9],[2.4, 3.5], [0.5, 3.4], [1, 4], [0.9, 5.9]])
y = np.array([0, 0, 0, 1, 1, 1, 2, 2, 2, 3, 3, 3])

A continuación, necesitamos crear el clasificador de regresión logística, que se puede hacer de la siguiente manera:

Classifier_LR = linear_model.LogisticRegression(solver = 'liblinear', C = 75)

Por último, pero no menos importante, debemos entrenar a este clasificador:

Classifier_LR.fit(X, y)

Ahora bien, ¿cómo podemos visualizar el resultado? Se puede hacer creando una función llamada Logistic_visualize () -

Def Logistic_visualize(Classifier_LR, X, y):
   min_x, max_x = X[:, 0].min() - 1.0, X[:, 0].max() + 1.0
   min_y, max_y = X[:, 1].min() - 1.0, X[:, 1].max() + 1.0

En la línea anterior, definimos los valores mínimos y máximos X e Y que se utilizarán en la cuadrícula de malla. Además, definiremos el tamaño del paso para trazar la cuadrícula de malla.

mesh_step_size = 0.02

Definamos la cuadrícula de malla de los valores X e Y de la siguiente manera:

x_vals, y_vals = np.meshgrid(np.arange(min_x, max_x, mesh_step_size),
                 np.arange(min_y, max_y, mesh_step_size))

Con la ayuda del siguiente código, podemos ejecutar el clasificador en la cuadrícula de malla:

output = classifier.predict(np.c_[x_vals.ravel(), y_vals.ravel()])
output = output.reshape(x_vals.shape)
plt.figure()
plt.pcolormesh(x_vals, y_vals, output, cmap = plt.cm.gray)
 
plt.scatter(X[:, 0], X[:, 1], c = y, s = 75, edgecolors = 'black', 
linewidth=1, cmap = plt.cm.Paired)

La siguiente línea de código especificará los límites de la trama

plt.xlim(x_vals.min(), x_vals.max())
plt.ylim(y_vals.min(), y_vals.max())
plt.xticks((np.arange(int(X[:, 0].min() - 1), int(X[:, 0].max() + 1), 1.0)))
plt.yticks((np.arange(int(X[:, 1].min() - 1), int(X[:, 1].max() + 1), 1.0)))
plt.show()

Ahora, después de ejecutar el código, obtendremos el siguiente resultado, clasificador de regresión logística:

Clasificador de árbol de decisión

Un árbol de decisión es básicamente un diagrama de flujo de árbol binario en el que cada nodo divide un grupo de observaciones según alguna variable característica.

Aquí, estamos construyendo un clasificador de árbol de decisión para predecir hombres o mujeres. Tomaremos un conjunto de datos muy pequeño con 19 muestras. Estas muestras constarían de dos características: "altura" y "longitud del cabello".

Requisito previo

Para construir el siguiente clasificador, necesitamos instalar pydotplus y graphviz. Básicamente, graphviz es una herramienta para dibujar gráficos usando archivos de puntos ypydotpluses un módulo del lenguaje Dot de Graphviz. Se puede instalar con el administrador de paquetes o pip.

Ahora, podemos construir el clasificador del árbol de decisión con la ayuda del siguiente código de Python:

Para empezar, importemos algunas bibliotecas importantes de la siguiente manera:

import pydotplus
from sklearn import tree
from sklearn.datasets import load_iris
from sklearn.metrics import classification_report
from sklearn import cross_validation
import collections

Ahora, debemos proporcionar el conjunto de datos de la siguiente manera:

X = [[165,19],[175,32],[136,35],[174,65],[141,28],[176,15],[131,32],
[166,6],[128,32],[179,10],[136,34],[186,2],[126,25],[176,28],[112,38],
[169,9],[171,36],[116,25],[196,25]]

Y = ['Man','Woman','Woman','Man','Woman','Man','Woman','Man','Woman',
'Man','Woman','Man','Woman','Woman','Woman','Man','Woman','Woman','Man']
data_feature_names = ['height','length of hair']

X_train, X_test, Y_train, Y_test = cross_validation.train_test_split
(X, Y, test_size=0.40, random_state=5)

Después de proporcionar el conjunto de datos, debemos ajustar el modelo, lo que se puede hacer de la siguiente manera:

clf = tree.DecisionTreeClassifier()
clf = clf.fit(X,Y)

La predicción se puede hacer con la ayuda del siguiente código de Python:

prediction = clf.predict([[133,37]])
print(prediction)

Podemos visualizar el árbol de decisiones con la ayuda del siguiente código Python:

dot_data = tree.export_graphviz(clf,feature_names = data_feature_names,
            out_file = None,filled = True,rounded = True)
graph = pydotplus.graph_from_dot_data(dot_data)
colors = ('orange', 'yellow')
edges = collections.defaultdict(list)

for edge in graph.get_edge_list():
edges[edge.get_source()].append(int(edge.get_destination()))

for edge in edges: edges[edge].sort()

for i in range(2):dest = graph.get_node(str(edges[edge][i]))[0]
dest.set_fillcolor(colors[i])
graph.write_png('Decisiontree16.png')

Dará la predicción para el código anterior como [‘Woman’] y cree el siguiente árbol de decisiones:

Podemos cambiar los valores de las características en la predicción para probarlo.

Clasificador de bosque aleatorio

Como sabemos, los métodos de conjunto son los métodos que combinan modelos de aprendizaje automático en un modelo de aprendizaje automático más potente. Random Forest, una colección de árboles de decisión, es uno de ellos. Es mejor que el árbol de decisión único porque, al tiempo que conserva los poderes predictivos, puede reducir el ajuste excesivo promediando los resultados. Aquí, vamos a implementar el modelo de bosque aleatorio en el conjunto de datos de cáncer de scikit learn.

Importar los paquetes necesarios -

from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_breast_cancer
cancer = load_breast_cancer()
import matplotlib.pyplot as plt
import numpy as np

Ahora, necesitamos proporcionar el conjunto de datos que se puede hacer de la siguiente manera y menos

cancer = load_breast_cancer()
X_train, X_test, y_train,
y_test = train_test_split(cancer.data, cancer.target, random_state = 0)

Después de proporcionar el conjunto de datos, debemos ajustar el modelo, lo que se puede hacer de la siguiente manera:

forest = RandomForestClassifier(n_estimators = 50, random_state = 0)
forest.fit(X_train,y_train)

Ahora, obtenga la precisión en el subconjunto de entrenamiento y prueba: si aumentamos el número de estimadores, la precisión del subconjunto de prueba también aumentaría.

print('Accuracy on the training subset:(:.3f)',format(forest.score(X_train,y_train)))
print('Accuracy on the training subset:(:.3f)',format(forest.score(X_test,y_test)))

Salida

Accuracy on the training subset:(:.3f) 1.0
Accuracy on the training subset:(:.3f) 0.965034965034965

Ahora, al igual que el árbol de decisiones, el bosque aleatorio tiene la feature_importancemódulo que proporcionará una mejor vista del peso de la característica que el árbol de decisiones. Se puede trazar y visualizar de la siguiente manera:

n_features = cancer.data.shape[1]
plt.barh(range(n_features),forest.feature_importances_, align='center')
plt.yticks(np.arange(n_features),cancer.feature_names)
plt.xlabel('Feature Importance')
plt.ylabel('Feature')
plt.show()

Rendimiento de un clasificador

Después de implementar un algoritmo de aprendizaje automático, debemos averiguar qué tan efectivo es el modelo. Los criterios para medir la eficacia pueden basarse en conjuntos de datos y métricas. Para evaluar diferentes algoritmos de aprendizaje automático, podemos utilizar diferentes métricas de rendimiento. Por ejemplo, supongamos que si se usa un clasificador para distinguir entre imágenes de diferentes objetos, podemos usar las métricas de rendimiento de la clasificación, como precisión promedio, AUC, etc. En uno u otro sentido, la métrica que elegimos para evaluar nuestro modelo de aprendizaje automático es muy importante porque la elección de las métricas influye en cómo se mide y se compara el rendimiento de un algoritmo de aprendizaje automático. A continuación se muestran algunas de las métricas:

Matriz de confusión

Básicamente se usa para problemas de clasificación donde la salida puede ser de dos o más tipos de clases. Es la forma más sencilla de medir el rendimiento de un clasificador. Una matriz de confusión es básicamente una tabla con dos dimensiones, a saber, "Real" y "Previsto". Ambas dimensiones tienen "Positivos verdaderos (TP)", "Negativos verdaderos (TN)", "Positivos falsos (FP)", "Negativos falsos (FN)".

En la matriz de confusión anterior, 1 es para clase positiva y 0 es para clase negativa.

Los siguientes son los términos asociados con la matriz de confusión:

  • True Positives − Los TP son los casos en los que la clase real de punto de datos fue 1 y la predicción también es 1.

  • True Negatives − Los TN son los casos en los que la clase real del punto de datos fue 0 y la predicción también es 0.

  • False Positives − Los FP son los casos en los que la clase real de punto de datos fue 0 y la predicción también es 1.

  • False Negatives − Los FN son los casos en los que la clase real del punto de datos fue 1 y la predicción también es 0.

Exactitud

La matriz de confusión en sí no es una medida de desempeño como tal, pero casi todas las matrices de desempeño se basan en la matriz de confusión. Uno de ellos es la precisión. En los problemas de clasificación, se puede definir como el número de predicciones correctas realizadas por el modelo sobre todo tipo de predicciones realizadas. La fórmula para calcular la precisión es la siguiente:

$$ Precisión = \ frac {TP + TN} {TP + FP + FN + TN} $$

Precisión

Se utiliza principalmente en la recuperación de documentos. Puede definirse como cuántos de los documentos devueltos son correctos. A continuación se muestra la fórmula para calcular la precisión:

$$ Precisión = \ frac {TP} {TP + FP} $$

Recuerdo o sensibilidad

Puede definirse como cuántos de los positivos devuelve el modelo. A continuación se muestra la fórmula para calcular la recuperación / sensibilidad del modelo:

$$ Recall = \ frac {TP} {TP + FN} $$

Especificidad

Puede definirse como cuántos de los negativos devuelve el modelo. Es exactamente lo opuesto a recordar. A continuación se muestra la fórmula para calcular la especificidad del modelo:

$$ Especificidad = \ frac {TN} {TN + FP} $$

Problema de desequilibrio de clases

El desequilibrio de clases es el escenario en el que el número de observaciones que pertenecen a una clase es significativamente menor que las que pertenecen a las otras clases. Por ejemplo, este problema es prominente en el escenario donde necesitamos identificar las enfermedades raras, transacciones fraudulentas en el banco, etc.

Ejemplo de clases desequilibradas

Consideremos un ejemplo de conjunto de datos de detección de fraude para comprender el concepto de clase desequilibrada:

Total observations = 5000
Fraudulent Observations = 50
Non-Fraudulent Observations = 4950
Event Rate = 1%

Solución

Balancing the classes’actúa como una solución a las clases desequilibradas. El principal objetivo de equilibrar las clases es aumentar la frecuencia de la clase minoritaria o disminuir la frecuencia de la clase mayoritaria. Los siguientes son los enfoques para resolver el problema de las clases de desequilibrios:

Re-muestreo

El remuestreo es una serie de métodos que se utilizan para reconstruir los conjuntos de datos de muestra, tanto de entrenamiento como de prueba. Se realiza un nuevo muestreo para mejorar la precisión del modelo. A continuación se presentan algunas técnicas de remuestreo:

  • Random Under-Sampling- Esta técnica tiene como objetivo equilibrar la distribución de clases eliminando aleatoriamente los ejemplos de clases mayoritarias. Esto se hace hasta que se equilibren las instancias de las clases mayoritaria y minoritaria.

Total observations = 5000
Fraudulent Observations = 50
Non-Fraudulent Observations = 4950
Event Rate = 1%

En este caso, tomamos muestras del 10% sin reemplazo de instancias sin fraude y luego las combinamos con las instancias de fraude:

Observaciones no fraudulentas después de un muestreo aleatorio = 10% de 4950 = 495

Total de observaciones después de combinarlas con observaciones fraudulentas = 50 + 495 = 545

Por lo tanto, ahora, la tasa de eventos para un nuevo conjunto de datos después de un muestreo insuficiente = 9%

La principal ventaja de esta técnica es que puede reducir el tiempo de ejecución y mejorar el almacenamiento. Pero, por otro lado, puede descartar información útil al tiempo que reduce la cantidad de muestras de datos de entrenamiento.

  • Random Over-Sampling - Esta técnica tiene como objetivo equilibrar la distribución de clases aumentando el número de instancias en la clase minoritaria al replicarlas.

Total observations = 5000
Fraudulent Observations = 50
Non-Fraudulent Observations = 4950
Event Rate = 1%

En caso de que estemos replicando 50 observaciones fraudulentas 30 veces, las observaciones fraudulentas después de replicar las observaciones de la clase minoritaria serían 1500. Y el total de observaciones en los nuevos datos después del sobremuestreo sería 4950 + 1500 = 6450. Por lo tanto, la tasa de eventos para el nuevo conjunto de datos sería 1500/6450 = 23%.

La principal ventaja de este método es que no se perderá información útil. Pero, por otro lado, tiene mayores posibilidades de sobreajuste porque replica los eventos de las clases minoritarias.

Técnicas de conjunto

Esta metodología se utiliza básicamente para modificar los algoritmos de clasificación existentes para hacerlos apropiados para conjuntos de datos desequilibrados. En este enfoque, construimos varios clasificadores de dos etapas a partir de los datos originales y luego agregamos sus predicciones. El clasificador de bosque aleatorio es un ejemplo de clasificador basado en conjuntos.

La regresión es una de las herramientas estadísticas y de aprendizaje automático más importantes. No nos equivocaríamos al decir que el viaje del aprendizaje automático comienza con la regresión. Puede definirse como la técnica paramétrica que nos permite tomar decisiones basadas en datos o, en otras palabras, nos permite hacer predicciones basadas en datos aprendiendo la relación entre las variables de entrada y salida. Aquí, las variables de salida que dependen de las variables de entrada son números reales con valores continuos. En la regresión, la relación entre las variables de entrada y salida es importante y nos ayuda a comprender cómo cambia el valor de la variable de salida con el cambio de la variable de entrada. La regresión se utiliza con frecuencia para predecir precios, economía, variaciones, etc.

Construyendo regresores en Python

En esta sección, aprenderemos cómo construir un regresor tanto simple como multivariable.

Regresor lineal / Regresor de variable única

Permítanos importantes algunos paquetes obligatorios:

import numpy as np
from sklearn import linear_model
import sklearn.metrics as sm
import matplotlib.pyplot as plt

Ahora, necesitamos proporcionar los datos de entrada y hemos guardado nuestros datos en el archivo llamado linear.txt.

input = 'D:/ProgramData/linear.txt'

Necesitamos cargar estos datos usando el np.loadtxt función.

input_data = np.loadtxt(input, delimiter=',')
X, y = input_data[:, :-1], input_data[:, -1]

El siguiente paso sería entrenar el modelo. Démosle muestras de entrenamiento y prueba.

training_samples = int(0.6 * len(X))
testing_samples = len(X) - num_training

X_train, y_train = X[:training_samples], y[:training_samples]

X_test, y_test = X[training_samples:], y[training_samples:]

Ahora, necesitamos crear un objeto regresor lineal.

reg_linear = linear_model.LinearRegression()

Entrena el objeto con las muestras de entrenamiento.

reg_linear.fit(X_train, y_train)

Necesitamos hacer la predicción con los datos de prueba.

y_test_pred = reg_linear.predict(X_test)

Ahora trace y visualice los datos.

plt.scatter(X_test, y_test, color = 'red')
plt.plot(X_test, y_test_pred, color = 'black', linewidth = 2)
plt.xticks(())
plt.yticks(())
plt.show()

Salida

Ahora, podemos calcular el rendimiento de nuestra regresión lineal de la siguiente manera:

print("Performance of Linear regressor:")
print("Mean absolute error =", round(sm.mean_absolute_error(y_test, y_test_pred), 2))
print("Mean squared error =", round(sm.mean_squared_error(y_test, y_test_pred), 2))
print("Median absolute error =", round(sm.median_absolute_error(y_test, y_test_pred), 2))
print("Explain variance score =", round(sm.explained_variance_score(y_test, y_test_pred),
2))
print("R2 score =", round(sm.r2_score(y_test, y_test_pred), 2))

Salida

Rendimiento del regresor lineal -

Mean absolute error = 1.78
Mean squared error = 3.89
Median absolute error = 2.01
Explain variance score = -0.09
R2 score = -0.09

En el código anterior, hemos utilizado estos pequeños datos. Si desea un gran conjunto de datos, puede usar sklearn.dataset para importar un conjunto de datos más grande.

2,4.82.9,4.72.5,53.2,5.56,57.6,43.2,0.92.9,1.92.4,
3.50.5,3.41,40.9,5.91.2,2.583.2,5.65.1,1.54.5,
1.22.3,6.32.1,2.8

Regresor multivariable

Primero, importemos algunos paquetes obligatorios:

import numpy as np
from sklearn import linear_model
import sklearn.metrics as sm
import matplotlib.pyplot as plt
from sklearn.preprocessing import PolynomialFeatures

Ahora, necesitamos proporcionar los datos de entrada y hemos guardado nuestros datos en el archivo llamado linear.txt.

input = 'D:/ProgramData/Mul_linear.txt'

Cargaremos estos datos usando el np.loadtxt función.

input_data = np.loadtxt(input, delimiter=',')
X, y = input_data[:, :-1], input_data[:, -1]

El siguiente paso sería entrenar el modelo; Daremos muestras de entrenamiento y prueba.

training_samples = int(0.6 * len(X))
testing_samples = len(X) - num_training

X_train, y_train = X[:training_samples], y[:training_samples]

X_test, y_test = X[training_samples:], y[training_samples:]

Ahora, necesitamos crear un objeto regresor lineal.

reg_linear_mul = linear_model.LinearRegression()

Entrena el objeto con las muestras de entrenamiento.

reg_linear_mul.fit(X_train, y_train)

Ahora, por fin necesitamos hacer la predicción con los datos de prueba.

y_test_pred = reg_linear_mul.predict(X_test)

print("Performance of Linear regressor:")
print("Mean absolute error =", round(sm.mean_absolute_error(y_test, y_test_pred), 2))
print("Mean squared error =", round(sm.mean_squared_error(y_test, y_test_pred), 2))
print("Median absolute error =", round(sm.median_absolute_error(y_test, y_test_pred), 2))
print("Explain variance score =", round(sm.explained_variance_score(y_test, y_test_pred), 2))
print("R2 score =", round(sm.r2_score(y_test, y_test_pred), 2))

Salida

Rendimiento del regresor lineal -

Mean absolute error = 0.6
Mean squared error = 0.65
Median absolute error = 0.41
Explain variance score = 0.34
R2 score = 0.33

Ahora crearemos un polinomio de grado 10 y entrenaremos el regresor. Proporcionaremos el punto de datos de muestra.

polynomial = PolynomialFeatures(degree = 10)
X_train_transformed = polynomial.fit_transform(X_train)
datapoint = [[2.23, 1.35, 1.12]]
poly_datapoint = polynomial.fit_transform(datapoint)

poly_linear_model = linear_model.LinearRegression()
poly_linear_model.fit(X_train_transformed, y_train)
print("\nLinear regression:\n", reg_linear_mul.predict(datapoint))
print("\nPolynomial regression:\n", poly_linear_model.predict(poly_datapoint))

Salida

Regresión lineal -

[2.40170462]

Regresión polinomial -

[1.8697225]

En el código anterior, hemos utilizado estos pequeños datos. Si desea un gran conjunto de datos, puede usar sklearn.dataset para importar un conjunto de datos más grande.

2,4.8,1.2,3.22.9,4.7,1.5,3.62.5,5,2.8,23.2,5.5,3.5,2.16,5,
2,3.27.6,4,1.2,3.23.2,0.9,2.3,1.42.9,1.9,2.3,1.22.4,3.5,
2.8,3.60.5,3.4,1.8,2.91,4,3,2.50.9,5.9,5.6,0.81.2,2.58,
3.45,1.233.2,5.6,2,3.25.1,1.5,1.2,1.34.5,1.2,4.1,2.32.3,
6.3,2.5,3.22.1,2.8,1.2,3.6

En este capítulo, nos centraremos en la programación lógica y cómo ayuda en la Inteligencia Artificial.

Ya sabemos que la lógica es el estudio de los principios del razonamiento correcto o en palabras simples es el estudio de lo que viene después de qué. Por ejemplo, si dos afirmaciones son verdaderas, podemos inferir una tercera afirmación de ellas.

Concepto

La programación lógica es la combinación de dos palabras, lógica y programación. La programación lógica es un paradigma de programación en el que los problemas se expresan como hechos y reglas mediante declaraciones de programa, pero dentro de un sistema de lógica formal. Al igual que otros paradigmas de programación como orientados a objetos, funcionales, declarativos y procedimentales, etc., también es una forma particular de abordar la programación.

Cómo resolver problemas con la programación lógica

La programación lógica usa hechos y reglas para resolver el problema. Por eso se les llama los bloques de construcción de la programación lógica. Es necesario especificar un objetivo para cada programa en la programación lógica. Para comprender cómo se puede resolver un problema en la programación lógica, necesitamos conocer los componentes básicos (hechos y reglas)

Hechos

En realidad, cada programa de lógica necesita hechos con los que trabajar para poder lograr el objetivo dado. Los hechos son básicamente declaraciones verdaderas sobre el programa y los datos. Por ejemplo, Delhi es la capital de India.

Reglas

En realidad, las reglas son las restricciones que nos permiten sacar conclusiones sobre el dominio del problema. Reglas básicamente escritas como cláusulas lógicas para expresar varios hechos. Por ejemplo, si estamos construyendo cualquier juego, entonces se deben definir todas las reglas.

Las reglas son muy importantes para resolver cualquier problema en la programación lógica. Las reglas son básicamente conclusiones lógicas que pueden expresar los hechos. A continuación se muestra la sintaxis de la regla:

A∶− B1, B2, ..., B n .

Aquí, A es la cabeza y B1, B2, ... Bn es el cuerpo.

Por ejemplo - ancestro (X, Y): - padre (X, Y).

antepasado (X, Z): - padre (X, Y), antepasado (Y, Z).

Esto se puede leer como, para cada X e Y, si X es el padre de Y e Y es un antepasado de Z, X es el antepasado de Z. Para cada X e Y, X es el antepasado de Z, si X es el padre de Y e Y es un antepasado de Z.

Instalación de paquetes útiles

Para iniciar la programación lógica en Python, necesitamos instalar los siguientes dos paquetes:

Kanren

Nos proporciona una forma de simplificar la forma en que creamos código para la lógica empresarial. Nos permite expresar la lógica en términos de reglas y hechos. El siguiente comando te ayudará a instalar kanren:

pip install kanren

SymPy

SymPy es una biblioteca de Python para matemáticas simbólicas. Su objetivo es convertirse en un sistema de álgebra computacional (CAS) con todas las funciones, manteniendo el código lo más simple posible para que sea comprensible y fácilmente extensible. El siguiente comando te ayudará a instalar SymPy:

pip install sympy

Ejemplos de programación lógica

Los siguientes son algunos ejemplos que pueden resolverse mediante programación lógica:

Coincidencia de expresiones matemáticas

De hecho, podemos encontrar los valores desconocidos usando la programación lógica de una manera muy efectiva. El siguiente código de Python lo ayudará a hacer coincidir una expresión matemática:

Considere importar primero los siguientes paquetes:

from kanren import run, var, fact
from kanren.assoccomm import eq_assoccomm as eq
from kanren.assoccomm import commutative, associative

Necesitamos definir las operaciones matemáticas que vamos a utilizar -

add = 'add'
mul = 'mul'

Tanto la suma como la multiplicación son procesos comunicativos. Por lo tanto, debemos especificarlo y esto se puede hacer de la siguiente manera:

fact(commutative, mul)
fact(commutative, add)
fact(associative, mul)
fact(associative, add)

Es obligatorio definir variables; esto se puede hacer de la siguiente manera:

a, b = var('a'), var('b')

Necesitamos hacer coincidir la expresión con el patrón original. Tenemos el siguiente patrón original, que es básicamente (5 + a) * b -

Original_pattern = (mul, (add, 5, a), b)

Tenemos las siguientes dos expresiones para que coincidan con el patrón original:

exp1 = (mul, 2, (add, 3, 1))
exp2 = (add,5,(mul,8,1))

La salida se puede imprimir con el siguiente comando:

print(run(0, (a,b), eq(original_pattern, exp1)))
print(run(0, (a,b), eq(original_pattern, exp2)))

Después de ejecutar este código, obtendremos el siguiente resultado:

((3,2))
()

La primera salida representa los valores de a y b. La primera expresión coincidió con el patrón original y devolvió los valores paraa y b pero la segunda expresión no coincide con el patrón original, por lo que no se ha devuelto nada.

Comprobación de números primos

Con la ayuda de la programación lógica, podemos encontrar los números primos de una lista de números y también podemos generar números primos. El código de Python que se proporciona a continuación encontrará el número primo de una lista de números y también generará los primeros 10 números primos.

Consideremos primero la importación de los siguientes paquetes:

from kanren import isvar, run, membero
from kanren.core import success, fail, goaleval, condeseq, eq, var
from sympy.ntheory.generate import prime, isprime
import itertools as it

Ahora, definiremos una función llamada prime_check que verificará los números primos basándose en los números dados como datos.

def prime_check(x):
if isvar(x):
   return condeseq([(eq,x,p)] for p in map(prime, it.count(1)))
else:
   return success if isprime(x) else fail

Ahora, necesitamos declarar una variable que se utilizará:

x = var()
print((set(run(0,x,(membero,x,(12,14,15,19,20,21,22,23,29,30,41,44,52,62,65,85)),
(prime_check,x)))))
print((run(10,x,prime_check(x))))

La salida del código anterior será la siguiente:

{19, 23, 29, 41}
(2, 3, 5, 7, 11, 13, 17, 19, 23, 29)

Resolver acertijos

La programación lógica se puede utilizar para resolver muchos problemas como 8 rompecabezas, rompecabezas Zebra, Sudoku, N-queen, etc. Aquí estamos tomando un ejemplo de una variante del rompecabezas Zebra que es el siguiente:

There are five houses.
The English man lives in the red house.
The Swede has a dog.
The Dane drinks tea.
The green house is immediately to the left of the white house.
They drink coffee in the green house.
The man who smokes Pall Mall has birds.
In the yellow house they smoke Dunhill.
In the middle house they drink milk.
The Norwegian lives in the first house.
The man who smokes Blend lives in the house next to the house with cats.
In a house next to the house where they have a horse, they smoke Dunhill.
The man who smokes Blue Master drinks beer.
The German smokes Prince.
The Norwegian lives next to the blue house.
They drink water in a house next to the house where they smoke Blend.

Lo estamos resolviendo para la pregunta who owns zebra con la ayuda de Python.

Importamos los paquetes necesarios -

from kanren import *
from kanren.core import lall
import time

Ahora, necesitamos definir dos funciones: left() y next() para comprobar de quién queda la casa o al lado de la casa de quién -

def left(q, p, list):
   return membero((q,p), zip(list, list[1:]))
def next(q, p, list):
   return conde([left(q, p, list)], [left(p, q, list)])

Ahora, declararemos una casa variable de la siguiente manera:

houses = var()

Necesitamos definir las reglas con la ayuda del paquete lall de la siguiente manera.

Hay 5 casas -

rules_zebraproblem = lall(
   (eq, (var(), var(), var(), var(), var()), houses),

   (membero,('Englishman', var(), var(), var(), 'red'), houses),
   (membero,('Swede', var(), var(), 'dog', var()), houses),
   (membero,('Dane', var(), 'tea', var(), var()), houses),
   (left,(var(), var(), var(), var(), 'green'),
   (var(), var(), var(), var(), 'white'), houses),
   (membero,(var(), var(), 'coffee', var(), 'green'), houses),
   (membero,(var(), 'Pall Mall', var(), 'birds', var()), houses),
   (membero,(var(), 'Dunhill', var(), var(), 'yellow'), houses),
   (eq,(var(), var(), (var(), var(), 'milk', var(), var()), var(), var()), houses),
   (eq,(('Norwegian', var(), var(), var(), var()), var(), var(), var(), var()), houses),
   (next,(var(), 'Blend', var(), var(), var()),
   (var(), var(), var(), 'cats', var()), houses),
   (next,(var(), 'Dunhill', var(), var(), var()),
   (var(), var(), var(), 'horse', var()), houses),
   (membero,(var(), 'Blue Master', 'beer', var(), var()), houses),
   (membero,('German', 'Prince', var(), var(), var()), houses),
   (next,('Norwegian', var(), var(), var(), var()),
   (var(), var(), var(), var(), 'blue'), houses),
   (next,(var(), 'Blend', var(), var(), var()),
   (var(), var(), 'water', var(), var()), houses),
   (membero,(var(), var(), var(), 'zebra', var()), houses)
)

Ahora, ejecute el solucionador con las restricciones anteriores:

solutions = run(0, houses, rules_zebraproblem)

Con la ayuda del siguiente código, podemos extraer la salida del solucionador:

output_zebra = [house for house in solutions[0] if 'zebra' in house][0][0]

El siguiente código ayudará a imprimir la solución:

print ('\n'+ output_zebra + 'owns zebra.')

La salida del código anterior sería la siguiente:

German owns zebra.

Los algoritmos de aprendizaje automático no supervisados ​​no tienen ningún supervisor que proporcione ningún tipo de orientación. Por eso están estrechamente alineados con lo que algunos llaman verdadera inteligencia artificial.

En el aprendizaje no supervisado, no habría una respuesta correcta ni un maestro para la orientación. Los algoritmos necesitan descubrir el patrón interesante en los datos para el aprendizaje.

¿Qué es la agrupación en clústeres?

Básicamente, es un tipo de método de aprendizaje no supervisado y una técnica común para el análisis de datos estadísticos que se utiliza en muchos campos. El agrupamiento principalmente es una tarea de dividir el conjunto de observaciones en subconjuntos, llamados grupos, de tal manera que las observaciones en el mismo grupo sean similares en un sentido y diferentes a las observaciones en otros grupos. En palabras simples, podemos decir que el objetivo principal de la agrupación es agrupar los datos sobre la base de similitudes y diferencias.

Por ejemplo, el siguiente diagrama muestra tipos similares de datos en diferentes clústeres:

Algoritmos para agrupar los datos

A continuación, se muestran algunos algoritmos comunes para agrupar los datos:

Algoritmo K-Means

El algoritmo de agrupación en clústeres K-means es uno de los algoritmos más conocidos para agrupar los datos. Debemos asumir que ya se conoce el número de agrupaciones. Esto también se llama agrupación plana. Es un algoritmo de agrupamiento iterativo. Los pasos que se indican a continuación deben seguirse para este algoritmo:

Step 1 - Necesitamos especificar el número deseado de K subgrupos.

Step 2- Fije el número de grupos y asigne aleatoriamente cada punto de datos a un grupo. O en otras palabras, necesitamos clasificar nuestros datos en función del número de grupos.

En este paso, se deben calcular los centroides del clúster.

Como se trata de un algoritmo iterativo, necesitamos actualizar las ubicaciones de K centroides con cada iteración hasta que encontremos los óptimos globales o, en otras palabras, los centroides alcanzan sus ubicaciones óptimas.

El siguiente código ayudará a implementar el algoritmo de agrupación en clústeres de K-means en Python. Vamos a utilizar el módulo Scikit-learn.

Importamos los paquetes necesarios -

import matplotlib.pyplot as plt
import seaborn as sns; sns.set()
import numpy as np
from sklearn.cluster import KMeans

La siguiente línea de código ayudará a generar el conjunto de datos bidimensional, que contiene cuatro blobs, utilizando make_blob desde el sklearn.dataset paquete.

from sklearn.datasets.samples_generator import make_blobs

X, y_true = make_blobs(n_samples = 500, centers = 4,
            cluster_std = 0.40, random_state = 0)

Podemos visualizar el conjunto de datos usando el siguiente código:

plt.scatter(X[:, 0], X[:, 1], s = 50);
plt.show()

Aquí, estamos inicializando kmeans para que sea el algoritmo KMeans, con el parámetro requerido de cuántos clústeres (n_clusters).

kmeans = KMeans(n_clusters = 4)

Necesitamos entrenar el modelo de K-medias con los datos de entrada.

kmeans.fit(X)
y_kmeans = kmeans.predict(X)
plt.scatter(X[:, 0], X[:, 1], c = y_kmeans, s = 50, cmap = 'viridis')

centers = kmeans.cluster_centers_

El código que se proporciona a continuación nos ayudará a trazar y visualizar los hallazgos de la máquina en función de nuestros datos y el ajuste de acuerdo con la cantidad de grupos que se van a encontrar.

plt.scatter(centers[:, 0], centers[:, 1], c = 'black', s = 200, alpha = 0.5);
plt.show()

Algoritmo de cambio medio

Es otro algoritmo de agrupación en clúster popular y poderoso que se utiliza en el aprendizaje no supervisado. No hace ninguna suposición, por lo tanto, es un algoritmo no paramétrico. También se denomina agrupación jerárquica o análisis de agrupación de turnos medios. Los siguientes serían los pasos básicos de este algoritmo:

  • En primer lugar, debemos comenzar con los puntos de datos asignados a un grupo propio.

  • Ahora, calcula los centroides y actualiza la ubicación de los nuevos centroides.

  • Al repetir este proceso, nos acercamos al pico del clúster, es decir, hacia la región de mayor densidad.

  • Este algoritmo se detiene en la etapa donde los centroides ya no se mueven.

Con la ayuda del siguiente código, estamos implementando el algoritmo de agrupación en clústeres de Mean Shift en Python. Vamos a utilizar el módulo Scikit-learn.

Importamos los paquetes necesarios -

import numpy as np
from sklearn.cluster import MeanShift
import matplotlib.pyplot as plt
from matplotlib import style
style.use("ggplot")

El siguiente código ayudará a generar el conjunto de datos bidimensional, que contiene cuatro blobs, utilizando make_blob desde el sklearn.dataset paquete.

from sklearn.datasets.samples_generator import make_blobs

Podemos visualizar el conjunto de datos con el siguiente código

centers = [[2,2],[4,5],[3,10]]
X, _ = make_blobs(n_samples = 500, centers = centers, cluster_std = 1)
plt.scatter(X[:,0],X[:,1])
plt.show()

Ahora, necesitamos entrenar el modelo de clúster de cambio medio con los datos de entrada.

ms = MeanShift()
ms.fit(X)
labels = ms.labels_
cluster_centers = ms.cluster_centers_

El siguiente código imprimirá los centros del clúster y el número esperado de clúster según los datos de entrada:

print(cluster_centers)
n_clusters_ = len(np.unique(labels))
print("Estimated clusters:", n_clusters_)
[[ 3.23005036 3.84771893]
[ 3.02057451 9.88928991]]
Estimated clusters: 2

El código que se proporciona a continuación ayudará a trazar y visualizar los hallazgos de la máquina en función de nuestros datos y el ajuste de acuerdo con la cantidad de grupos que se encontrarán.

colors = 10*['r.','g.','b.','c.','k.','y.','m.']
   for i in range(len(X)):
   plt.plot(X[i][0], X[i][1], colors[labels[i]], markersize = 10)
plt.scatter(cluster_centers[:,0],cluster_centers[:,1],
   marker = "x",color = 'k', s = 150, linewidths = 5, zorder = 10)
plt.show()

Medir el rendimiento de la agrupación en clústeres

Los datos del mundo real no se organizan de forma natural en varios grupos distintivos. Por esta razón, no es fácil visualizar y hacer inferencias. Es por eso que necesitamos medir el rendimiento de la agrupación en clústeres, así como su calidad. Se puede hacer con la ayuda del análisis de silueta.

Análisis de silueta

Este método se puede utilizar para comprobar la calidad de la agrupación midiendo la distancia entre las agrupaciones. Básicamente, proporciona una forma de evaluar los parámetros como el número de clústeres dando una puntuación de silueta. Esta puntuación es una métrica que mide qué tan cerca está cada punto de un grupo de los puntos de los grupos vecinos.

Análisis de puntuación de silueta

La puntuación tiene un rango de [-1, 1]. A continuación se muestra el análisis de esta puntuación:

  • Score of +1 - Una puntuación cercana a +1 indica que la muestra está lejos del grupo vecino.

  • Score of 0 - La puntuación 0 indica que la muestra está en o muy cerca del límite de decisión entre dos conglomerados vecinos.

  • Score of -1 - La puntuación negativa indica que las muestras se han asignado a grupos incorrectos.

Calcular la puntuación de silueta

En esta sección, aprenderemos a calcular la puntuación de silueta.

La puntuación de silueta se puede calcular utilizando la siguiente fórmula:

$$ silueta puntuación = \ frac {\ left (pq \ right)} {max \ left (p, q \ right)} $$

Aquí, es la distancia media a los puntos en el grupo más cercano del que el punto de datos no forma parte. Y, es la distancia media intra-grupo a todos los puntos en su propio grupo.

Para encontrar el número óptimo de clústeres, necesitamos ejecutar el algoritmo de clústeres nuevamente importando el metrics módulo del sklearnpaquete. En el siguiente ejemplo, ejecutaremos el algoritmo de agrupación en clústeres K-means para encontrar el número óptimo de clústeres:

Importe los paquetes necesarios como se muestra:

import matplotlib.pyplot as plt
import seaborn as sns; sns.set()
import numpy as np
from sklearn.cluster import KMeans

Con la ayuda del siguiente código, generaremos el conjunto de datos bidimensional, que contiene cuatro blobs, usando make_blob desde el sklearn.dataset paquete.

from sklearn.datasets.samples_generator import make_blobs

X, y_true = make_blobs(n_samples = 500, centers = 4, cluster_std = 0.40, random_state = 0)

Inicialice las variables como se muestra -

scores = []
values = np.arange(2, 10)

Necesitamos iterar el modelo K-means a través de todos los valores y también necesitamos entrenarlo con los datos de entrada.

for num_clusters in values:
kmeans = KMeans(init = 'k-means++', n_clusters = num_clusters, n_init = 10)
kmeans.fit(X)

Ahora, calcule la puntuación de silueta para el modelo de agrupamiento actual utilizando la métrica de distancia euclidiana:

score = metrics.silhouette_score(X, kmeans.labels_,
metric = 'euclidean', sample_size = len(X))

La siguiente línea de código ayudará a mostrar el número de clústeres y la puntuación de Silhouette.

print("\nNumber of clusters =", num_clusters)
print("Silhouette score =", score)
scores.append(score)

Recibirá el siguiente resultado:

Number of clusters = 9
Silhouette score = 0.340391138371

num_clusters = np.argmax(scores) + values[0]
print('\nOptimal number of clusters =', num_clusters)

Ahora, la salida para el número óptimo de clústeres sería la siguiente:

Optimal number of clusters = 2

Encontrar vecinos más cercanos

Si queremos construir sistemas de recomendación, como un sistema de recomendación de películas, necesitamos comprender el concepto de encontrar los vecinos más cercanos. Es porque el sistema de recomendación utiliza el concepto de vecinos más cercanos.

los concept of finding nearest neighborspuede definirse como el proceso de encontrar el punto más cercano al punto de entrada del conjunto de datos dado. El uso principal de este algoritmo KNN (vecinos más cercanos K) es construir sistemas de clasificación que clasifiquen un punto de datos sobre la proximidad del punto de datos de entrada a varias clases.

El código de Python que se proporciona a continuación ayuda a encontrar los K vecinos más cercanos de un conjunto de datos dado:

Importe los paquetes necesarios como se muestra a continuación. Aquí, estamos usando elNearestNeighbors módulo del sklearn paquete

import numpy as np
import matplotlib.pyplot as plt
from sklearn.neighbors import NearestNeighbors

Definamos ahora los datos de entrada:

A = np.array([[3.1, 2.3], [2.3, 4.2], [3.9, 3.5], [3.7, 6.4], [4.8, 1.9], 
             [8.3, 3.1], [5.2, 7.5], [4.8, 4.7], [3.5, 5.1], [4.4, 2.9],])

Ahora, necesitamos definir los vecinos más cercanos:

k = 3

También necesitamos proporcionar los datos de prueba a partir de los cuales se encontrarán los vecinos más cercanos:

test_data = [3.3, 2.9]

El siguiente código puede visualizar y trazar los datos de entrada definidos por nosotros:

plt.figure()
plt.title('Input data')
plt.scatter(A[:,0], A[:,1], marker = 'o', s = 100, color = 'black')

Ahora, necesitamos construir el vecino más cercano K. El objeto también necesita ser entrenado

knn_model = NearestNeighbors(n_neighbors = k, algorithm = 'auto').fit(X)
distances, indices = knn_model.kneighbors([test_data])

Ahora, podemos imprimir los K vecinos más cercanos de la siguiente manera

print("\nK Nearest Neighbors:")
for rank, index in enumerate(indices[0][:k], start = 1):
   print(str(rank) + " is", A[index])

Podemos visualizar los vecinos más cercanos junto con el punto de datos de prueba.

plt.figure()
plt.title('Nearest neighbors')
plt.scatter(A[:, 0], X[:, 1], marker = 'o', s = 100, color = 'k')
plt.scatter(A[indices][0][:][:, 0], A[indices][0][:][:, 1],
   marker = 'o', s = 250, color = 'k', facecolors = 'none')
plt.scatter(test_data[0], test_data[1],
   marker = 'x', s = 100, color = 'k')
plt.show()

Salida

K Nearest Neighbors

1 is [ 3.1 2.3]
2 is [ 3.9 3.5]
3 is [ 4.4 2.9]

Clasificador K-Vecinos más cercanos

Un clasificador de K-vecinos más cercanos (KNN) es un modelo de clasificación que utiliza el algoritmo de vecinos más cercanos para clasificar un punto de datos dado. Hemos implementado el algoritmo KNN en la última sección, ahora vamos a construir un clasificador KNN usando ese algoritmo.

Concepto de clasificador KNN

El concepto básico de la clasificación de K-vecino más cercano es encontrar un número predefinido, es decir, la 'k' - de muestras de entrenamiento más cercanas en distancia a una nueva muestra, que tiene que ser clasificada. Las nuevas muestras obtendrán su etiqueta de los propios vecinos. Los clasificadores KNN tienen una constante definida por el usuario fija para el número de vecinos que deben determinarse. Para la distancia, la distancia euclidiana estándar es la opción más común. El clasificador KNN trabaja directamente en las muestras aprendidas en lugar de crear las reglas para el aprendizaje. El algoritmo KNN se encuentra entre los más simples de todos los algoritmos de aprendizaje automático. Ha tenido bastante éxito en una gran cantidad de problemas de clasificación y regresión, por ejemplo, reconocimiento de caracteres o análisis de imágenes.

Example

Estamos construyendo un clasificador KNN para reconocer dígitos. Para esto, usaremos el conjunto de datos MNIST. Escribiremos este código en el Jupyter Notebook.

Importe los paquetes necesarios como se muestra a continuación.

Aquí estamos usando el KNeighborsClassifier módulo del sklearn.neighbors paquete -

from sklearn.datasets import *
import pandas as pd
%matplotlib inline
from sklearn.neighbors import KNeighborsClassifier
import matplotlib.pyplot as plt
import numpy as np

El siguiente código mostrará la imagen del dígito para verificar qué imagen tenemos que probar -

def Image_display(i):
   plt.imshow(digit['images'][i],cmap = 'Greys_r')
   plt.show()

Ahora, necesitamos cargar el conjunto de datos MNIST. En realidad, hay un total de 1797 imágenes, pero estamos usando las primeras 1600 imágenes como muestra de entrenamiento y las 197 restantes se conservarían para fines de prueba.

digit = load_digits()
digit_d = pd.DataFrame(digit['data'][0:1600])

Ahora, al mostrar las imágenes, podemos ver el resultado de la siguiente manera:

Image_display(0)

Visualización_imagen (0)

La imagen de 0 se muestra de la siguiente manera:

Visualización_imagen (9)

La imagen de 9 se muestra de la siguiente manera:

teclas.digitales ()

Ahora, necesitamos crear el conjunto de datos de entrenamiento y prueba y suministrar el conjunto de datos de prueba a los clasificadores KNN.

train_x = digit['data'][:1600]
train_y = digit['target'][:1600]
KNN = KNeighborsClassifier(20)
KNN.fit(train_x,train_y)

La siguiente salida creará el constructor del clasificador K vecino más cercano:

KNeighborsClassifier(algorithm = 'auto', leaf_size = 30, metric = 'minkowski',
   metric_params = None, n_jobs = 1, n_neighbors = 20, p = 2,
   weights = 'uniform')

Necesitamos crear la muestra de prueba proporcionando cualquier número arbitrario mayor que 1600, que eran las muestras de entrenamiento.

test = np.array(digit['data'][1725])
test1 = test.reshape(1,-1)
Image_display(1725)

Visualización_imagen (6)

La imagen de 6 se muestra de la siguiente manera:

Ahora predeciremos los datos de la prueba de la siguiente manera:

KNN.predict(test1)

El código anterior generará la siguiente salida:

array([6])

Ahora, considere lo siguiente:

digit['target_names']

El código anterior generará la siguiente salida:

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

El procesamiento del lenguaje natural (PNL) se refiere al método de inteligencia artificial para comunicarse con sistemas inteligentes utilizando un lenguaje natural como el inglés.

El procesamiento de lenguaje natural es necesario cuando desea que un sistema inteligente como un robot funcione según sus instrucciones, cuando desea escuchar la decisión de un sistema clínico experto basado en el diálogo, etc.

El campo de la PNL implica hacer que las computadoras realicen tareas útiles con los lenguajes naturales que usan los humanos. La entrada y salida de un sistema de PNL pueden ser:

  • Speech
  • Texto escrito

Componentes de la PNL

En esta sección, aprenderemos sobre los diferentes componentes de la PNL. Hay dos componentes de la PNL. Los componentes se describen a continuación:

Comprensión del lenguaje natural (NLU)

Implica las siguientes tareas:

  • Mapeo de la entrada dada en lenguaje natural en representaciones útiles.

  • Analizar diferentes aspectos del idioma.

Generación de lenguaje natural (NLG)

Es el proceso de producir frases y oraciones significativas en forma de lenguaje natural a partir de alguna representación interna. Implica -

  • Text planning - Esto incluye recuperar el contenido relevante de la base de conocimientos.

  • Sentence planning - Esto incluye elegir las palabras requeridas, formar frases significativas, establecer el tono de la oración.

  • Text Realization - Esto es mapear el plan de la oración en la estructura de la oración.

Dificultades en NLU

La NLU es muy rica en forma y estructura; sin embargo, es ambiguo. Puede haber diferentes niveles de ambigüedad:

Ambigüedad léxica

Está en un nivel muy primitivo, como el nivel de palabra. Por ejemplo, ¿tratar la palabra "tablero" como sustantivo o verbo?

Ambigüedad a nivel de sintaxis

Una oración se puede analizar de diferentes formas. Por ejemplo, "Levantó el escarabajo con gorra roja". - ¿Usó gorra para levantar el escarabajo o levantó un escarabajo que tenía gorra roja?

Ambigüedad referencial

Refiriéndose a algo usando pronombres. Por ejemplo, Rima fue a Gauri. Ella dijo: "Estoy cansada". - ¿Exactamente quién está cansado?

Terminología de PNL

Veamos ahora algunos términos importantes en la terminología de la PNL.

  • Phonology - Es el estudio de la organización del sonido de forma sistemática.

  • Morphology - Es un estudio de construcción de palabras a partir de unidades significativas primitivas.

  • Morpheme - Es una unidad primitiva de significado en una lengua.

  • Syntax- Se refiere a ordenar palabras para formar una oración. También implica determinar el papel estructural de las palabras en la oración y en las frases.

  • Semantics - Se preocupa por el significado de las palabras y cómo combinar palabras en frases y oraciones significativas.

  • Pragmatics - Se trata del uso y comprensión de frases en diferentes situaciones y cómo se ve afectada la interpretación de la frase.

  • Discourse - Se trata de cómo la oración inmediatamente anterior puede afectar la interpretación de la oración siguiente.

  • World Knowledge - Incluye el conocimiento general del mundo.

Pasos en PNL

Esta sección muestra los diferentes pasos de la PNL.

Análisis léxico

Implica identificar y analizar la estructura de las palabras. Léxico de un idioma significa la colección de palabras y frases en un idioma. El análisis léxico consiste en dividir todo el texto en párrafos, oraciones y palabras.

Análisis sintáctico (análisis)

Implica el análisis de palabras en la oración para la gramática y la organización de las palabras de una manera que muestre la relación entre las palabras. El analizador sintáctico inglés rechaza una oración como "La escuela va al niño".

Análisis semántico

Extrae el significado exacto o el significado del diccionario del texto. Se verifica la significación del texto. Se realiza mapeando estructuras sintácticas y objetos en el dominio de tareas. El analizador semántico ignora oraciones como "helado caliente".

Integración del discurso

El significado de cualquier oración depende del significado de la oración inmediatamente anterior. Además, también aporta el significado de la oración inmediatamente posterior.

Análisis pragmático

Durante esto, lo que se dijo se reinterpreta según lo que realmente significaba. Implica derivar aquellos aspectos del lenguaje que requieren conocimiento del mundo real.

En este capítulo, aprenderemos cómo comenzar con el paquete de herramientas de lenguaje natural.

Requisito previo

Si queremos crear aplicaciones con procesamiento de lenguaje natural, el cambio de contexto lo hace más difícil. El factor de contexto influye en cómo la máquina entiende una oración en particular. Por lo tanto, necesitamos desarrollar aplicaciones de lenguaje natural mediante el uso de enfoques de aprendizaje automático para que la máquina también pueda comprender la forma en que un humano puede comprender el contexto.

Para construir tales aplicaciones usaremos el paquete Python llamado NLTK (Paquete de herramientas de lenguaje natural).

Importando NLTK

Necesitamos instalar NLTK antes de usarlo. Se puede instalar con la ayuda del siguiente comando:

pip install nltk

Para construir un paquete conda para NLTK, use el siguiente comando:

conda install -c anaconda nltk

Ahora, después de instalar el paquete NLTK, debemos importarlo a través del símbolo del sistema de Python. Podemos importarlo escribiendo el siguiente comando en el símbolo del sistema de Python:

>>> import nltk

Descarga de datos de NLTK

Ahora, después de importar NLTK, necesitamos descargar los datos requeridos. Se puede hacer con la ayuda del siguiente comando en el símbolo del sistema de Python:

>>> nltk.download()

Instalación de otros paquetes necesarios

Para construir aplicaciones de procesamiento de lenguaje natural usando NLTK, necesitamos instalar los paquetes necesarios. Los paquetes son los siguientes:

gensim

Es una biblioteca robusta de modelado semántico que es útil para muchas aplicaciones. Podemos instalarlo ejecutando el siguiente comando:

pip install gensim

patrón

Se usa para hacer gensimel paquete funciona correctamente. Podemos instalarlo ejecutando el siguiente comando

pip install pattern

Concepto de tokenización, derivación y lematización

En esta sección, entenderemos qué es tokenización, derivación y lematización.

Tokenización

Puede definirse como el proceso de dividir el texto dado, es decir, la secuencia de caracteres en unidades más pequeñas llamadas tokens. Las fichas pueden ser palabras, números o signos de puntuación. También se le llama segmentación de palabras. A continuación, se muestra un ejemplo simple de tokenización:

Input - Mango, plátano, piña y manzana son frutas.

Output -

El proceso de descomposición del texto dado se puede realizar con la ayuda de localizar los límites de las palabras. El final de una palabra y el comienzo de una nueva se denominan límites de palabras. El sistema de escritura y la estructura tipográfica de las palabras influyen en los límites.

En el módulo Python NLTK, tenemos diferentes paquetes relacionados con la tokenización que podemos usar para dividir el texto en tokens según nuestros requisitos. Algunos de los paquetes son los siguientes:

paquete sent_tokenize

Como sugiere el nombre, este paquete dividirá el texto de entrada en oraciones. Podemos importar este paquete con la ayuda del siguiente código Python:

from nltk.tokenize import sent_tokenize

paquete word_tokenize

Este paquete divide el texto de entrada en palabras. Podemos importar este paquete con la ayuda del siguiente código Python:

from nltk.tokenize import word_tokenize

Paquete WordPunctTokenizer

Este paquete divide el texto de entrada en palabras y también en los signos de puntuación. Podemos importar este paquete con la ayuda del siguiente código Python:

from nltk.tokenize import WordPuncttokenizer

Derivado

Al trabajar con palabras, nos encontramos con muchas variaciones debido a razones gramaticales. El concepto de variaciones aquí significa que tenemos que tratar con diferentes formas de las mismas palabras comodemocracy, democratic, y democratization. Es muy necesario que las máquinas comprendan que estas palabras diferentes tienen la misma forma básica. De esta forma, sería útil extraer las formas base de las palabras mientras analizamos el texto.

Podemos lograr esto mediante la derivación. De esta manera, podemos decir que la derivación es el proceso heurístico de extraer las formas básicas de las palabras cortando los extremos de las palabras.

En el módulo Python NLTK, tenemos diferentes paquetes relacionados con la derivación. Estos paquetes se pueden utilizar para obtener las formas básicas de la palabra. Estos paquetes utilizan algoritmos. Algunos de los paquetes son los siguientes:

Paquete PorterStemmer

Este paquete de Python utiliza el algoritmo de Porter para extraer el formulario base. Podemos importar este paquete con la ayuda del siguiente código Python:

from nltk.stem.porter import PorterStemmer

Por ejemplo, si damos la palabra ‘writing’ como entrada a este lema, obtendremos la palabra ‘write’ después de la derivación.

Paquete LancasterStemmer

Este paquete de Python utilizará el algoritmo de Lancaster para extraer el formulario base. Podemos importar este paquete con la ayuda del siguiente código Python:

from nltk.stem.lancaster import LancasterStemmer

Por ejemplo, si damos la palabra ‘writing’ como entrada a este lema, obtendremos la palabra ‘write’ después de la derivación.

Paquete SnowballStemmer

Este paquete de Python utilizará el algoritmo de la bola de nieve para extraer el formulario base. Podemos importar este paquete con la ayuda del siguiente código Python:

from nltk.stem.snowball import SnowballStemmer

Por ejemplo, si damos la palabra ‘writing’ como entrada a este lema, obtendremos la palabra ‘write’ después de la derivación.

Todos estos algoritmos tienen diferentes niveles de rigor. Si comparamos estos tres lematizadores, Porter es el menos estricto y Lancaster es el más estricto. El tallador de bolas de nieve es bueno para usar en términos de velocidad y rigor.

Lematización

También podemos extraer la forma básica de las palabras mediante lematización. Básicamente, realiza esta tarea con el uso de un vocabulario y análisis morfológico de palabras, normalmente con el objetivo de eliminar solo las terminaciones flexivas. Este tipo de forma básica de cualquier palabra se llama lema.

La principal diferencia entre la derivación y la lematización es el uso de vocabulario y el análisis morfológico de las palabras. Otra diferencia es que la derivación más comúnmente colapsa las palabras derivadas, mientras que la lematización comúnmente solo colapsa las diferentes formas de flexión de un lema. Por ejemplo, si proporcionamos la palabra saw como palabra de entrada, la raíz podría devolver la palabra 's', pero la lematización intentaría devolver la palabra ver o vio dependiendo de si el uso del token era un verbo o un sustantivo.

En el módulo Python NLTK, tenemos el siguiente paquete relacionado con el proceso de lematización que podemos usar para obtener las formas base de la palabra:

Paquete WordNetLemmatizer

Este paquete de Python extraerá la forma base de la palabra dependiendo de si se usa como sustantivo o como verbo. Podemos importar este paquete con la ayuda del siguiente código Python:

from nltk.stem import WordNetLemmatizer

Fragmentación: división de datos en fragmentos

Es uno de los procesos importantes en el procesamiento del lenguaje natural. El trabajo principal de fragmentar es identificar las partes del discurso y frases cortas como frases nominales. Ya hemos estudiado el proceso de tokenización, la creación de tokens. Básicamente, fragmentar es el etiquetado de esos tokens. En otras palabras, fragmentar nos mostrará la estructura de la oración.

En la siguiente sección, aprenderemos sobre los diferentes tipos de Chunking.

Tipos de fragmentación

Hay dos tipos de fragmentación. Los tipos son los siguientes:

Fragmentando

En este proceso de fragmentación, el objeto, las cosas, etc. se mueven hacia ser más generales y el lenguaje se vuelve más abstracto. Hay más posibilidades de acuerdo. En este proceso, nos alejamos. Por ejemplo, si dividimos la pregunta “¿para qué sirven los coches”? Puede que obtengamos la respuesta "transporte".

Fragmentando

En este proceso de fragmentación, el objeto, las cosas, etc. avanzan hacia ser más específicos y el lenguaje se penetra más. La estructura más profunda se examinaría en trozos. En este proceso, nos acercamos. Por ejemplo, si dividimos la pregunta "Habla específicamente sobre un automóvil". Obtendremos información más pequeña sobre el automóvil.

Example

En este ejemplo, haremos fragmentación de frases sustantivas, una categoría de fragmentación que encontrará los fragmentos de frases nominales en la oración, utilizando el módulo NLTK en Python:

Follow these steps in python for implementing noun phrase chunking −

Step 1- En este paso, necesitamos definir la gramática para fragmentar. Consistiría en las reglas que debemos seguir.

Step 2- En este paso, necesitamos crear un analizador de fragmentos. Analizaría la gramática y daría la salida.

Step 3 - En este último paso, la salida se produce en formato de árbol.

Importemos el paquete NLTK necesario de la siguiente manera:

import nltk

Ahora, necesitamos definir la oración. Aquí, DT significa el determinante, VBP significa el verbo, JJ significa el adjetivo, IN significa la preposición y NN significa el sustantivo.

sentence=[("a","DT"),("clever","JJ"),("fox","NN"),("was","VBP"),
          ("jumping","VBP"),("over","IN"),("the","DT"),("wall","NN")]

Ahora, tenemos que dar la gramática. Aquí, daremos la gramática en forma de expresión regular.

grammar = "NP:{<DT>?<JJ>*<NN>}"

Necesitamos definir un analizador que analizará la gramática.

parser_chunking = nltk.RegexpParser(grammar)

El analizador analiza la oración de la siguiente manera:

parser_chunking.parse(sentence)

A continuación, necesitamos obtener la salida. La salida se genera en la variable simple llamadaoutput_chunk.

Output_chunk = parser_chunking.parse(sentence)

Tras la ejecución del siguiente código, podemos dibujar nuestra salida en forma de árbol.

output.draw()

Modelo de bolsa de palabras (BoW)

Bag of Word (BoW), un modelo en el procesamiento del lenguaje natural, se usa básicamente para extraer las características del texto para que el texto se pueda usar en el modelado, como en los algoritmos de aprendizaje automático.

Ahora surge la pregunta de por qué necesitamos extraer las características del texto. Se debe a que los algoritmos de aprendizaje automático no pueden funcionar con datos sin procesar y necesitan datos numéricos para poder extraer información significativa de ellos. La conversión de datos de texto en datos numéricos se denomina extracción de características o codificación de características.

Cómo funciona

Este es un enfoque muy simple para extraer las características del texto. Supongamos que tenemos un documento de texto y queremos convertirlo en datos numéricos o decir que queremos extraer las características de él y luego, en primer lugar, este modelo extrae un vocabulario de todas las palabras del documento. Luego, al usar una matriz de términos de documento, construirá un modelo. De esta forma, BoW representa el documento solo como una bolsa de palabras. Se descarta cualquier información sobre el orden o la estructura de las palabras en el documento.

Concepto de matriz de términos del documento

El algoritmo BoW construye un modelo utilizando la matriz de términos del documento. Como sugiere el nombre, la matriz de términos del documento es la matriz de varios recuentos de palabras que ocurren en el documento. Con la ayuda de esta matriz, el documento de texto se puede representar como una combinación ponderada de varias palabras. Al establecer el umbral y elegir las palabras que son más significativas, podemos construir un histograma de todas las palabras en los documentos que se pueden usar como vector de características. A continuación se muestra un ejemplo para comprender el concepto de matriz de términos de documento:

Example

Supongamos que tenemos las siguientes dos oraciones:

  • Sentence 1 - Estamos usando el modelo Bag of Words.

  • Sentence 2 - El modelo Bag of Words se utiliza para extraer las características.

Ahora, al considerar estas dos oraciones, tenemos las siguientes 13 palabras distintas:

  • we
  • are
  • using
  • the
  • bag
  • of
  • words
  • model
  • is
  • used
  • for
  • extracting
  • features

Ahora, necesitamos construir un histograma para cada oración usando el recuento de palabras en cada oración:

  • Sentence 1 - [1,1,1,1,1,1,1,1,0,0,0,0,0]

  • Sentence 2 - [0,0,0,1,1,1,1,1,1,1,1,1,1]

De esta forma, tenemos los vectores de características que se han extraído. Cada vector de características tiene 13 dimensiones porque tenemos 13 palabras distintas.

Concepto de Estadística

El concepto de las estadísticas se denomina Término Frecuencia-Frecuencia inversa del documento (tf-idf). Cada palabra es importante en el documento. Las estadísticas nos ayudan a comprender la importancia de cada palabra.

Frecuencia de término (tf)

Es la medida de la frecuencia con la que aparece cada palabra en un documento. Se puede obtener dividiendo el recuento de cada palabra por el número total de palabras de un documento determinado.

Frecuencia de documento inverso (idf)

Es la medida de cuán única es una palabra para este documento en el conjunto de documentos dado. Para calcular idf y formular un vector de características distintivas, necesitamos reducir el peso de las palabras comunes como y sopesar las palabras raras.

Construyendo un modelo de bolsa de palabras en NLTK

En esta sección, definiremos una colección de cadenas usando CountVectorizer para crear vectores a partir de estas oraciones.

Importamos el paquete necesario -

from sklearn.feature_extraction.text import CountVectorizer

Ahora defina el conjunto de oraciones.

Sentences = ['We are using the Bag of Word model', 'Bag of Word model is
           used for extracting the features.']

vectorizer_count = CountVectorizer()

features_text = vectorizer.fit_transform(Sentences).todense()

print(vectorizer.vocabulary_)

El programa anterior genera la salida como se muestra a continuación. Muestra que tenemos 13 palabras distintas en las dos oraciones anteriores:

{'we': 11, 'are': 0, 'using': 10, 'the': 8, 'bag': 1, 'of': 7,
 'word': 12, 'model': 6, 'is': 5, 'used': 9, 'for': 4, 'extracting': 2, 'features': 3}

Estos son los vectores de características (texto a forma numérica) que se pueden usar para el aprendizaje automático.

Resolviendo problemas

En esta sección, resolveremos algunos problemas relacionados.

Predicción de categoría

En un conjunto de documentos, no solo las palabras sino también la categoría de las palabras son importantes; en qué categoría de texto se encuentra una palabra en particular. Por ejemplo, queremos predecir si una oración determinada pertenece a la categoría correo electrónico, noticias, deportes, computadora, etc. En el siguiente ejemplo, usaremos tf-idf para formular un vector de características para encontrar la categoría de documentos. Usaremos los datos del conjunto de datos de 20 grupos de noticias de sklearn.

Necesitamos importar los paquetes necesarios -

from sklearn.datasets import fetch_20newsgroups
from sklearn.naive_bayes import MultinomialNB
from sklearn.feature_extraction.text import TfidfTransformer
from sklearn.feature_extraction.text import CountVectorizer

Defina el mapa de categorías. Estamos utilizando cinco categorías diferentes llamadas Religión, Automóviles, Deportes, Electrónica y Espacio.

category_map = {'talk.religion.misc':'Religion','rec.autos''Autos',
   'rec.sport.hockey':'Hockey','sci.electronics':'Electronics', 'sci.space': 'Space'}

Crea el conjunto de entrenamiento -

training_data = fetch_20newsgroups(subset = 'train',
   categories = category_map.keys(), shuffle = True, random_state = 5)

Cree un vectorizador de recuento y extraiga el término recuentos:

vectorizer_count = CountVectorizer()
train_tc = vectorizer_count.fit_transform(training_data.data)
print("\nDimensions of training data:", train_tc.shape)

El transformador tf-idf se crea de la siguiente manera:

tfidf = TfidfTransformer()
train_tfidf = tfidf.fit_transform(train_tc)

Ahora, defina los datos de prueba:

input_data = [
   'Discovery was a space shuttle',
   'Hindu, Christian, Sikh all are religions',
   'We must have to drive safely',
   'Puck is a disk made of rubber',
   'Television, Microwave, Refrigrated all uses electricity'
]

Los datos anteriores nos ayudarán a entrenar un clasificador multinomial Naive Bayes -

classifier = MultinomialNB().fit(train_tfidf, training_data.target)

Transforme los datos de entrada usando el vectorizador de conteo -

input_tc = vectorizer_count.transform(input_data)

Ahora, transformaremos los datos vectorizados usando el transformador tfidf -

input_tfidf = tfidf.transform(input_tc)

Predeciremos las categorías de salida:

predictions = classifier.predict(input_tfidf)

La salida se genera de la siguiente manera:

for sent, category in zip(input_data, predictions):
   print('\nInput Data:', sent, '\n Category:', \
      category_map[training_data.target_names[category]])

El predictor de categoría genera la siguiente salida:

Dimensions of training data: (2755, 39297)

Input Data: Discovery was a space shuttle
Category: Space

Input Data: Hindu, Christian, Sikh all are religions
Category: Religion

Input Data: We must have to drive safely
Category: Autos

Input Data: Puck is a disk made of rubber
Category: Hockey

Input Data: Television, Microwave, Refrigrated all uses electricity
Category: Electronics

Buscador de género

En este enunciado del problema, se capacitaría a un clasificador para encontrar el género (masculino o femenino) proporcionando los nombres. Necesitamos usar una heurística para construir un vector de características y entrenar al clasificador. Usaremos los datos etiquetados del paquete scikit-learn. A continuación se muestra el código de Python para construir un buscador de género:

Importamos los paquetes necesarios -

import random

from nltk import NaiveBayesClassifier
from nltk.classify import accuracy as nltk_accuracy
from nltk.corpus import names

Ahora necesitamos extraer las últimas N letras de la palabra de entrada. Estas letras actuarán como características:

def extract_features(word, N = 2):
   last_n_letters = word[-N:]
   return {'feature': last_n_letters.lower()}
	
if __name__=='__main__':

Cree los datos de entrenamiento utilizando nombres etiquetados (tanto masculinos como femeninos) disponibles en NLTK -

male_list = [(name, 'male') for name in names.words('male.txt')]
female_list = [(name, 'female') for name in names.words('female.txt')]
data = (male_list + female_list)

random.seed(5)
random.shuffle(data)

Ahora, los datos de prueba se crearán de la siguiente manera:

namesInput = ['Rajesh', 'Gaurav', 'Swati', 'Shubha']

Defina la cantidad de muestras utilizadas para entrenar y probar con el siguiente código

train_sample = int(0.8 * len(data))

Ahora, necesitamos iterar a través de diferentes longitudes para que se pueda comparar la precisión:

for i in range(1, 6):
   print('\nNumber of end letters:', i)
   features = [(extract_features(n, i), gender) for (n, gender) in data]
   train_data, test_data = features[:train_sample],
features[train_sample:]
   classifier = NaiveBayesClassifier.train(train_data)

La precisión del clasificador se puede calcular de la siguiente manera:

accuracy_classifier = round(100 * nltk_accuracy(classifier, test_data), 2)
   print('Accuracy = ' + str(accuracy_classifier) + '%')

Ahora, podemos predecir la salida:

for name in namesInput:
   print(name, '==>', classifier.classify(extract_features(name, i)))

El programa anterior generará la siguiente salida:

Number of end letters: 1
Accuracy = 74.7%
Rajesh -> female
Gaurav -> male
Swati -> female
Shubha -> female

Number of end letters: 2
Accuracy = 78.79%
Rajesh -> male
Gaurav -> male
Swati -> female
Shubha -> female

Number of end letters: 3
Accuracy = 77.22%
Rajesh -> male
Gaurav -> female
Swati -> female
Shubha -> female

Number of end letters: 4
Accuracy = 69.98%
Rajesh -> female
Gaurav -> female
Swati -> female
Shubha -> female

Number of end letters: 5
Accuracy = 64.63%
Rajesh -> female
Gaurav -> female
Swati -> female
Shubha -> female

En el resultado anterior, podemos ver que la precisión en el número máximo de letras finales es dos y está disminuyendo a medida que aumenta la cantidad de letras finales.

Modelado de temas: identificación de patrones en datos de texto

Sabemos que generalmente los documentos se agrupan por temas. A veces, necesitamos identificar los patrones en un texto que corresponden a un tema en particular. La técnica para hacer esto se llama modelado de temas. En otras palabras, podemos decir que el modelado de temas es una técnica para descubrir temas abstractos o estructuras ocultas en el conjunto de documentos dado.

Podemos utilizar la técnica de modelado de temas en los siguientes escenarios:

Clasificación de texto

Con la ayuda del modelado de temas, la clasificación se puede mejorar porque agrupa palabras similares en lugar de usar cada palabra por separado como característica.

Sistemas de recomendación

Con la ayuda del modelado de temas, podemos construir los sistemas de recomendación usando medidas de similitud.

Algoritmos para el modelado de temas

El modelado de temas se puede implementar mediante algoritmos. Los algoritmos son los siguientes:

Asignación de Dirichlet latente (LDA)

Este algoritmo es el más popular para el modelado de temas. Utiliza los modelos gráficos probabilísticos para implementar el modelado de temas. Necesitamos importar el paquete gensim en Python para usar LDA slgorithm.

Análisis semántico latente (LDA) o indexación semántica latente (LSI)

Este algoritmo se basa en álgebra lineal. Básicamente, utiliza el concepto de SVD (Descomposición de valores singulares) en la matriz de términos del documento.

Factorización de matriz no negativa (NMF)

También se basa en álgebra lineal.

Todos los algoritmos mencionados anteriormente para el modelado de temas tendrían la number of topics como parámetro, Document-Word Matrix como entrada y WTM (Word Topic Matrix) Y TDM (Topic Document Matrix) como salida.

Predecir el siguiente en una secuencia de entrada determinada es otro concepto importante en el aprendizaje automático. Este capítulo le brinda una explicación detallada sobre el análisis de datos de series de tiempo.

Introducción

Los datos de series de tiempo son los datos que se encuentran en una serie de intervalos de tiempo particulares. Si queremos construir una predicción de secuencia en el aprendizaje automático, entonces tenemos que lidiar con datos secuenciales y tiempo. Los datos en serie son un resumen de datos secuenciales. El orden de los datos es una característica importante de los datos secuenciales.

Concepto básico de análisis de secuencia o análisis de series de tiempo

El análisis de secuencia o análisis de series de tiempo es para predecir el siguiente en una secuencia de entrada dada basándose en lo observado previamente. La predicción puede ser de cualquier cosa que venga a continuación: un símbolo, un número, el tiempo del día siguiente, el siguiente término en el discurso, etc. El análisis de secuencia puede ser muy útil en aplicaciones como el análisis del mercado de valores, pronóstico del tiempo y recomendaciones de productos.

Example

Considere el siguiente ejemplo para comprender la predicción de secuencias. aquíA,B,C,D son los valores dados y tienes que predecir el valor E utilizando un modelo de predicción de secuencia.

Instalación de paquetes útiles

Para el análisis de datos de series de tiempo usando Python, necesitamos instalar los siguientes paquetes:

Pandas

Pandas es una biblioteca de código abierto con licencia BSD que proporciona alto rendimiento, facilidad de uso de la estructura de datos y herramientas de análisis de datos para Python. Puede instalar Pandas con la ayuda del siguiente comando:

pip install pandas

Si está usando Anaconda y desea instalar usando el conda administrador de paquetes, entonces puede usar el siguiente comando:

conda install -c anaconda pandas

hmmaprender

Es una biblioteca de código abierto con licencia BSD que consta de algoritmos y modelos simples para aprender modelos ocultos de Markov (HMM) en Python. Puede instalarlo con la ayuda del siguiente comando:

pip install hmmlearn

Si está usando Anaconda y desea instalar usando el conda administrador de paquetes, entonces puede usar el siguiente comando:

conda install -c omnia hmmlearn

PyStruct

Es una biblioteca estructurada de aprendizaje y predicción. Los algoritmos de aprendizaje implementados en PyStruct tienen nombres como campos aleatorios condicionales (CRF), redes aleatorias de margen máximo de margen (M3N) o máquinas vectoriales de soporte estructural. Puede instalarlo con la ayuda del siguiente comando:

pip install pystruct

CVXOPT

Se utiliza para la optimización convexa basada en el lenguaje de programación Python. También es un paquete de software gratuito. Puede instalarlo con la ayuda del siguiente comando:

pip install cvxopt

Si está usando Anaconda y desea instalar usando el conda administrador de paquetes, entonces puede usar el siguiente comando:

conda install -c anaconda cvdoxt

Pandas: manejo, corte y extracción de estadísticas de datos de series de tiempo

Pandas es una herramienta muy útil si tiene que trabajar con datos de series de tiempo. Con la ayuda de Pandas, puede realizar lo siguiente:

  • Cree un rango de fechas usando el pd.date_range paquete

  • Indexe pandas con fechas usando el pd.Series paquete

  • Realice un nuevo muestreo mediante el ts.resample paquete

  • Cambiar la frecuencia

Ejemplo

El siguiente ejemplo le muestra cómo manejar y dividir los datos de la serie temporal mediante Pandas. Tenga en cuenta que aquí estamos usando los datos de Oscilación Ártica Mensual, que se pueden descargar de Monthly.ao.index.b50.current.ascii y se pueden convertir a formato de texto para nuestro uso.

Manejo de datos de series de tiempo

Para manejar datos de series de tiempo, deberá realizar los siguientes pasos:

El primer paso consiste en importar los siguientes paquetes:

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

A continuación, defina una función que leerá los datos del archivo de entrada, como se muestra en el código que se proporciona a continuación:

def read_data(input_file):
   input_data = np.loadtxt(input_file, delimiter = None)

Ahora, convierta estos datos en series de tiempo. Para ello, cree el rango de fechas de nuestra serie temporal. En este ejemplo, mantenemos un mes como frecuencia de datos. Nuestro archivo tiene los datos que comienzan en enero de 1950.

dates = pd.date_range('1950-01', periods = input_data.shape[0], freq = 'M')

En este paso, creamos los datos de la serie temporal con la ayuda de Pandas Series, como se muestra a continuación:

output = pd.Series(input_data[:, index], index = dates)	
return output
	
if __name__=='__main__':

Ingrese la ruta del archivo de entrada como se muestra aquí -

input_file = "/Users/admin/AO.txt"

Ahora, convierta la columna al formato de serie temporal, como se muestra aquí:

timeseries = read_data(input_file)

Finalmente, trace y visualice los datos, utilizando los comandos que se muestran:

plt.figure()
timeseries.plot()
plt.show()

Observará las parcelas como se muestra en las siguientes imágenes:

Cortar datos de series de tiempo

La división implica recuperar solo una parte de los datos de la serie temporal. Como parte del ejemplo, estamos dividiendo los datos solo de 1980 a 1990. Observe el siguiente código que realiza esta tarea:

timeseries['1980':'1990'].plot()
   <matplotlib.axes._subplots.AxesSubplot at 0xa0e4b00>

plt.show()

Cuando ejecuta el código para cortar los datos de la serie de tiempo, puede observar el siguiente gráfico como se muestra en la imagen aquí:

Extracción de estadísticas de datos de series temporales

Tendrá que extraer algunas estadísticas de un dato dado, en los casos en que necesite sacar alguna conclusión importante. Media, varianza, correlación, valor máximo y valor mínimo son algunas de estas estadísticas. Puede utilizar el siguiente código si desea extraer dichas estadísticas de una serie de datos determinada:

Media

Puedes usar el mean() función, para encontrar la media, como se muestra aquí -

timeseries.mean()

Entonces, la salida que observará para el ejemplo discutido es:

-0.11143128165238671

Máximo

Puedes usar el max() función, para encontrar el máximo, como se muestra aquí -

timeseries.max()

Entonces, la salida que observará para el ejemplo discutido es:

3.4952999999999999

Mínimo

Puede usar la función min (), para encontrar el mínimo, como se muestra aquí -

timeseries.min()

Entonces, la salida que observará para el ejemplo discutido es:

-4.2656999999999998

Conseguir todo a la vez

Si desea calcular todas las estadísticas a la vez, puede utilizar el describe() funciona como se muestra aquí -

timeseries.describe()

Entonces, la salida que observará para el ejemplo discutido es:

count   817.000000
mean     -0.111431
std       1.003151
min      -4.265700
25%      -0.649430
50%      -0.042744
75%       0.475720
max       3.495300
dtype: float64

Re-muestreo

Puede volver a muestrear los datos a una frecuencia de tiempo diferente. Los dos parámetros para realizar el remuestreo son:

  • Periodo de tiempo
  • Method

Re-muestreo con media ()

Puede usar el siguiente código para volver a muestrear los datos con el método mean (), que es el método predeterminado:

timeseries_mm = timeseries.resample("A").mean()
timeseries_mm.plot(style = 'g--')
plt.show()

Luego, puede observar el siguiente gráfico como la salida del remuestreo usando mean () -

Nuevo muestreo con mediana ()

Puede utilizar el siguiente código para volver a muestrear los datos utilizando el median()método -

timeseries_mm = timeseries.resample("A").median()
timeseries_mm.plot()
plt.show()

Luego, puede observar el siguiente gráfico como el resultado del remuestreo con mediana () -

Media rodante

Puede usar el siguiente código para calcular la media rodante (en movimiento):

timeseries.rolling(window = 12, center = False).mean().plot(style = '-g')
plt.show()

Luego, puede observar el siguiente gráfico como la salida de la media rodante (en movimiento):

Análisis de datos secuenciales mediante el modelo de Markov oculto (HMM)

HMM es un modelo estadístico que se usa ampliamente para datos que tienen continuación y extensibilidad, como análisis de mercado de valores de series de tiempo, chequeos médicos y reconocimiento de voz. Esta sección trata en detalle sobre el análisis de datos secuenciales utilizando el modelo de Markov oculto (HMM).

Modelo de Markov oculto (HMM)

HMM es un modelo estocástico que se basa en el concepto de cadena de Markov basado en la suposición de que la probabilidad de estadísticas futuras depende solo del estado actual del proceso en lugar de cualquier estado que lo precedió. Por ejemplo, al lanzar una moneda, no podemos decir que el resultado del quinto lanzamiento será una cara. Esto se debe a que una moneda no tiene memoria y el siguiente resultado no depende del resultado anterior.

Matemáticamente, HMM consta de las siguientes variables:

Estados (S)

Es un conjunto de estados ocultos o latentes presentes en un HMM. Está denotado por S.

Símbolos de salida (O)

Es un conjunto de posibles símbolos de salida presentes en un HMM. Se denota por O.

Matriz de probabilidad de transición de estado (A)

Es la probabilidad de hacer la transición de un estado a cada uno de los otros estados. Está denotado por A.

Matriz de probabilidad de emisión de observación (B)

Es la probabilidad de emitir / observar un símbolo en un estado particular. Está denotado por B.

Matriz de probabilidad previa (Π)

Es la probabilidad de comenzar en un estado particular desde varios estados del sistema. Se denota por Π.

Por lo tanto, un HMM puede definirse como = (S,O,A,B,),

where,

  • S = {s1,s2,…,sN} is a set of N possible states,
  • O = {o1,o2,…,oM} is a set of M possible observation symbols,
  • A is an NN state Transition Probability Matrix (TPM),
  • B is an NM observation or Emission Probability Matrix (EPM),
  • π is an N dimensional initial state probability distribution vector.

Example: Analysis of Stock Market data

In this example, we are going to analyze the data of stock market, step by step, to get an idea about how the HMM works with sequential or time series data. Please note that we are implementing this example in Python.

Import the necessary packages as shown below −

import datetime
import warnings

Now, use the stock market data from the matpotlib.finance package, as shown here −

import numpy as np
from matplotlib import cm, pyplot as plt
from matplotlib.dates import YearLocator, MonthLocator
try:
   from matplotlib.finance import quotes_historical_yahoo_och1
except ImportError:
   from matplotlib.finance import (
      quotes_historical_yahoo as quotes_historical_yahoo_och1)

from hmmlearn.hmm import GaussianHMM

Load the data from a start date and end date, i.e., between two specific dates as shown here −

start_date = datetime.date(1995, 10, 10)
end_date = datetime.date(2015, 4, 25)
quotes = quotes_historical_yahoo_och1('INTC', start_date, end_date)

In this step, we will extract the closing quotes every day. For this, use the following command −

closing_quotes = np.array([quote[2] for quote in quotes])

Now, we will extract the volume of shares traded every day. For this, use the following command −

volumes = np.array([quote[5] for quote in quotes])[1:]

Here, take the percentage difference of closing stock prices, using the code shown below −

diff_percentages = 100.0 * np.diff(closing_quotes) / closing_quotes[:-]
dates = np.array([quote[0] for quote in quotes], dtype = np.int)[1:]
training_data = np.column_stack([diff_percentages, volumes])

In this step, create and train the Gaussian HMM. For this, use the following code −

hmm = GaussianHMM(n_components = 7, covariance_type = 'diag', n_iter = 1000)
with warnings.catch_warnings():
   warnings.simplefilter('ignore')
   hmm.fit(training_data)

Now, generate data using the HMM model, using the commands shown −

num_samples = 300
samples, _ = hmm.sample(num_samples)

Finally, in this step, we plot and visualize the difference percentage and volume of shares traded as output in the form of graph.

Use the following code to plot and visualize the difference percentages −

plt.figure()
plt.title('Difference percentages')
plt.plot(np.arange(num_samples), samples[:, 0], c = 'black')

Use the following code to plot and visualize the volume of shares traded −

plt.figure()
plt.title('Volume of shares')
plt.plot(np.arange(num_samples), samples[:, 1], c = 'black')
plt.ylim(ymin = 0)
plt.show()

In this chapter, we will learn about speech recognition using AI with Python.

Speech is the most basic means of adult human communication. The basic goal of speech processing is to provide an interaction between a human and a machine.

Speech processing system has mainly three tasks −

  • First, speech recognition that allows the machine to catch the words, phrases and sentences we speak

  • Second, natural language processing to allow the machine to understand what we speak, and

  • Third, speech synthesis to allow the machine to speak.

This chapter focuses on speech recognition, the process of understanding the words that are spoken by human beings. Remember that the speech signals are captured with the help of a microphone and then it has to be understood by the system.

Building a Speech Recognizer

Speech Recognition or Automatic Speech Recognition (ASR) is the center of attention for AI projects like robotics. Without ASR, it is not possible to imagine a cognitive robot interacting with a human. However, it is not quite easy to build a speech recognizer.

Difficulties in developing a speech recognition system

Developing a high quality speech recognition system is really a difficult problem. The difficulty of speech recognition technology can be broadly characterized along a number of dimensions as discussed below −

  • Size of the vocabulary − Size of the vocabulary impacts the ease of developing an ASR. Consider the following sizes of vocabulary for a better understanding.

    • A small size vocabulary consists of 2-100 words, for example, as in a voice-menu system

    • A medium size vocabulary consists of several 100s to 1,000s of words, for example, as in a database-retrieval task

    • A large size vocabulary consists of several 10,000s of words, as in a general dictation task.

    Note that, the larger the size of vocabulary, the harder it is to perform recognition.

  • Channel characteristics − Channel quality is also an important dimension. For example, human speech contains high bandwidth with full frequency range, while a telephone speech consists of low bandwidth with limited frequency range. Note that it is harder in the latter.

  • Speaking mode − Ease of developing an ASR also depends on the speaking mode, that is whether the speech is in isolated word mode, or connected word mode, or in a continuous speech mode. Note that a continuous speech is harder to recognize.

  • Speaking style − A read speech may be in a formal style, or spontaneous and conversational with casual style. The latter is harder to recognize.

  • Speaker dependency − Speech can be speaker dependent, speaker adaptive, or speaker independent. A speaker independent is the hardest to build.

  • Type of noise − Noise is another factor to consider while developing an ASR. Signal to noise ratio may be in various ranges, depending on the acoustic environment that observes less versus more background noise −

    • If the signal to noise ratio is greater than 30dB, it is considered as high range

    • If the signal to noise ratio lies between 30dB to 10db, it is considered as medium SNR

    • If the signal to noise ratio is lesser than 10dB, it is considered as low range

    For example, the type of background noise such as stationary, non-human noise, background speech and crosstalk by other speakers also contributes to the difficulty of the problem.

  • Microphone characteristics − The quality of microphone may be good, average, or below average. Also, the distance between mouth and micro-phone can vary. These factors also should be considered for recognition systems.

Despite these difficulties, researchers worked a lot on various aspects of speech such as understanding the speech signal, the speaker, and identifying the accents.

You will have to follow the steps given below to build a speech recognizer −

Visualizing Audio Signals - Reading from a File and Working on it

This is the first step in building speech recognition system as it gives an understanding of how an audio signal is structured. Some common steps that can be followed to work with audio signals are as follows −

Recording

When you have to read the audio signal from a file, then record it using a microphone, at first.

Sampling

When recording with microphone, the signals are stored in a digitized form. But to work upon it, the machine needs them in the discrete numeric form. Hence, we should perform sampling at a certain frequency and convert the signal into the discrete numerical form. Choosing the high frequency for sampling implies that when humans listen to the signal, they feel it as a continuous audio signal.

Example

The following example shows a stepwise approach to analyze an audio signal, using Python, which is stored in a file. The frequency of this audio signal is 44,100 HZ.

Import the necessary packages as shown here −

import numpy as np
import matplotlib.pyplot as plt
from scipy.io import wavfile

Now, read the stored audio file. It will return two values: the sampling frequency and the audio signal. Provide the path of the audio file where it is stored, as shown here −

frequency_sampling, audio_signal = wavfile.read("/Users/admin/audio_file.wav")

Display the parameters like sampling frequency of the audio signal, data type of signal and its duration, using the commands shown −

print('\nSignal shape:', audio_signal.shape)
print('Signal Datatype:', audio_signal.dtype)
print('Signal duration:', round(audio_signal.shape[0] / 
float(frequency_sampling), 2), 'seconds')

This step involves normalizing the signal as shown below −

audio_signal = audio_signal / np.power(2, 15)

In this step, we are extracting the first 100 values from this signal to visualize. Use the following commands for this purpose −

audio_signal = audio_signal [:100]
time_axis = 1000 * np.arange(0, len(signal), 1) / float(frequency_sampling)

Now, visualize the signal using the commands given below −

plt.plot(time_axis, signal, color='blue')
plt.xlabel('Time (milliseconds)')
plt.ylabel('Amplitude')
plt.title('Input audio signal')
plt.show()

You would be able to see an output graph and data extracted for the above audio signal as shown in the image here

Signal shape: (132300,)
Signal Datatype: int16
Signal duration: 3.0 seconds

Characterizing the Audio Signal: Transforming to Frequency Domain

Characterizing an audio signal involves converting the time domain signal into frequency domain, and understanding its frequency components, by. This is an important step because it gives a lot of information about the signal. You can use a mathematical tool like Fourier Transform to perform this transformation.

Example

The following example shows, step-by-step, how to characterize the signal, using Python, which is stored in a file. Note that here we are using Fourier Transform mathematical tool to convert it into frequency domain.

Import the necessary packages, as shown here −

import numpy as np
import matplotlib.pyplot as plt
from scipy.io import wavfile

Now, read the stored audio file. It will return two values: the sampling frequency and the the audio signal. Provide the path of the audio file where it is stored as shown in the command here −

frequency_sampling, audio_signal = wavfile.read("/Users/admin/sample.wav")

In this step, we will display the parameters like sampling frequency of the audio signal, data type of signal and its duration, using the commands given below −

print('\nSignal shape:', audio_signal.shape)
print('Signal Datatype:', audio_signal.dtype)
print('Signal duration:', round(audio_signal.shape[0] / 
float(frequency_sampling), 2), 'seconds')

In this step, we need to normalize the signal, as shown in the following command −

audio_signal = audio_signal / np.power(2, 15)

This step involves extracting the length and half length of the signal. Use the following commands for this purpose −

length_signal = len(audio_signal)
half_length = np.ceil((length_signal + 1) / 2.0).astype(np.int)

Now, we need to apply mathematics tools for transforming into frequency domain. Here we are using the Fourier Transform.

signal_frequency = np.fft.fft(audio_signal)

Now, do the normalization of frequency domain signal and square it −

signal_frequency = abs(signal_frequency[0:half_length]) / length_signal
signal_frequency **= 2

Next, extract the length and half length of the frequency transformed signal −

len_fts = len(signal_frequency)

Note that the Fourier transformed signal must be adjusted for even as well as odd case.

if length_signal % 2:
   signal_frequency[1:len_fts] *= 2
else:
   signal_frequency[1:len_fts-1] *= 2

Now, extract the power in decibal(dB) −

signal_power = 10 * np.log10(signal_frequency)

Adjust the frequency in kHz for X-axis −

x_axis = np.arange(0, len_half, 1) * (frequency_sampling / length_signal) / 1000.0

Now, visualize the characterization of signal as follows −

plt.figure()
plt.plot(x_axis, signal_power, color='black')
plt.xlabel('Frequency (kHz)')
plt.ylabel('Signal power (dB)')
plt.show()

You can observe the output graph of the above code as shown in the image below −

Generating Monotone Audio Signal

The two steps that you have seen till now are important to learn about signals. Now, this step will be useful if you want to generate the audio signal with some predefined parameters. Note that this step will save the audio signal in an output file.

Example

In the following example, we are going to generate a monotone signal, using Python, which will be stored in a file. For this, you will have to take the following steps −

Import the necessary packages as shown −

import numpy as np
import matplotlib.pyplot as plt
from scipy.io.wavfile import write

Provide the file where the output file should be saved

output_file = 'audio_signal_generated.wav'

Now, specify the parameters of your choice, as shown −

duration = 4 # in seconds
frequency_sampling = 44100 # in Hz
frequency_tone = 784
min_val = -4 * np.pi
max_val = 4 * np.pi

In this step, we can generate the audio signal, as shown −

t = np.linspace(min_val, max_val, duration * frequency_sampling)
audio_signal = np.sin(2 * np.pi * tone_freq * t)

Now, save the audio file in the output file −

write(output_file, frequency_sampling, signal_scaled)

Extract the first 100 values for our graph, as shown −

audio_signal = audio_signal[:100]
time_axis = 1000 * np.arange(0, len(signal), 1) / float(sampling_freq)

Now, visualize the generated audio signal as follows −

plt.plot(time_axis, signal, color='blue')
plt.xlabel('Time in milliseconds')
plt.ylabel('Amplitude')
plt.title('Generated audio signal')
plt.show()

You can observe the plot as shown in the figure given here −

Feature Extraction from Speech

This is the most important step in building a speech recognizer because after converting the speech signal into the frequency domain, we must convert it into the usable form of feature vector. We can use different feature extraction techniques like MFCC, PLP, PLP-RASTA etc. for this purpose.

Example

In the following example, we are going to extract the features from signal, step-by-step, using Python, by using MFCC technique.

Import the necessary packages, as shown here −

import numpy as np
import matplotlib.pyplot as plt
from scipy.io import wavfile
from python_speech_features import mfcc, logfbank

Now, read the stored audio file. It will return two values − the sampling frequency and the audio signal. Provide the path of the audio file where it is stored.

frequency_sampling, audio_signal = wavfile.read("/Users/admin/audio_file.wav")

Note that here we are taking first 15000 samples for analysis.

audio_signal = audio_signal[:15000]

Use the MFCC techniques and execute the following command to extract the MFCC features −

features_mfcc = mfcc(audio_signal, frequency_sampling)

Now, print the MFCC parameters, as shown −

print('\nMFCC:\nNumber of windows =', features_mfcc.shape[0])
print('Length of each feature =', features_mfcc.shape[1])

Now, plot and visualize the MFCC features using the commands given below −

features_mfcc = features_mfcc.T
plt.matshow(features_mfcc)
plt.title('MFCC')

In this step, we work with the filter bank features as shown −

Extract the filter bank features −

filterbank_features = logfbank(audio_signal, frequency_sampling)

Now, print the filterbank parameters.

print('\nFilter bank:\nNumber of windows =', filterbank_features.shape[0])
print('Length of each feature =', filterbank_features.shape[1])

Now, plot and visualize the filterbank features.

filterbank_features = filterbank_features.T
plt.matshow(filterbank_features)
plt.title('Filter bank')
plt.show()

As a result of the steps above, you can observe the following outputs: Figure1 for MFCC and Figure2 for Filter Bank

Recognition of Spoken Words

Speech recognition means that when humans are speaking, a machine understands it. Here we are using Google Speech API in Python to make it happen. We need to install the following packages for this −

  • Pyaudio − It can be installed by using pip install Pyaudio command.

  • SpeechRecognition − This package can be installed by using pip install SpeechRecognition.

  • Google-Speech-API − It can be installed by using the command pip install google-api-python-client.

Example

Observe the following example to understand about recognition of spoken words −

Import the necessary packages as shown −

import speech_recognition as sr

Create an object as shown below −

recording = sr.Recognizer()

Now, the Microphone() module will take the voice as input −

with sr.Microphone() as source: recording.adjust_for_ambient_noise(source)
   print("Please Say something:")
   audio = recording.listen(source)

Now google API would recognize the voice and gives the output.

try:
   print("You said: \n" + recording.recognize_google(audio))
except Exception as e:
   print(e)

You can see the following output −

Please Say Something:
You said:

For example, if you said tutorialspoint.com, then the system recognizes it correctly as follows −

tutorialspoint.com

Heuristic search plays a key role in artificial intelligence. In this chapter, you will learn in detail about it.

Concept of Heuristic Search in AI

Heuristic is a rule of thumb which leads us to the probable solution. Most problems in artificial intelligence are of exponential nature and have many possible solutions. You do not know exactly which solutions are correct and checking all the solutions would be very expensive.

Thus, the use of heuristic narrows down the search for solution and eliminates the wrong options. The method of using heuristic to lead the search in search space is called Heuristic Search. Heuristic techniques are very useful because the search can be boosted when you use them.

Difference between Uninformed and Informed Search

There are two types of control strategies or search techniques: uninformed and informed. They are explained in detail as given here −

Uninformed Search

It is also called blind search or blind control strategy. It is named so because there is information only about the problem definition, and no other extra information is available about the states. This kind of search techniques would search the whole state space for getting the solution. Breadth First Search (BFS) and Depth First Search (DFS) are the examples of uninformed search.

Informed Search

It is also called heuristic search or heuristic control strategy. It is named so because there is some extra information about the states. This extra information is useful to compute the preference among the child nodes to explore and expand. There would be a heuristic function associated with each node. Best First Search (BFS), A*, Mean and Analysis are the examples of informed search.

Constraint Satisfaction Problems (CSPs)

Constraint means restriction or limitation. In AI, constraint satisfaction problems are the problems which must be solved under some constraints. The focus must be on not to violate the constraint while solving such problems. Finally, when we reach the final solution, CSP must obey the restriction.

Real World Problem Solved by Constraint Satisfaction

The previous sections dealt with creating constraint satisfaction problems. Now, let us apply this to real world problems too. Some examples of real world problems solved by constraint satisfaction are as follows −

Solving algebraic relation

With the help of constraint satisfaction problem, we can solve algebraic relations. In this example, we will try to solve a simple algebraic relation a*2 = b. It will return the value of a and b within the range that we would define.

After completing this Python program, you would be able to understand the basics of solving problems with constraint satisfaction.

Note that before writing the program, we need to install Python package called python-constraint. You can install it with the help of the following command −

pip install python-constraint

The following steps show you a Python program for solving algebraic relation using constraint satisfaction −

Import the constraint package using the following command −

from constraint import *

Now, create an object of module named problem() as shown below −

problem = Problem()

Now, define variables. Note that here we have two variables a and b, and we are defining 10 as their range, which means we got the solution within first 10 numbers.

problem.addVariable('a', range(10))
problem.addVariable('b', range(10))

Next, define the particular constraint that we want to apply on this problem. Observe that here we are using the constraint a*2 = b.

problem.addConstraint(lambda a, b: a * 2 == b)

Now, create the object of getSolution() module using the following command −

solutions = problem.getSolutions()

Lastly, print the output using the following command −

print (solutions)

You can observe the output of the above program as follows −

[{'a': 4, 'b': 8}, {'a': 3, 'b': 6}, {'a': 2, 'b': 4}, {'a': 1, 'b': 2}, {'a': 0, 'b': 0}]

Magic Square

A magic square is an arrangement of distinct numbers, generally integers, in a square grid, where the numbers in each row , and in each column , and the numbers in the diagonal, all add up to the same number called the “magic constant”.

The following is a stepwise execution of simple Python code for generating magic squares −

Define a function named magic_square, as shown below −

def magic_square(matrix_ms):
   iSize = len(matrix_ms[0])
   sum_list = []

The following code shows the code for vertical of squares −

for col in range(iSize):
   sum_list.append(sum(row[col] for row in matrix_ms))

The following code shows the code for horizantal of squares −

sum_list.extend([sum (lines) for lines in matrix_ms])

The following code shows the code for horizontal of squares −

dlResult = 0
for i in range(0,iSize):
   dlResult +=matrix_ms[i][i]
sum_list.append(dlResult)
drResult = 0
for i in range(iSize-1,-1,-1):
   drResult +=matrix_ms[i][i]
sum_list.append(drResult)

if len(set(sum_list))>1:
   return False
return True

Now, give the value of the matrix and check the output −

print(magic_square([[1,2,3], [4,5,6], [7,8,9]]))

You can observe that the output would be False as the sum is not up to the same number.

print(magic_square([[3,9,2], [3,5,7], [9,1,6]]))

You can observe that the output would be True as the sum is the same number, that is 15 here.

Games are played with a strategy. Every player or team would make a strategy before starting the game and they have to change or build new strategy according to the current situation(s) in the game.

Search Algorithms

You will have to consider computer games also with the same strategy as above. Note that Search Algorithms are the ones that figure out the strategy in computer games.

How it works

The goal of search algorithms is to find the optimal set of moves so that they can reach at the final destination and win. These algorithms use the winning set of conditions, different for every game, to find the best moves.

Visualize a computer game as the tree. We know that tree has nodes. Starting from the root, we can come to the final winning node, but with optimal moves. That is the work of search algorithms. Every node in such tree represents a future state. The search algorithms search through this tree to make decisions at each step or node of the game.

Combinational Search

The major disadvantage of using search algorithms is that they are exhaustive in nature, which is why they explore the entire search space to find the solution that leads to wastage of resources. It would be more cumbersome if these algorithms need to search the whole search space for finding the final solution.

To eliminate such kind of problem, we can use combinational search which uses the heuristic to explore the search space and reduces its size by eliminating the possible wrong moves. Hence, such algorithms can save the resources. Some of the algorithms that use heuristic to search the space and save the resources are discussed here −

Minimax Algorithm

It is the strategy used by combinational search that uses heuristic to speed up the search strategy. The concept of Minimax strategy can be understood with the example of two player games, in which each player tries to predict the next move of the opponent and tries to minimize that function. Also, in order to win, the player always try to maximize its own function based on the current situation.

Heuristic plays an important role in such kind of strategies like Minimax. Every node of the tree would have a heuristic function associated with it. Based on that heuristic, it will take the decision to make a move towards the node that would benefit them the most.

Alpha-Beta Pruning

A major issue with Minimax algorithm is that it can explore those parts of the tree that are irrelevant, leads to the wastage of resources. Hence there must be a strategy to decide which part of the tree is relevant and which is irrelevant and leave the irrelevant part unexplored. Alpha-Beta pruning is one such kind of strategy.

The main goal of Alpha-Beta pruning algorithm is to avoid the searching those parts of the tree that do not have any solution. The main concept of Alpha-Beta pruning is to use two bounds named Alpha, the maximum lower bound, and Beta, the minimum upper bound. These two parameters are the values that restrict the set of possible solutions. It compares the value of the current node with the value of alpha and beta parameters, so that it can move to the part of the tree that has the solution and discard the rest.

Negamax Algorithm

This algorithm is not different from Minimax algorithm, but it has a more elegant implementation. The main disadvantage of using Minimax algorithm is that we need to define two different heuristic functions. The connection between these heuristic is that, the better a state of a game is for one player, the worse it is for the other player. In Negamax algorithm, the same work of two heuristic functions is done with the help of a single heuristic function.

Building Bots to Play Games

For building bots to play two player games in AI, we need to install the easyAI library. It is an artificial intelligence framework that provides all the functionality to build two-player games. You can download it with the help of the following command −

pip install easyAI

Un bot para jugar la última moneda en pie

En este juego, habría una pila de monedas. Cada jugador tiene que tomar un número de monedas de esa pila. El objetivo del juego es evitar llevarse la última moneda del montón. Estaremos usando la claseLastCoinStanding heredado de la TwoPlayersGame clase de la easyAIbiblioteca. El siguiente código muestra el código Python para este juego:

Importe los paquetes necesarios como se muestra:

from easyAI import TwoPlayersGame, id_solve, Human_Player, AI_Player
from easyAI.AI import TT

Ahora, hereda la clase del TwoPlayerGame clase para manejar todas las operaciones del juego -

class LastCoin_game(TwoPlayersGame):
   def __init__(self, players):

Ahora, defina los jugadores y el jugador que va a iniciar el juego.

self.players = players
self.nplayer = 1

Ahora, defina la cantidad de monedas en el juego, aquí estamos usando 15 monedas para el juego.

self.num_coins = 15

Define la cantidad máxima de monedas que un jugador puede recibir en un movimiento.

self.max_coins = 4

Ahora hay ciertas cosas que definir como se muestra en el siguiente código. Define posibles movimientos.

def possible_moves(self):
   return [str(a) for a in range(1, self.max_coins + 1)]

Definir el retiro de las monedas

def make_move(self, move):
   self.num_coins -= int(move)

Defina quién se llevó la última moneda.

def win_game(self):
   return self.num_coins <= 0

Define cuándo detener el juego, es decir, cuando alguien gana.

def is_over(self):
   return self.win()

Defina cómo calcular la puntuación.

def score(self):
   return 100 if self.win_game() else 0

Defina el número de monedas que quedan en la pila.

def show(self):
   print(self.num_coins, 'coins left in the pile')
if __name__ == "__main__":
   tt = TT()
   LastCoin_game.ttentry = lambda self: self.num_coins

Resolviendo el juego con el siguiente bloque de código:

r, d, m = id_solve(LastCoin_game,
   range(2, 20), win_score=100, tt=tt)
print(r, d, m)

Decidir quién comenzará el juego

game = LastCoin_game([AI_Player(tt), Human_Player()])
game.play()

Puede encontrar la siguiente salida y un juego simple de este juego:

d:2, a:0, m:1
d:3, a:0, m:1
d:4, a:0, m:1
d:5, a:0, m:1
d:6, a:100, m:4
1 6 4
15 coins left in the pile
Move #1: player 1 plays 4 :
11 coins left in the pile
Player 2 what do you play ? 2
Move #2: player 2 plays 2 :
9 coins left in the pile
Move #3: player 1 plays 3 :
6 coins left in the pile
Player 2 what do you play ? 1
Move #4: player 2 plays 1 :
5 coins left in the pile
Move #5: player 1 plays 4 :
1 coins left in the pile
Player 2 what do you play ? 1
Move #6: player 2 plays 1 :
0 coins left in the pile

Un bot para jugar Tic Tac Toe

Tic-Tac-Toe es muy familiar y uno de los juegos más populares. Creemos este juego usando eleasyAIbiblioteca en Python. El siguiente código es el código Python de este juego:

Importe los paquetes como se muestra -

from easyAI import TwoPlayersGame, AI_Player, Negamax
from easyAI.Player import Human_Player

Heredar la clase del TwoPlayerGame clase para manejar todas las operaciones del juego -

class TicTacToe_game(TwoPlayersGame):
   def __init__(self, players):

Ahora, defina los jugadores y el jugador que va a comenzar el juego:

self.players = players
self.nplayer = 1

Definir el tipo de tabla -

self.board = [0] * 9

Ahora hay algunas cosas que definir de la siguiente manera:

Definir posibles movimientos

def possible_moves(self):
   return [x + 1 for x, y in enumerate(self.board) if y == 0]

Definir el movimiento de un jugador -

def make_move(self, move):
   self.board[int(move) - 1] = self.nplayer

Para impulsar la IA, define cuándo un jugador realiza un movimiento:

def umake_move(self, move):
   self.board[int(move) - 1] = 0

Definir la condición de pérdida de que un oponente tenga tres en una línea

def condition_for_lose(self):
   possible_combinations = [[1,2,3], [4,5,6], [7,8,9],
      [1,4,7], [2,5,8], [3,6,9], [1,5,9], [3,5,7]]
   return any([all([(self.board[z-1] == self.nopponent)
      for z in combination]) for combination in possible_combinations])

Definir un cheque para el final del juego

def is_over(self):
   return (self.possible_moves() == []) or self.condition_for_lose()

Muestra la posición actual de los jugadores en el juego.

def show(self):
   print('\n'+'\n'.join([' '.join([['.', 'O', 'X'][self.board[3*j + i]]
      for i in range(3)]) for j in range(3)]))

Calcule las puntuaciones.

def scoring(self):
   return -100 if self.condition_for_lose() else 0

Defina el método principal para definir el algoritmo y comenzar el juego -

if __name__ == "__main__":
   algo = Negamax(7)
   TicTacToe_game([Human_Player(), AI_Player(algo)]).play()

Puede ver el siguiente resultado y una jugada simple de este juego:

. . .
. . .
. . .
Player 1 what do you play ? 1
Move #1: player 1 plays 1 :
O . .
. . .
. . .
Move #2: player 2 plays 5 :
O . .
. X .
121
. . .
Player 1 what do you play ? 3
Move #3: player 1 plays 3 :
O . O
. X .
. . .
Move #4: player 2 plays 2 :
O X O
. X .
. . .
Player 1 what do you play ? 4
Move #5: player 1 plays 4 :
O X O
O X .
. . .
Move #6: player 2 plays 8 :
O X O
O X .
. X .

Las redes neuronales son dispositivos informáticos paralelos que intentan crear un modelo informático del cerebro. El principal objetivo detrás es desarrollar un sistema para realizar varias tareas computacionales más rápido que los sistemas tradicionales. Estas tareas incluyen reconocimiento y clasificación de patrones, aproximación, optimización y agrupación de datos.

¿Qué son las redes neuronales artificiales (ANN)?

La red neuronal artificial (ANN) es un sistema informático eficiente cuyo tema central se toma prestado de la analogía de las redes neuronales biológicas. Las RNA también se denominan sistemas neuronales artificiales, sistemas de procesamiento distribuido en paralelo y sistemas conexionistas. ANN adquiere una gran colección de unidades que están interconectadas en algún patrón para permitir las comunicaciones entre ellas. Estas unidades, también denominadasnodes o neurons, son procesadores simples que operan en paralelo.

Cada neurona está conectada con otra neurona a través de un connection link. Cada enlace de conexión está asociado con un peso que tiene la información sobre la señal de entrada. Esta es la información más útil para que las neuronas resuelvan un problema en particular porque elweightnormalmente excita o inhibe la señal que se está comunicando. Cada neurona tiene su estado interno que se llamaactivation signal. Las señales de salida, que se producen después de combinar las señales de entrada y la regla de activación, pueden enviarse a otras unidades.

Si desea estudiar las redes neuronales en detalle, puede seguir el enlace: Red neuronal artificial .

Instalación de paquetes útiles

Para crear redes neuronales en Python, podemos usar un paquete poderoso para redes neuronales llamado NeuroLab. Es una biblioteca de algoritmos básicos de redes neuronales con configuraciones de red flexibles y algoritmos de aprendizaje para Python. Puede instalar este paquete con la ayuda del siguiente comando en el símbolo del sistema:

pip install NeuroLab

Si está utilizando el entorno Anaconda, utilice el siguiente comando para instalar NeuroLab:

conda install -c labfabulous neurolab

Construyendo redes neuronales

En esta sección, construiremos algunas redes neuronales en Python utilizando el paquete NeuroLab.

Clasificador basado en perceptrón

Los perceptrones son los componentes básicos de la ANN. Si quieres saber más sobre Perceptron, puedes seguir el enlace - artificial_neural_network

A continuación se muestra una ejecución paso a paso del código de Python para construir un clasificador simple basado en perceptrón de red neuronal:

Importe los paquetes necesarios como se muestra:

import matplotlib.pyplot as plt
import neurolab as nl

Ingrese los valores de entrada. Tenga en cuenta que es un ejemplo de aprendizaje supervisado, por lo que también deberá proporcionar valores objetivo.

input = [[0, 0], [0, 1], [1, 0], [1, 1]]
target = [[0], [0], [0], [1]]

Crea la red con 2 entradas y 1 neurona -

net = nl.net.newp([[0, 1],[0, 1]], 1)

Ahora, entrena la red. Aquí, estamos usando la regla Delta para el entrenamiento.

error_progress = net.train(input, target, epochs=100, show=10, lr=0.1)

Ahora, visualice la salida y trace el gráfico:

plt.figure()
plt.plot(error_progress)
plt.xlabel('Number of epochs')
plt.ylabel('Training error')
plt.grid()
plt.show()

Puede ver el siguiente gráfico que muestra el progreso del entrenamiento utilizando la métrica de error:

Redes neuronales de una sola capa

En este ejemplo, estamos creando una red neuronal de una sola capa que consta de neuronas independientes que actúan sobre los datos de entrada para producir la salida. Tenga en cuenta que estamos usando el archivo de texto llamadoneural_simple.txt como nuestra entrada.

Importe los paquetes útiles como se muestra -

import numpy as np
import matplotlib.pyplot as plt
import neurolab as nl

Cargue el conjunto de datos de la siguiente manera:

input_data = np.loadtxt(“/Users/admin/neural_simple.txt')

Los siguientes son los datos que vamos a utilizar. Tenga en cuenta que en estos datos, las dos primeras columnas son las características y las dos últimas columnas son las etiquetas.

array([[2. , 4. , 0. , 0. ],
      [1.5, 3.9, 0. , 0. ],
      [2.2, 4.1, 0. , 0. ],
      [1.9, 4.7, 0. , 0. ],
      [5.4, 2.2, 0. , 1. ],
      [4.3, 7.1, 0. , 1. ],
      [5.8, 4.9, 0. , 1. ],
      [6.5, 3.2, 0. , 1. ],
      [3. , 2. , 1. , 0. ],
      [2.5, 0.5, 1. , 0. ],
      [3.5, 2.1, 1. , 0. ],
      [2.9, 0.3, 1. , 0. ],
      [6.5, 8.3, 1. , 1. ],
      [3.2, 6.2, 1. , 1. ],
      [4.9, 7.8, 1. , 1. ],
      [2.1, 4.8, 1. , 1. ]])

Ahora, separe estas cuatro columnas en 2 columnas de datos y 2 etiquetas:

data = input_data[:, 0:2]
labels = input_data[:, 2:]

Trace los datos de entrada usando los siguientes comandos:

plt.figure()
plt.scatter(data[:,0], data[:,1])
plt.xlabel('Dimension 1')
plt.ylabel('Dimension 2')
plt.title('Input data')

Ahora, defina los valores mínimo y máximo para cada dimensión como se muestra aquí:

dim1_min, dim1_max = data[:,0].min(), data[:,0].max()
dim2_min, dim2_max = data[:,1].min(), data[:,1].max()

A continuación, defina el número de neuronas en la capa de salida de la siguiente manera:

nn_output_layer = labels.shape[1]

Ahora, defina una red neuronal de una sola capa:

dim1 = [dim1_min, dim1_max]
dim2 = [dim2_min, dim2_max]
neural_net = nl.net.newp([dim1, dim2], nn_output_layer)

Entrene la red neuronal con el número de épocas y la tasa de aprendizaje como se muestra:

error = neural_net.train(data, labels, epochs = 200, show = 20, lr = 0.01)

Ahora, visualice y trace el progreso del entrenamiento usando los siguientes comandos:

plt.figure()
plt.plot(error)
plt.xlabel('Number of epochs')
plt.ylabel('Training error')
plt.title('Training error progress')
plt.grid()
plt.show()

Ahora, use los puntos de datos de prueba en el clasificador anterior:

print('\nTest Results:')
data_test = [[1.5, 3.2], [3.6, 1.7], [3.6, 5.7],[1.6, 3.9]] for item in data_test:
   print(item, '-->', neural_net.sim([item])[0])

Puede encontrar los resultados de la prueba como se muestra aquí:

[1.5, 3.2] --> [1. 0.]
[3.6, 1.7] --> [1. 0.]
[3.6, 5.7] --> [1. 1.]
[1.6, 3.9] --> [1. 0.]

Puede ver los siguientes gráficos como resultado del código discutido hasta ahora:

Redes neuronales multicapa

En este ejemplo, estamos creando una red neuronal multicapa que consta de más de una capa para extraer los patrones subyacentes en los datos de entrenamiento. Esta red neuronal multicapa funcionará como un regresor. Vamos a generar algunos puntos de datos basados ​​en la ecuación: y = 2x 2 +8.

Importe los paquetes necesarios como se muestra:

import numpy as np
import matplotlib.pyplot as plt
import neurolab as nl

Genere algún punto de datos basado en la ecuación mencionada anteriormente:

min_val = -30
max_val = 30
num_points = 160
x = np.linspace(min_val, max_val, num_points)
y = 2 * np.square(x) + 8
y /= np.linalg.norm(y)

Ahora, modifique este conjunto de datos de la siguiente manera:

data = x.reshape(num_points, 1)
labels = y.reshape(num_points, 1)

Visualice y grafique el conjunto de datos de entrada usando los siguientes comandos:

plt.figure()
plt.scatter(data, labels)
plt.xlabel('Dimension 1')
plt.ylabel('Dimension 2')
plt.title('Data-points')

Ahora, construya la red neuronal con dos capas ocultas con neurolab con ten neuronas en la primera capa oculta, six en la segunda capa oculta y one en la capa de salida.

neural_net = nl.net.newff([[min_val, max_val]], [10, 6, 1])

Ahora use el algoritmo de entrenamiento de gradiente -

neural_net.trainf = nl.train.train_gd

Ahora entrene a la red con el objetivo de aprender sobre los datos generados anteriormente:

error = neural_net.train(data, labels, epochs = 1000, show = 100, goal = 0.01)

Ahora, ejecute las redes neuronales en los puntos de datos de entrenamiento:

output = neural_net.sim(data)
y_pred = output.reshape(num_points)

Ahora trazar y visualizar la tarea -

plt.figure()
plt.plot(error)
plt.xlabel('Number of epochs')
plt.ylabel('Error')
plt.title('Training error progress')

Ahora graficaremos la salida real frente a la prevista:

x_dense = np.linspace(min_val, max_val, num_points * 2)
y_dense_pred = neural_net.sim(x_dense.reshape(x_dense.size,1)).reshape(x_dense.size)
plt.figure()
plt.plot(x_dense, y_dense_pred, '-', x, y, '.', x, y_pred, 'p')
plt.title('Actual vs predicted')
plt.show()

Como resultado de los comandos anteriores, puede observar los gráficos como se muestra a continuación:

En este capítulo, aprenderá en detalle sobre los conceptos de aprendizaje por refuerzo en IA con Python.

Conceptos básicos del aprendizaje por refuerzo

Este tipo de aprendizaje se utiliza para reforzar o fortalecer la red en base a información crítica. Es decir, una red que está siendo entrenada bajo aprendizaje reforzado, recibe alguna retroalimentación del entorno. Sin embargo, la retroalimentación es evaluativa y no instructiva como en el caso del aprendizaje supervisado. Con base en esta retroalimentación, la red realiza los ajustes de los pesos para obtener una mejor información crítica en el futuro.

Este proceso de aprendizaje es similar al aprendizaje supervisado, pero es posible que tengamos muy menos información. La siguiente figura muestra el diagrama de bloques del aprendizaje por refuerzo:

Bloques de construcción: entorno y agente

El entorno y el agente son los componentes principales del aprendizaje por refuerzo en la IA. Esta sección los analiza en detalle:

Agente

Un agente es cualquier cosa que pueda percibir su entorno a través de sensores y actúa sobre ese entorno a través de efectores.

  • UN human agent tiene órganos sensoriales como ojos, oídos, nariz, lengua y piel paralelos a los sensores, y otros órganos como manos, piernas, boca, para efectores.

  • UN robotic agent reemplaza cámaras y telémetros infrarrojos para los sensores, y varios motores y actuadores para los efectores.

  • UN software agent tiene cadenas de bits codificadas como sus programas y acciones.

Terminología del agente

Los siguientes términos se utilizan con más frecuencia en el aprendizaje por refuerzo en IA:

  • Performance Measure of Agent - Es el criterio, que determina el éxito de un agente.

  • Behavior of Agent - Es la acción que realiza el agente después de una determinada secuencia de percepciones.

  • Percept - Son las entradas perceptivas del agente en una instancia determinada.

  • Percept Sequence - Es el historial de todo lo que un agente ha percibido hasta la fecha.

  • Agent Function - Es un mapa de la secuencia de precepto a una acción.

Medio ambiente

Algunos programas operan en un artificial environment confinado a la entrada de teclado, base de datos, sistemas de archivos de computadora y salida de caracteres en una pantalla.

En contraste, algunos agentes de software, como robots de software o softbots, existen en dominios de softbot ricos e ilimitados. El simulador tiene unvery detailedy complex environment. El agente de software debe elegir entre una amplia gama de acciones en tiempo real.

Por ejemplo, un softbot diseñado para escanear las preferencias en línea del cliente y mostrar elementos interesantes al cliente funciona en el real así como un artificial medio ambiente.

Propiedades del medio ambiente

El medio ambiente tiene múltiples propiedades como se analiza a continuación:

  • Discrete/Continuous- Si hay un número limitado de estados del entorno distintos y claramente definidos, el entorno es discreto, de lo contrario, es continuo. Por ejemplo, el ajedrez es un entorno discreto y la conducción es un entorno continuo.

  • Observable/Partially Observable- Si es posible determinar el estado completo del medio ambiente en cada momento a partir de las percepciones, es observable; de lo contrario, es sólo parcialmente observable.

  • Static/Dynamic- Si el entorno no cambia mientras un agente está actuando, entonces es estático; de lo contrario, es dinámico.

  • Single agent/Multiple agents - El medio ambiente puede contener otros agentes que pueden ser del mismo o diferente tipo que el del agente.

  • Accessible/Inaccessible- Si el aparato sensorial del agente puede tener acceso al estado completo del ambiente, entonces el ambiente es accesible para ese agente; de lo contrario, es inaccesible.

  • Deterministic/Non-deterministic- Si el siguiente estado del entorno está completamente determinado por el estado actual y las acciones del agente, entonces el entorno es determinista; de lo contrario, no es determinista.

  • Episodic/Non-episodic- En un entorno episódico, cada episodio consiste en que el agente percibe y luego actúa. La calidad de su acción depende solo del episodio en sí. Los episodios posteriores no dependen de las acciones de los episodios anteriores. Los entornos episódicos son mucho más simples porque el agente no necesita pensar en el futuro.

Construyendo un entorno con Python

Para construir un agente de aprendizaje reforzado, usaremos el OpenAI Gym paquete que se puede instalar con la ayuda del siguiente comando:

pip install gym

Hay varios entornos en el gimnasio OpenAI que se pueden utilizar para diversos fines. Pocos de ellos sonCartpole-v0, Hopper-v1y MsPacman-v0. Requieren diferentes motores. La documentación detallada deOpenAI Gym se puede encontrar en https://gym.openai.com/docs/#environments.

El siguiente código muestra un ejemplo de código Python para el entorno cartpole-v0:

import gym
env = gym.make('CartPole-v0')
env.reset()
for _ in range(1000):
   env.render()
   env.step(env.action_space.sample())

Puede construir otros entornos de forma similar.

Construyendo un agente de aprendizaje con Python

Para construir un agente de aprendizaje reforzado, usaremos el OpenAI Gym paquete como se muestra -

import gym
env = gym.make('CartPole-v0')
for _ in range(20):
   observation = env.reset()
   for i in range(100):
      env.render()
      print(observation)
      action = env.action_space.sample()
      observation, reward, done, info = env.step(action)
      if done:
         print("Episode finished after {} timesteps".format(i+1))
         break

Observe que el mástil puede equilibrarse.

Este capítulo analiza en detalle los algoritmos genéticos de la IA.

¿Qué son los algoritmos genéticos?

Los algoritmos genéticos (GA) son algoritmos basados ​​en búsquedas que se basan en los conceptos de selección natural y genética. Los GA son un subconjunto de una rama mucho más grande de la computación conocida como Computación Evolutiva.

Los GA fueron desarrollados por John Holland y sus estudiantes y colegas de la Universidad de Michigan, sobre todo David E. Goldberg. Desde entonces, se ha probado en varios problemas de optimización con un alto grado de éxito.

En los GA, tenemos un conjunto de posibles soluciones al problema dado. Estas soluciones luego se someten a recombinación y mutación (como en la genética natural), producen nuevos hijos y el proceso se repite durante varias generaciones. A cada individuo (o solución candidata) se le asigna un valor de aptitud (basado en su valor de función objetivo) y los individuos más en forma tienen una mayor probabilidad de aparearse y cederfitterindividuos. Esto está en consonancia con la teoría darwiniana deSurvival of the Fittest.

Por lo tanto, mantiene evolving mejores individuos o soluciones a lo largo de generaciones, hasta que alcanza un criterio de parada.

Los algoritmos genéticos son de naturaleza lo suficientemente aleatoria, pero funcionan mucho mejor que la búsqueda local aleatoria (donde solo probamos soluciones aleatorias, realizando un seguimiento de las mejores hasta ahora), ya que también explotan información histórica.

¿Cómo utilizar GA para problemas de optimización?

La optimización es una acción para hacer que el diseño, la situación, el recurso y el sistema sean lo más efectivos posible. El siguiente diagrama de bloques muestra el proceso de optimización:

Etapas del mecanismo GA para el proceso de optimización

La siguiente es una secuencia de pasos del mecanismo GA cuando se usa para optimizar problemas.

  • Paso 1: Genere la población inicial al azar.

  • Paso 2: seleccione la solución inicial con los mejores valores de aptitud.

  • Paso 3: vuelva a combinar las soluciones seleccionadas utilizando operadores de mutación y cruce.

  • Paso 4: inserta una descendencia en la población.

  • Paso 5: ahora, si se cumple la condición de parada, devuelva la solución con su mejor valor de aptitud. De lo contrario, vaya al paso 2.

Instalación de paquetes necesarios

Para resolver el problema mediante el uso de algoritmos genéticos en Python, vamos a utilizar un paquete poderoso para GA llamado DEAP. Es una biblioteca de un marco informático evolutivo novedoso para la creación rápida de prototipos y la prueba de ideas. Podemos instalar este paquete con la ayuda del siguiente comando en el símbolo del sistema:

pip install deap

Si esta usando anaconda entorno, luego se puede usar el siguiente comando para instalar deap:

conda install -c conda-forge deap

Implementación de soluciones utilizando algoritmos genéticos

Esta sección le explica la implementación de soluciones usando algoritmos genéticos.

Generando patrones de bits

El siguiente ejemplo le muestra cómo generar una cadena de bits que contendría 15 unidades, según el One Max problema.

Importe los paquetes necesarios como se muestra:

import random
from deap import base, creator, tools

Defina la función de evaluación. Es el primer paso para crear un algoritmo genético.

def eval_func(individual):
   target_sum = 15
   return len(individual) - abs(sum(individual) - target_sum),

Ahora, cree la caja de herramientas con los parámetros correctos:

def create_toolbox(num_bits):
   creator.create("FitnessMax", base.Fitness, weights=(1.0,))
   creator.create("Individual", list, fitness=creator.FitnessMax)

Inicializar la caja de herramientas

toolbox = base.Toolbox()
toolbox.register("attr_bool", random.randint, 0, 1)
toolbox.register("individual", tools.initRepeat, creator.Individual,
   toolbox.attr_bool, num_bits)
toolbox.register("population", tools.initRepeat, list, toolbox.individual)

Registrar el operador de evaluación -

toolbox.register("evaluate", eval_func)

Ahora, registre el operador de cruce -

toolbox.register("mate", tools.cxTwoPoint)

Registrar un operador de mutación -

toolbox.register("mutate", tools.mutFlipBit, indpb = 0.05)

Definir el operador para la cría -

toolbox.register("select", tools.selTournament, tournsize = 3)
return toolbox
if __name__ == "__main__":
   num_bits = 45
   toolbox = create_toolbox(num_bits)
   random.seed(7)
   population = toolbox.population(n = 500)
   probab_crossing, probab_mutating = 0.5, 0.2
   num_generations = 10
   print('\nEvolution process starts')

Evaluar a toda la población -

fitnesses = list(map(toolbox.evaluate, population))
for ind, fit in zip(population, fitnesses):
   ind.fitness.values = fit
print('\nEvaluated', len(population), 'individuals')

Crea e itera a través de generaciones -

for g in range(num_generations):
   print("\n- Generation", g)

Selección de las personas de la próxima generación:

offspring = toolbox.select(population, len(population))

Ahora, clone los individuos seleccionados -

offspring = list(map(toolbox.clone, offspring))

Aplicar crossover y mutación en la descendencia -

for child1, child2 in zip(offspring[::2], offspring[1::2]):
   if random.random() < probab_crossing:
   toolbox.mate(child1, child2)

Eliminar el valor de aptitud del niño

del child1.fitness.values
del child2.fitness.values

Ahora, aplique la mutación -

for mutant in offspring:
   if random.random() < probab_mutating:
   toolbox.mutate(mutant)
   del mutant.fitness.values

Evaluar a las personas con una aptitud no válida.

invalid_ind = [ind for ind in offspring if not ind.fitness.valid]
fitnesses = map(toolbox.evaluate, invalid_ind)
for ind, fit in zip(invalid_ind, fitnesses):
   ind.fitness.values = fit
print('Evaluated', len(invalid_ind), 'individuals')

Ahora, reemplace la población con el individuo de la próxima generación:

population[:] = offspring

Imprima las estadísticas de las generaciones actuales -

fits = [ind.fitness.values[0] for ind in population]
length = len(population)
mean = sum(fits) / length
sum2 = sum(x*x for x in fits)
std = abs(sum2 / length - mean**2)**0.5
print('Min =', min(fits), ', Max =', max(fits))
print('Average =', round(mean, 2), ', Standard deviation =',
round(std, 2))
print("\n- Evolution ends")

Imprima el resultado final -

best_ind = tools.selBest(population, 1)[0]
   print('\nBest individual:\n', best_ind)
   print('\nNumber of ones:', sum(best_ind))
Following would be the output:
Evolution process starts
Evaluated 500 individuals
- Generation 0
Evaluated 295 individuals
Min = 32.0 , Max = 45.0
Average = 40.29 , Standard deviation = 2.61
- Generation 1
Evaluated 292 individuals
Min = 34.0 , Max = 45.0
Average = 42.35 , Standard deviation = 1.91
- Generation 2
Evaluated 277 individuals
Min = 37.0 , Max = 45.0
Average = 43.39 , Standard deviation = 1.46
… … … …
- Generation 9
Evaluated 299 individuals
Min = 40.0 , Max = 45.0
Average = 44.12 , Standard deviation = 1.11
- Evolution ends
Best individual:
[0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0, 1, 
 1, 0, 0, 0, 1, 0, 0, 0, 1, 1, 0, 0, 0, 1, 0, 0, 0,
 1, 0, 0, 1, 1, 1, 0, 0, 1, 0, 1]
Number of ones: 15

Problema de regresión de símbolos

Es uno de los problemas más conocidos de la programación genética. Todos los problemas de regresión simbólica utilizan una distribución de datos arbitraria e intentan ajustar los datos más precisos con una fórmula simbólica. Por lo general, se usa una medida como el RMSE (error cuadrático medio) para medir la aptitud de un individuo. Es un problema clásico de regresor y aquí estamos usando la ecuación5x3-6x2+8x=1. Necesitamos seguir todos los pasos como se indica en el ejemplo anterior, pero la parte principal sería crear los conjuntos primitivos porque son los componentes básicos de los individuos para que pueda comenzar la evaluación. Aquí usaremos el conjunto clásico de primitivas.

El siguiente código de Python explica esto en detalle:

import operator
import math
import random
import numpy as np
from deap import algorithms, base, creator, tools, gp
def division_operator(numerator, denominator):
   if denominator == 0:
      return 1
   return numerator / denominator
def eval_func(individual, points):
   func = toolbox.compile(expr=individual)
   return math.fsum(mse) / len(points),
def create_toolbox():
   pset = gp.PrimitiveSet("MAIN", 1)
   pset.addPrimitive(operator.add, 2)
   pset.addPrimitive(operator.sub, 2)
   pset.addPrimitive(operator.mul, 2)
   pset.addPrimitive(division_operator, 2)
   pset.addPrimitive(operator.neg, 1)
   pset.addPrimitive(math.cos, 1)
   pset.addPrimitive(math.sin, 1)
   pset.addEphemeralConstant("rand101", lambda: random.randint(-1,1))
   pset.renameArguments(ARG0 = 'x')
   creator.create("FitnessMin", base.Fitness, weights = (-1.0,))
   creator.create("Individual",gp.PrimitiveTree,fitness=creator.FitnessMin)
   toolbox = base.Toolbox()
   toolbox.register("expr", gp.genHalfAndHalf, pset=pset, min_=1, max_=2)
   toolbox.expr)
   toolbox.register("population",tools.initRepeat,list, toolbox.individual)
   toolbox.register("compile", gp.compile, pset = pset)
   toolbox.register("evaluate", eval_func, points = [x/10. for x in range(-10,10)])
   toolbox.register("select", tools.selTournament, tournsize = 3)
   toolbox.register("mate", gp.cxOnePoint)
   toolbox.register("expr_mut", gp.genFull, min_=0, max_=2)
   toolbox.register("mutate", gp.mutUniform, expr = toolbox.expr_mut, pset = pset)
   toolbox.decorate("mate", gp.staticLimit(key = operator.attrgetter("height"), max_value = 17))
   toolbox.decorate("mutate", gp.staticLimit(key = operator.attrgetter("height"), max_value = 17))
   return toolbox
if __name__ == "__main__":
   random.seed(7)
   toolbox = create_toolbox()
   population = toolbox.population(n = 450)
   hall_of_fame = tools.HallOfFame(1)
   stats_fit = tools.Statistics(lambda x: x.fitness.values)
   stats_size = tools.Statistics(len)
   mstats = tools.MultiStatistics(fitness=stats_fit, size = stats_size)
   mstats.register("avg", np.mean)
   mstats.register("std", np.std)
   mstats.register("min", np.min)
   mstats.register("max", np.max)
   probab_crossover = 0.4
   probab_mutate = 0.2
   number_gen = 10
   population, log = algorithms.eaSimple(population, toolbox,
      probab_crossover, probab_mutate, number_gen,
      stats = mstats, halloffame = hall_of_fame, verbose = True)

Tenga en cuenta que todos los pasos básicos son los mismos que se utilizan al generar patrones de bits. Este programa nos dará la salida como min, max, std (desviación estándar) después de 10 generaciones.

La visión por computadora se ocupa de modelar y replicar la visión humana utilizando software y hardware de computadora. En este capítulo, aprenderá en detalle sobre esto.

Visión por computador

La visión por computadora es una disciplina que estudia cómo reconstruir, interrumpir y comprender una escena 3d a partir de sus imágenes 2d, en términos de las propiedades de la estructura presente en la escena.

Jerarquía de visión artificial

La visión por computadora se divide en tres categorías básicas de la siguiente manera:

  • Low-level vision - Incluye imagen de proceso para extracción de características.

  • Intermediate-level vision - Incluye reconocimiento de objetos e interpretación de escenas en 3D

  • High-level vision - Incluye descripción conceptual de una escena como actividad, intención y comportamiento.

Visión por computadora Vs Procesamiento de imágenes

El procesamiento de imágenes estudia la transformación de imagen a imagen. La entrada y la salida del procesamiento de imágenes son imágenes.

La visión por computadora es la construcción de descripciones explícitas y significativas de objetos físicos a partir de su imagen. El resultado de la visión por computadora es una descripción o una interpretación de estructuras en una escena 3D.

Aplicaciones

La visión por computadora encuentra aplicaciones en los siguientes campos:

Robotics

  • Localización: determinar la ubicación del robot automáticamente

  • Navigation

  • Evitación de obstáculos

  • Montaje (clavija en agujero, soldadura, pintura)

  • Manipulación (por ejemplo, manipulador de robot PUMA)

  • Interacción de robot humano (HRI): robótica inteligente para interactuar y servir a las personas

Medicine

  • Clasificación y detección (por ejemplo, clasificación de lesiones o células y detección de tumores)

  • Segmentación 2D / 3D

  • Reconstrucción de órganos humanos en 3D (resonancia magnética o ultrasonido)

  • Cirugía robótica guiada por visión

Security

  • Biometría (iris, huellas dactilares, reconocimiento facial)
  • Vigilancia: detección de determinadas actividades o comportamientos sospechosos

Transportation

  • Vehículo autónomo
  • Seguridad, por ejemplo, vigilancia de la vigilancia del conductor

Industrial Automation Application

  • Inspección industrial (detección de defectos)
  • Assembly
  • Lectura de códigos de barras y etiquetas de paquetes
  • Clasificación de objetos
  • Comprensión de documentos (por ejemplo, OCR)

Instalación de paquetes útiles

Para la visión por computadora con Python, puede usar una biblioteca popular llamada OpenCV(Visión por computadora de código abierto). Es una biblioteca de funciones de programación orientada principalmente a la visión por computadora en tiempo real. Está escrito en C ++ y su interfaz principal está en C ++. Puede instalar este paquete con la ayuda del siguiente comando:

pip install opencv_python-X.X-cp36-cp36m-winX.whl

Aquí X representa la versión de Python instalada en su máquina, así como el win32 o 64 bit que tiene.

Si está utilizando el anaconda entorno, luego use el siguiente comando para instalar OpenCV -

conda install -c conda-forge opencv

Leer, escribir y mostrar una imagen

La mayoría de las aplicaciones de CV necesitan obtener las imágenes como entrada y producirlas como salida. En esta sección, aprenderá a leer y escribir archivos de imagen con la ayuda de las funciones proporcionadas por OpenCV.

Funciones OpenCV para leer, mostrar y escribir un archivo de imagen

OpenCV proporciona las siguientes funciones para este propósito:

  • imread() function- Esta es la función para leer una imagen. OpenCV imread () admite varios formatos de imagen como PNG, JPEG, JPG, TIFF, etc.

  • imshow() function- Esta es la función para mostrar una imagen en una ventana. La ventana se ajusta automáticamente al tamaño de la imagen. OpenCV imshow () admite varios formatos de imagen como PNG, JPEG, JPG, TIFF, etc.

  • imwrite() function- Esta es la función para escribir una imagen. OpenCV imwrite () admite varios formatos de imagen como PNG, JPEG, JPG, TIFF, etc.

Ejemplo

Este ejemplo muestra el código Python para leer una imagen en un formato: mostrarla en una ventana y escribir la misma imagen en otro formato. Considere los pasos que se muestran a continuación:

Importe el paquete OpenCV como se muestra -

import cv2

Ahora, para leer una imagen en particular, use la función imread () -

image = cv2.imread('image_flower.jpg')

Para mostrar la imagen, use el imshow()función. El nombre de la ventana en la que puede ver la imagen seríaimage_flower.

cv2.imshow('image_flower',image)
cv2.destroyAllwindows()

Ahora, podemos escribir la misma imagen en el otro formato, digamos .png usando la función imwrite () -

cv2.imwrite('image_flower.png',image)

El resultado True significa que la imagen se ha escrito correctamente como archivo .png también en la misma carpeta.

True

Nota: la función destroyallWindows () simplemente destruye todas las ventanas que creamos.

Conversión de espacio de color

En OpenCV, las imágenes no se almacenan utilizando el color RGB convencional, sino que se almacenan en orden inverso, es decir, en el orden BGR. Por lo tanto, el código de color predeterminado al leer una imagen es BGR. loscvtColor() función de conversión de color para convertir la imagen de un código de color a otro.

Ejemplo

Considere este ejemplo para convertir una imagen de BGR a escala de grises.

Importar el OpenCV paquete como se muestra -

import cv2

Ahora, para leer una imagen en particular, use la función imread () -

image = cv2.imread('image_flower.jpg')

Ahora, si vemos esta imagen usando imshow() función, entonces podemos ver que esta imagen está en BGR.

cv2.imshow('BGR_Penguins',image)

Ahora usa cvtColor() función para convertir esta imagen a escala de grises.

image = cv2.cvtColor(image,cv2.COLOR_BGR2GRAY)
cv2.imshow('gray_penguins',image)

Detección de bordes

Los humanos, después de ver un boceto aproximado, pueden reconocer fácilmente muchos tipos de objetos y sus poses. Es por eso que los bordes juegan un papel importante en la vida de los humanos, así como en las aplicaciones de la visión por computadora. OpenCV proporciona una función muy simple y útil llamadaCanny()para detectar los bordes.

Ejemplo

El siguiente ejemplo muestra una clara identificación de los bordes.

Importe el paquete OpenCV como se muestra -

import cv2
import numpy as np

Ahora, para leer una imagen en particular, use el imread() función.

image = cv2.imread('Penguins.jpg')

Ahora, usa el Canny () función para detectar los bordes de la imagen ya leída.

cv2.imwrite(‘edges_Penguins.jpg’,cv2.Canny(image,200,300))

Ahora, para mostrar la imagen con bordes, use la función imshow ().

cv2.imshow(‘edges’, cv2.imread(‘‘edges_Penguins.jpg’))

Este programa de Python creará una imagen llamada edges_penguins.jpg con detección de bordes.

Detección de rostro

La detección de rostros es una de las fascinantes aplicaciones de la visión por computadora que la hace más realista y futurista. OpenCV tiene una función incorporada para realizar la detección de rostros. Vamos a utilizar elHaar clasificador en cascada para la detección de rostros.

Datos de Haar Cascade

Necesitamos datos para usar el clasificador en cascada de Haar. Puede encontrar estos datos en nuestro paquete OpenCV. Después de instalar OpenCv, puede ver el nombre de la carpetahaarcascades. Habría archivos .xml para diferentes aplicaciones. Ahora, cópielos todos para diferentes usos y péguelos en una nueva carpeta debajo del proyecto actual.

Example

El siguiente es el código Python que usa Haar Cascade para detectar el rostro de Amitabh Bachan que se muestra en la siguiente imagen:

Importar el OpenCV paquete como se muestra -

import cv2
import numpy as np

Ahora, usa el HaarCascadeClassifier para detectar la cara -

face_detection=
cv2.CascadeClassifier('D:/ProgramData/cascadeclassifier/
haarcascade_frontalface_default.xml')

Ahora, para leer una imagen en particular, use el imread() función -

img = cv2.imread('AB.jpg')

Ahora, conviértalo a escala de grises porque aceptaría imágenes grises.

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

Ahora, usando face_detection.detectMultiScale, realizar detección de rostros real

faces = face_detection.detectMultiScale(gray, 1.3, 5)

Ahora, dibuja un rectángulo alrededor de toda la cara.

for (x,y,w,h) in faces:
   img = cv2.rectangle(img,(x,y),(x+w, y+h),(255,0,0),3)
cv2.imwrite('Face_AB.jpg',img)

Este programa de Python creará una imagen llamada Face_AB.jpg con detección de rostros como se muestra

Detección de ojos

La detección de ojos es otra aplicación fascinante de la visión por computadora que la hace más realista y futurista. OpenCV tiene una función incorporada para realizar la detección de ojos. Vamos a utilizar elHaar cascade clasificador para la detección de ojos.

Ejemplo

El siguiente ejemplo muestra el código Python usando Haar Cascade para detectar el rostro de Amitabh Bachan que se muestra en la siguiente imagen:

Importe el paquete OpenCV como se muestra -

import cv2
import numpy as np

Ahora, usa el HaarCascadeClassifier para detectar la cara -

eye_cascade = cv2.CascadeClassifier('D:/ProgramData/cascadeclassifier/haarcascade_eye.xml')

Ahora, para leer una imagen en particular, use el imread() función

img = cv2.imread('AB_Eye.jpg')

Ahora, conviértalo a escala de grises porque aceptaría imágenes grises.

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

Ahora con la ayuda de eye_cascade.detectMultiScale, realizar detección de rostros real

eyes = eye_cascade.detectMultiScale(gray, 1.03, 5)

Ahora, dibuja un rectángulo alrededor de toda la cara.

for (ex,ey,ew,eh) in eyes:
   img = cv2.rectangle(img,(ex,ey),(ex+ew, ey+eh),(0,255,0),2)
cv2.imwrite('Eye_AB.jpg',img)

Este programa de Python creará una imagen llamada Eye_AB.jpg con detección de ojos como se muestra -

Artificial Neural Network (ANN) es un sistema informático eficiente, cuyo tema central se toma prestado de la analogía de las redes neuronales biológicas. Las redes neuronales son un tipo de modelo para el aprendizaje automático. A mediados de la década de 1980 y principios de la de 1990, se realizaron avances arquitectónicos muy importantes en las redes neuronales. En este capítulo, aprenderá más sobre Deep Learning, un enfoque de IA.

El aprendizaje profundo surgió del explosivo crecimiento computacional de una década como un competidor serio en el campo. Por lo tanto, el aprendizaje profundo es un tipo particular de aprendizaje automático cuyos algoritmos se inspiran en la estructura y función del cerebro humano.

Aprendizaje automático frente a aprendizaje profundo

El aprendizaje profundo es la técnica de aprendizaje automático más poderosa en estos días. Es tan poderoso porque aprenden la mejor manera de representar el problema mientras aprenden cómo resolverlo. A continuación, se muestra una comparación de aprendizaje profundo y aprendizaje automático:

Dependencia de datos

El primer punto de diferencia se basa en el rendimiento de DL y ML cuando aumenta la escala de datos. Cuando los datos son grandes, los algoritmos de aprendizaje profundo funcionan muy bien.

Dependencia de la máquina

Los algoritmos de aprendizaje profundo necesitan máquinas de alta gama para funcionar perfectamente. Por otro lado, los algoritmos de aprendizaje automático también pueden funcionar en máquinas de gama baja.

Extracción de características

Los algoritmos de aprendizaje profundo pueden extraer características de alto nivel e intentar aprender de las mismas también. Por otro lado, se requiere un experto para identificar la mayoría de las características extraídas por el aprendizaje automático.

Momento de ejecución

El tiempo de ejecución depende de los numerosos parámetros utilizados en un algoritmo. El aprendizaje profundo tiene más parámetros que los algoritmos de aprendizaje automático. Por lo tanto, el tiempo de ejecución de los algoritmos DL, especialmente el tiempo de entrenamiento, es mucho más que los algoritmos ML. Pero el tiempo de prueba de los algoritmos DL es menor que el de los algoritmos ML.

Enfoque para la resolución de problemas

El aprendizaje profundo resuelve el problema de principio a fin, mientras que el aprendizaje automático utiliza la forma tradicional de resolver el problema, es decir, dividiéndolo en partes.

Red neuronal convolucional (CNN)

Las redes neuronales convolucionales son las mismas que las redes neuronales ordinarias porque también están formadas por neuronas que tienen pesos y sesgos que se pueden aprender. Las redes neuronales ordinarias ignoran la estructura de los datos de entrada y todos los datos se convierten en una matriz 1-D antes de introducirlos en la red. Este proceso se adapta a los datos normales, sin embargo, si los datos contienen imágenes, el proceso puede resultar engorroso.

CNN resuelve este problema fácilmente. Tiene en cuenta la estructura 2D de las imágenes cuando las procesa, lo que les permite extraer las propiedades específicas de las imágenes. De esta forma, el objetivo principal de las CNN es pasar de los datos de imagen sin procesar en la capa de entrada a la clase correcta en la capa de salida. La única diferencia entre un NN ordinario y un CNN está en el tratamiento de los datos de entrada y en el tipo de capas.

Descripción general de la arquitectura de las CNN

Arquitectónicamente, las redes neuronales ordinarias reciben una entrada y la transforman a través de una serie de capas ocultas. Cada capa está conectada a la otra capa con la ayuda de neuronas. La principal desventaja de las redes neuronales ordinarias es que no escalan bien a imágenes completas.

La arquitectura de las CNN tiene neuronas dispuestas en 3 dimensiones llamadas ancho, alto y profundidad. Cada neurona de la capa actual está conectada a un pequeño parche de la salida de la capa anterior. Es similar a superponer un×filtrar en la imagen de entrada. UsaMfiltros para asegurarse de obtener todos los detalles. EstasM Los filtros son extractores de características que extraen características como bordes, esquinas, etc.

Capas utilizadas para construir CNN

Las siguientes capas se utilizan para construir CNN:

  • Input Layer - Toma los datos de la imagen sin procesar tal como están.

  • Convolutional Layer- Esta capa es el componente básico de las CNN que realiza la mayoría de los cálculos. Esta capa calcula las convoluciones entre las neuronas y los diversos parches en la entrada.

  • Rectified Linear Unit Layer- Aplica una función de activación a la salida de la capa anterior. Agrega no linealidad a la red para que se pueda generalizar bien a cualquier tipo de función.

  • Pooling Layer- La agrupación nos ayuda a mantener solo las partes importantes a medida que avanzamos en la red. La capa de agrupación funciona de forma independiente en cada segmento de profundidad de la entrada y la redimensiona espacialmente. Utiliza la función MAX.

  • Fully Connected layer/Output layer - Esta capa calcula las puntuaciones de salida en la última capa. La salida resultante es del tamaño×× , donde L es el número de clases del conjunto de datos de entrenamiento.

Instalación de paquetes útiles de Python

Puedes usar Keras, que es una API de redes neuronales de alto nivel, escrita en Python y capaz de ejecutarse sobre TensorFlow, CNTK o Theno. Es compatible con Python 2.7-3.6. Puede obtener más información al respecto enhttps://keras.io/.

Utilice los siguientes comandos para instalar keras:

pip install keras

En conda entorno, puede utilizar el siguiente comando:

conda install –c conda-forge keras

Construyendo un regresor lineal usando ANN

En esta sección, aprenderá a construir un regresor lineal utilizando redes neuronales artificiales. Puedes usarKerasRegressorlograr esto. En este ejemplo, estamos usando el conjunto de datos de precios de la vivienda de Boston con 13 números para propiedades en Boston. El código Python para el mismo se muestra aquí:

Importe todos los paquetes necesarios como se muestra:

import numpy
import pandas
from keras.models import Sequential
from keras.layers import Dense
from keras.wrappers.scikit_learn import KerasRegressor
from sklearn.model_selection import cross_val_score
from sklearn.model_selection import KFold

Ahora, cargue nuestro conjunto de datos que está guardado en el directorio local.

dataframe = pandas.read_csv("/Usrrs/admin/data.csv", delim_whitespace = True, header = None)
dataset = dataframe.values

Ahora, divida los datos en variables de entrada y salida, es decir, X e Y -

X = dataset[:,0:13]
Y = dataset[:,13]

Dado que usamos redes neuronales de referencia, defina el modelo:

def baseline_model():

Ahora, cree el modelo de la siguiente manera:

model_regressor = Sequential()
model_regressor.add(Dense(13, input_dim = 13, kernel_initializer = 'normal', 
   activation = 'relu'))
model_regressor.add(Dense(1, kernel_initializer = 'normal'))

A continuación, compile el modelo:

model_regressor.compile(loss='mean_squared_error', optimizer='adam')
return model_regressor

Ahora, corrija la semilla aleatoria para la reproducibilidad de la siguiente manera:

seed = 7
numpy.random.seed(seed)

El objeto contenedor de Keras para su uso en scikit-learn como se llama estimador de regresión KerasRegressor. En esta sección, evaluaremos este modelo con un conjunto de datos estandarizados.

estimator = KerasRegressor(build_fn = baseline_model, nb_epoch = 100, batch_size = 5, verbose = 0)
kfold = KFold(n_splits = 10, random_state = seed)
baseline_result = cross_val_score(estimator, X, Y, cv = kfold)
print("Baseline: %.2f (%.2f) MSE" % (Baseline_result.mean(),Baseline_result.std()))

La salida del código que se muestra arriba sería la estimación del rendimiento del modelo en el problema para los datos invisibles. Será el error cuadrático medio, incluido el promedio y la desviación estándar en los 10 pliegues de la evaluación de validación cruzada.

Clasificador de imágenes: una aplicación de aprendizaje profundo

Las redes neuronales convolucionales (CNN) resuelven un problema de clasificación de imágenes, es decir, a qué clase pertenece la imagen de entrada. Puede utilizar la biblioteca de aprendizaje profundo de Keras. Tenga en cuenta que estamos utilizando el conjunto de datos de entrenamiento y prueba de imágenes de gatos y perros del siguiente enlacehttps://www.kaggle.com/c/dogs-vs-cats/data.

Importe las bibliotecas y paquetes importantes de keras como se muestra:

El siguiente paquete llamado secuencial inicializará las redes neuronales como red secuencial.

from keras.models import Sequential

El siguiente paquete llamado Conv2D se utiliza para realizar la operación de convolución, el primer paso de CNN.

from keras.layers import Conv2D

El siguiente paquete llamado MaxPoling2D se utiliza para realizar la operación de agrupación, el segundo paso de CNN.

from keras.layers import MaxPooling2D

El siguiente paquete llamado Flatten es el proceso de convertir todas las matrices 2D resultantes en un solo vector lineal largo continuo.

from keras.layers import Flatten

El siguiente paquete llamado Dense se utiliza para realizar la conexión completa de la red neuronal, el cuarto paso de CNN.

from keras.layers import Dense

Ahora, cree un objeto de la clase secuencial.

S_classifier = Sequential()

Ahora, el siguiente paso es codificar la parte de convolución.

S_classifier.add(Conv2D(32, (3, 3), input_shape = (64, 64, 3), activation = 'relu'))

aquí relu es la función rectificadora.

Ahora, el siguiente paso de CNN es la operación de agrupación en los mapas de características resultantes después de la parte de convolución.

S-classifier.add(MaxPooling2D(pool_size = (2, 2)))

Ahora, convierta todas las imágenes agrupadas en un vector continuo utilizando halagador:

S_classifier.add(Flatten())

A continuación, cree una capa completamente conectada.

S_classifier.add(Dense(units = 128, activation = 'relu'))

Aquí, 128 es el número de unidades ocultas. Es una práctica común definir el número de unidades ocultas como la potencia de 2.

Ahora, inicialice la capa de salida de la siguiente manera:

S_classifier.add(Dense(units = 1, activation = 'sigmoid'))

Ahora, compile la CNN, hemos construido ...

S_classifier.compile(optimizer = 'adam', loss = 'binary_crossentropy', metrics = ['accuracy'])

Aquí, el parámetro del optimizador es elegir el algoritmo de descenso de gradiente estocástico, el parámetro de pérdida es elegir la función de pérdida y el parámetro de métrica es elegir la métrica de rendimiento.

Ahora, realice aumentos de imagen y luego ajuste las imágenes a las redes neuronales:

train_datagen = ImageDataGenerator(rescale = 1./255,shear_range = 0.2,
zoom_range = 0.2,
horizontal_flip = True)
test_datagen = ImageDataGenerator(rescale = 1./255)

training_set = 
   train_datagen.flow_from_directory(”/Users/admin/training_set”,target_size = 
      (64, 64),batch_size = 32,class_mode = 'binary')

test_set = 
   test_datagen.flow_from_directory('test_set',target_size = 
      (64, 64),batch_size = 32,class_mode = 'binary')

Ahora, ajuste los datos al modelo que hemos creado:

classifier.fit_generator(training_set,steps_per_epoch = 8000,epochs = 
25,validation_data = test_set,validation_steps = 2000)

Aquí, steps_per_epoch tiene el número de imágenes de entrenamiento.

Ahora que el modelo ha sido entrenado, podemos usarlo para la predicción de la siguiente manera:

from keras.preprocessing import image

test_image = image.load_img('dataset/single_prediction/cat_or_dog_1.jpg', 
target_size = (64, 64))

test_image = image.img_to_array(test_image)

test_image = np.expand_dims(test_image, axis = 0)

result = classifier.predict(test_image)

training_set.class_indices

if result[0][0] == 1:
prediction = 'dog'

else:
   prediction = 'cat'