AI avec Python - Guide rapide

Depuis l'invention des ordinateurs ou des machines, leur capacité à effectuer diverses tâches a connu une croissance exponentielle. Les humains ont développé la puissance des systèmes informatiques en termes de domaines de travail variés, de leur vitesse croissante et de leur taille réduite par rapport au temps.

Une branche de l'informatique appelée Intelligence Artificielle poursuit la création d'ordinateurs ou de machines aussi intelligents que les êtres humains.

Concept de base de l'intelligence artificielle (IA)

Selon le père de l'intelligence artificielle, John McCarthy, il s'agit de «la science et l'ingénierie de la fabrication de machines intelligentes, en particulier de programmes informatiques intelligents».

L'intelligence artificielle est un moyen de faire penser intelligemment un ordinateur, un robot commandé par ordinateur ou un logiciel, de la même manière que pensent les humains intelligents. L'IA est accomplie en étudiant comment le cerveau humain pense et comment les humains apprennent, décident et travaillent tout en essayant de résoudre un problème, puis en utilisant les résultats de cette étude comme base de développement de logiciels et de systèmes intelligents.

Tout en exploitant la puissance des systèmes informatiques, la curiosité de l'humain, l'amène à se demander: «Une machine peut-elle penser et se comporter comme les humains?»

Ainsi, le développement de l'IA a commencé avec l'intention de créer une intelligence similaire dans des machines que nous trouvons et considérons comme élevées chez les humains.

La nécessité d'apprendre l'IA

Comme nous le savons, l'IA cherche à créer des machines aussi intelligentes que les êtres humains. Il existe de nombreuses raisons pour lesquelles nous étudions l'IA. Les raisons sont les suivantes -

L'IA peut apprendre grâce aux données

Dans notre vie quotidienne, nous traitons d'énormes quantités de données et le cerveau humain ne peut pas suivre autant de données. C'est pourquoi nous devons automatiser les choses. Pour faire de l'automatisation, nous devons étudier l'IA car elle peut apprendre des données et effectuer les tâches répétitives avec précision et sans fatigue.

L'IA peut s'instruire

Il est très nécessaire qu'un système s'enseigne lui-même car les données elles-mêmes ne cessent de changer et les connaissances qui en découlent doivent être constamment mises à jour. Nous pouvons utiliser l'IA pour atteindre cet objectif, car un système activé par l'IA peut apprendre par lui-même.

L'IA peut répondre en temps réel

L'intelligence artificielle à l'aide de réseaux de neurones peut analyser les données plus en profondeur. Grâce à cette capacité, l'IA peut penser et répondre aux situations qui sont basées sur les conditions en temps réel.

L'IA atteint la précision

Avec l'aide de réseaux de neurones profonds, l'IA peut atteindre une précision incroyable. L'IA aide dans le domaine de la médecine à diagnostiquer des maladies telles que le cancer à partir des IRM des patients.

L'IA peut organiser les données pour en tirer le meilleur parti

Les données sont la propriété intellectuelle des systèmes qui utilisent des algorithmes d'auto-apprentissage. Nous avons besoin de l'IA pour indexer et organiser les données de manière à toujours donner les meilleurs résultats.

Comprendre l'intelligence

Avec l'IA, des systèmes intelligents peuvent être construits. Nous devons comprendre le concept d'intelligence afin que notre cerveau puisse construire un autre système d'intelligence comme lui.

Qu'est-ce que l'intelligence?

La capacité d'un système à calculer, raisonner, percevoir les relations et les analogies, apprendre de l'expérience, stocker et récupérer des informations de la mémoire, résoudre des problèmes, comprendre des idées complexes, utiliser couramment le langage naturel, classer, généraliser et adapter de nouvelles situations.

Types d'intelligence

Comme le décrit Howard Gardner, un psychologue américain du développement, l'intelligence se présente sous plusieurs formes -

Sr.Non Intelligence et description Exemple
1

Linguistic intelligence

La capacité de parler, de reconnaître et d'utiliser des mécanismes de phonologie (sons de la parole), de syntaxe (grammaire) et de sémantique (sens).

Narrateurs, orateurs
2

Musical intelligence

La capacité de créer, de communiquer avec et de comprendre les significations du son, la compréhension de la hauteur, du rythme.

Musiciens, chanteurs, compositeurs
3

Logical-mathematical intelligence

La capacité d'utiliser et de comprendre les relations en l'absence d'action ou d'objets. C'est aussi la capacité de comprendre des idées complexes et abstraites.

Mathématiciens, scientifiques
4

Spatial intelligence

La capacité de percevoir des informations visuelles ou spatiales, de les modifier et de recréer des images visuelles sans référence aux objets, de construire des images 3D et de les déplacer et de les faire pivoter.

Lecteurs de cartes, astronautes, physiciens
5

Bodily-Kinesthetic intelligence

La capacité d'utiliser tout ou partie du corps pour résoudre des problèmes ou des produits de mode, contrôler la motricité fine et grossière et manipuler les objets.

Joueurs, danseurs
6

Intra-personal intelligence

La capacité de distinguer ses propres sentiments, intentions et motivations.

Gautam Buddhha
sept

Interpersonal intelligence

La capacité de reconnaître et de faire des distinctions entre les sentiments, les croyances et les intentions des autres.

Communicateurs de masse, enquêteurs

Vous pouvez dire qu'une machine ou un système est artificiellement intelligent lorsqu'il est équipé d'au moins une ou de toutes les intelligences.

De quoi est composée l'intelligence?

L'intelligence est intangible. Il est composé de -

  • Reasoning
  • Learning
  • Résolution de problème
  • Perception
  • Intelligence Linguistique

Passons brièvement en revue tous les composants -

Raisonnement

C'est l'ensemble des processus qui nous permettent de fournir une base de jugement, de prise de décisions et de prédiction. Il existe en gros deux types -

Raisonnement inductif Raisonnement déductif
Il conduit des observations spécifiques pour faire des déclarations générales générales. Il commence par une déclaration générale et examine les possibilités de parvenir à une conclusion logique et spécifique.
Même si toutes les prémisses sont vraies dans une déclaration, le raisonnement inductif permet à la conclusion d'être fausse. Si quelque chose est vrai pour une classe de choses en général, c'est également vrai pour tous les membres de cette classe.
Example - "Nita est une enseignante. Nita est studieuse. Par conséquent, tous les professeurs sont studieux." Example - "Toutes les femmes de plus de 60 ans sont des grand-mères. Shalini a 65 ans. Par conséquent, Shalini est une grand-mère."

Apprentissage - l

La capacité d'apprentissage est possédée par les humains, certaines espèces d'animaux et les systèmes activés par l'IA. L'apprentissage est classé comme suit -

Apprentissage auditif

C'est apprendre en écoutant et en entendant. Par exemple, des étudiants écoutant des conférences audio enregistrées.

Apprentissage épisodique

Apprendre en se remémorant des séquences d'événements dont on a été témoin ou vécu. Ceci est linéaire et ordonné.

Apprentissage moteur

C'est l'apprentissage par un mouvement précis des muscles. Par exemple, choisir des objets, écrire, etc.

L'apprentissage par observation

Apprendre en regardant et en imitant les autres. Par exemple, l'enfant essaie d'apprendre en imitant son parent.

Apprentissage perceptif

C'est apprendre à reconnaître les stimuli que l'on a vus auparavant. Par exemple, identifier et classer des objets et des situations.

Apprentissage relationnel

Il s'agit d'apprendre à différencier les différents stimuli sur la base de propriétés relationnelles, plutôt que de propriétés absolues. Par exemple, ajouter «un peu moins» de sel au moment de la cuisson des pommes de terre qui sont montées salées la dernière fois, lorsqu'elles sont cuites en ajoutant, disons, une cuillère à soupe de sel.

  • Spatial Learning - C'est l'apprentissage grâce à des stimuli visuels tels que des images, des couleurs, des cartes, etc. Par exemple, une personne peut créer une feuille de route à l'esprit avant de suivre réellement la route.

  • Stimulus-Response Learning- C'est apprendre à exécuter un comportement particulier lorsqu'un certain stimulus est présent. Par exemple, un chien lève l'oreille en entendant la sonnette.

Résolution de problème

C'est le processus dans lequel on perçoit et essaie d'arriver à une solution désirée à partir d'une situation présente en empruntant un chemin, qui est bloqué par des obstacles connus ou inconnus.

La résolution de problèmes comprend également decision making, qui est le processus de sélection de la meilleure alternative appropriée parmi plusieurs alternatives pour atteindre l'objectif souhaité.

la perception

C'est le processus d'acquisition, d'interprétation, de sélection et d'organisation des informations sensorielles.

La perception présume sensing. Chez l'homme, la perception est facilitée par les organes sensoriels. Dans le domaine de l'IA, le mécanisme de perception rassemble de manière significative les données acquises par les capteurs.

Intelligence Linguistique

C'est la capacité d'une personne à utiliser, comprendre, parler et écrire la langue verbale et écrite. C'est important dans la communication interpersonnelle.

Ce qui est impliqué dans l'IA

L'intelligence artificielle est un vaste domaine d'étude. Ce domaine d'étude aide à trouver des solutions aux problèmes du monde réel.

Voyons maintenant les différents domaines d'études au sein de l'IA -

Apprentissage automatique

C'est l'un des domaines les plus populaires de l'IA. Le concept de base de ce champ est de faire l'apprentissage automatique à partir de données comme les êtres humains peuvent apprendre de leur expérience. Il contient des modèles d'apprentissage sur la base desquels les prédictions peuvent être faites sur des données inconnues.

Logique

C'est un autre domaine d'étude important dans lequel la logique mathématique est utilisée pour exécuter les programmes informatiques. Il contient des règles et des faits pour effectuer des correspondances de modèles, des analyses sémantiques, etc.

Recherche

Ce domaine d'étude est essentiellement utilisé dans des jeux comme les échecs, le tic-tac-toe. Les algorithmes de recherche donnent la solution optimale après avoir recherché tout l'espace de recherche.

Réseaux de neurones artificiels

Il s'agit d'un réseau de systèmes informatiques performants dont le thème central est emprunté à l'analogie des réseaux de neurones biologiques. ANN peut être utilisé en robotique, reconnaissance vocale, traitement vocal, etc.

Algorithme génétique

Les algorithmes génétiques aident à résoudre les problèmes à l'aide de plus d'un programme. Le résultat serait basé sur la sélection du plus apte.

Représentation des connaissances

C'est le domaine d'étude à l'aide duquel nous pouvons représenter les faits d'une manière la machine qui soit compréhensible par la machine. La connaissance la plus efficace est représentée; plus le système serait intelligent.

Application de l'IA

Dans cette section, nous verrons les différents champs pris en charge par l'IA -

Jeux

L'IA joue un rôle crucial dans les jeux stratégiques tels que les échecs, le poker, le tic-tac-toe, etc., où la machine peut penser à un grand nombre de positions possibles en fonction de la connaissance heuristique.

Traitement du langage naturel

Il est possible d'interagir avec l'ordinateur qui comprend le langage naturel parlé par les humains.

Systèmes experts

Il existe des applications qui intègrent la machine, le logiciel et des informations spéciales pour donner du raisonnement et des conseils. Ils fournissent des explications et des conseils aux utilisateurs.

Systèmes de vision

Ces systèmes comprennent, interprètent et comprennent les entrées visuelles sur l'ordinateur. Par exemple,

  • Un avion d'espionnage prend des photographies, qui sont utilisées pour comprendre des informations spatiales ou une carte des zones.

  • Les médecins utilisent un système expert clinique pour diagnostiquer le patient.

  • La police utilise un logiciel informatique qui peut reconnaître le visage du criminel avec le portrait enregistré réalisé par un artiste médico-légal.

Reconnaissance de la parole

Certains systèmes intelligents sont capables d'entendre et de comprendre la langue en termes de phrases et de leurs significations pendant qu'un humain lui parle. Il peut gérer différents accents, mots d'argot, bruit en arrière-plan, changement du bruit humain dû au froid, etc.

Reconnaissance de l'écriture manuscrite

Le logiciel de reconnaissance de l'écriture manuscrite lit le texte écrit sur papier avec un stylo ou à l'écran avec un stylet. Il peut reconnaître les formes des lettres et les convertir en texte modifiable.

Robots intelligents

Les robots sont capables d'exécuter les tâches données par un humain. Ils ont des capteurs pour détecter les données physiques du monde réel telles que la lumière, la chaleur, la température, le mouvement, le son, les chocs et la pression. Ils ont des processeurs efficaces, plusieurs capteurs et une énorme mémoire, pour faire preuve d'intelligence. De plus, ils sont capables d'apprendre de leurs erreurs et ils peuvent s'adapter au nouvel environnement.

Modélisation cognitive: simulation de la procédure de la pensée humaine

La modélisation cognitive est fondamentalement le domaine d'étude de l'informatique qui traite de l'étude et de la simulation du processus de pensée des êtres humains. La tâche principale de l'IA est de faire en sorte que la machine pense comme un humain. La caractéristique la plus importante du processus de pensée humaine est la résolution de problèmes. C'est pourquoi la modélisation plus ou moins cognitive tente de comprendre comment les humains peuvent résoudre les problèmes. Après cela, ce modèle peut être utilisé pour diverses applications d'IA telles que l'apprentissage automatique, la robotique, le traitement du langage naturel, etc. Voici le diagramme des différents niveaux de pensée du cerveau humain -

Agent et environnement

Dans cette section, nous nous concentrerons sur l'agent et l'environnement et comment ceux-ci contribuent à l'intelligence artificielle.

Agent

Un agent est tout ce qui peut percevoir son environnement à travers des capteurs et agit sur cet environnement à travers des effecteurs.

  • UNE human agent a des organes sensoriels tels que les yeux, les oreilles, le nez, la langue et la peau parallèles aux capteurs, et d'autres organes tels que les mains, les jambes, la bouche, pour les effecteurs.

  • UNE robotic agent remplace les caméras et les télémètres infrarouges pour les capteurs, ainsi que divers moteurs et actionneurs pour les effecteurs.

  • UNE software agent a encodé des chaînes de bits comme programmes et actions.

Environnement

Certains programmes fonctionnent de manière entièrement artificial environment limité à l'entrée au clavier, la base de données, les systèmes de fichiers informatiques et la sortie de caractères sur un écran.

En revanche, certains agents logiciels (robots logiciels ou softbots) existent dans des domaines de softbots riches et illimités. Le simulateur a unvery detailed, complex environment. L'agent logiciel doit choisir parmi un large éventail d'actions en temps réel. Un softbot est conçu pour scanner les préférences en ligne du client et montre les éléments intéressants au client fonctionne dans lereal ainsi qu'un artificial environnement.

Dans ce chapitre, nous allons apprendre comment démarrer avec Python. Nous comprendrons également comment Python aide à l'intelligence artificielle.

Pourquoi Python pour l'IA

L'intelligence artificielle est considérée comme la technologie de pointe du futur. Il y a déjà un certain nombre d'applications qui y sont faites. Pour cette raison, de nombreuses entreprises et chercheurs s'y intéressent. Mais la principale question qui se pose ici est la suivante: dans quel langage de programmation ces applications d'IA peuvent-elles être développées? Il existe divers langages de programmation comme Lisp, Prolog, C ++, Java et Python, qui peuvent être utilisés pour développer des applications d'IA. Parmi eux, le langage de programmation Python gagne une énorme popularité et les raisons sont les suivantes -

Syntaxe simple et moins de codage

Python implique très moins de codage et de syntaxe simple parmi d'autres langages de programmation qui peuvent être utilisés pour développer des applications d'IA. Grâce à cette fonctionnalité, les tests peuvent être plus faciles et nous pouvons nous concentrer davantage sur la programmation.

Bibliothèques intégrées pour les projets IA

Un avantage majeur de l'utilisation de Python pour l'IA est qu'il est livré avec des bibliothèques intégrées. Python a des bibliothèques pour presque tous les types de projets d'IA. Par exemple,NumPy, SciPy, matplotlib, nltk, SimpleAI sont quelques-unes des bibliothèques intégrées importantes de Python.

  • Open source- Python est un langage de programmation open source. Cela le rend très populaire dans la communauté.

  • Can be used for broad range of programming- Python peut être utilisé pour un large éventail de tâches de programmation comme le petit script shell vers les applications Web d'entreprise. C'est une autre raison pour laquelle Python convient aux projets d'IA.

Caractéristiques de Python

Python est un langage de script de haut niveau, interprété, interactif et orienté objet. Python est conçu pour être hautement lisible. Il utilise fréquemment des mots-clés anglais alors que d'autres langues utilisent la ponctuation, et il a moins de constructions syntaxiques que les autres langues. Les fonctionnalités de Python incluent les suivantes -

  • Easy-to-learn- Python a peu de mots-clés, une structure simple et une syntaxe clairement définie. Cela permet à l'étudiant de comprendre rapidement la langue.

  • Easy-to-read - Le code Python est plus clairement défini et visible aux yeux.

  • Easy-to-maintain - Le code source de Python est assez facile à maintenir.

  • A broad standard library - La majeure partie de la bibliothèque de Python est très portable et compatible multiplateforme sous UNIX, Windows et Macintosh.

  • Interactive Mode - Python prend en charge un mode interactif qui permet des tests interactifs et le débogage d'extraits de code.

  • Portable - Python peut fonctionner sur une grande variété de plates-formes matérielles et a la même interface sur toutes les plates-formes.

  • Extendable- Nous pouvons ajouter des modules de bas niveau à l'interpréteur Python. Ces modules permettent aux programmeurs d'ajouter ou de personnaliser leurs outils pour être plus efficaces.

  • Databases - Python fournit des interfaces à toutes les principales bases de données commerciales.

  • GUI Programming - Python prend en charge les applications GUI qui peuvent être créées et portées vers de nombreux appels système, bibliothèques et systèmes Windows, tels que Windows MFC, Macintosh et le système X Window d'Unix.

  • Scalable - Python fournit une meilleure structure et un meilleur support pour les grands programmes que les scripts shell.

Fonctionnalités importantes de Python

Considérons maintenant les fonctionnalités importantes suivantes de Python -

  • Il prend en charge les méthodes de programmation fonctionnelles et structurées ainsi que la POO.

  • Il peut être utilisé comme langage de script ou peut être compilé en byte-code pour créer de grandes applications.

  • Il fournit des types de données dynamiques de très haut niveau et prend en charge la vérification de type dynamique.

  • Il prend en charge le garbage collection automatique.

  • Il peut être facilement intégré avec C, C ++, COM, ActiveX, CORBA et Java.

Installer Python

La distribution Python est disponible pour un grand nombre de plates-formes. Vous devez télécharger uniquement le code binaire applicable à votre plateforme et installer Python.

Si le code binaire de votre plateforme n'est pas disponible, vous avez besoin d'un compilateur C pour compiler le code source manuellement. La compilation du code source offre plus de flexibilité en termes de choix des fonctionnalités dont vous avez besoin dans votre installation.

Voici un bref aperçu de l'installation de Python sur différentes plates-formes -

Installation Unix et Linux

Suivez ces étapes pour installer Python sur une machine Unix / Linux.

  • Ouvrez un navigateur Web et accédez à https://www.python.org/downloads

  • Suivez le lien pour télécharger le code source compressé disponible pour Unix / Linux.

  • Téléchargez et extrayez des fichiers.

  • Modification du fichier Modules / Setup si vous souhaitez personnaliser certaines options.

  • exécuter le script ./configure

  • make

  • faire installer

Cela installe Python à l'emplacement standard / usr / local / bin et ses bibliothèques dans / usr / local / lib / pythonXX où XX est la version de Python.

Installation de Windows

Suivez ces étapes pour installer Python sur une machine Windows.

  • Ouvrez un navigateur Web et accédez à https://www.python.org/downloads

  • Suivez le lien pour le fichier .msi du programme d' installation de Windows python-XYZ où XYZ est la version que vous devez installer.

  • Pour utiliser ce programme d'installation python-XYZ .msi, le système Windows doit prendre en charge Microsoft Installer 2.0. Enregistrez le fichier du programme d'installation sur votre ordinateur local, puis exécutez-le pour savoir si votre ordinateur prend en charge MSI.

  • Exécutez le fichier téléchargé. Cela fait apparaître l'assistant d'installation Python, qui est vraiment facile à utiliser. Acceptez simplement les paramètres par défaut et attendez que l'installation soit terminée.

Installation sur Macintosh

Si vous utilisez Mac OS X, il est recommandé d'utiliser Homebrew pour installer Python 3. C'est un excellent programme d'installation pour Mac OS X et il est vraiment facile à utiliser. Si vous n'avez pas Homebrew, vous pouvez l'installer à l'aide de la commande suivante -

$ ruby -e "$(curl -fsSL
https://raw.githubusercontent.com/Homebrew/install/master/install)"

Nous pouvons mettre à jour le gestionnaire de paquets avec la commande ci-dessous -

$ brew update

Maintenant, exécutez la commande suivante pour installer Python3 sur votre système -

$ brew install python3

Configurer PATH

Les programmes et autres fichiers exécutables peuvent se trouver dans de nombreux répertoires, de sorte que les systèmes d'exploitation fournissent un chemin de recherche qui répertorie les répertoires dans lesquels le système d'exploitation recherche les exécutables.

Le chemin est stocké dans une variable d'environnement, qui est une chaîne nommée gérée par le système d'exploitation. Cette variable contient des informations disponibles pour le shell de commande et d'autres programmes.

La variable path est nommée PATH sous Unix ou Path sous Windows (Unix est sensible à la casse; Windows ne l'est pas).

Sous Mac OS, le programme d'installation gère les détails du chemin. Pour appeler l'interpréteur Python à partir d'un répertoire particulier, vous devez ajouter le répertoire Python à votre chemin.

Définition du chemin sous Unix / Linux

Pour ajouter le répertoire Python au chemin d'une session particulière sous Unix -

  • Dans le shell csh

    Type setenv PATH "$PATH:/usr/local/bin/python" et appuyez sur Enter.

  • Dans le shell bash (Linux)

    Type export ATH = "$PATH:/usr/local/bin/python" et appuyez sur Enter.

  • Dans le shell sh ou ksh

    Type PATH = "$PATH:/usr/local/bin/python" et appuyez sur Enter.

Note - / usr / local / bin / python est le chemin du répertoire Python.

Définition du chemin sous Windows

Pour ajouter le répertoire Python au chemin d'une session particulière dans Windows -

  • At the command prompt - type path %path%;C:\Python et appuyez sur Enter.

Note - C: \ Python est le chemin du répertoire Python.

Exécuter Python

Voyons maintenant les différentes manières d'exécuter Python. Les moyens sont décrits ci-dessous -

Interprète interactif

Nous pouvons démarrer Python depuis Unix, DOS ou tout autre système qui vous fournit un interpréteur de ligne de commande ou une fenêtre shell.

  • Entrer python sur la ligne de commande.

  • Commencez immédiatement à coder dans l'interpréteur interactif.

$python # Unix/Linux

ou

python% # Unix/Linux

ou

C:> python # Windows/DOS

Voici la liste de toutes les options de ligne de commande disponibles -

S.No. Option et description
1

-d

Il fournit une sortie de débogage.

2

-o

Il génère un bytecode optimisé (résultant en des fichiers .pyo).

3

-S

N'exécutez pas le site d'importation pour rechercher les chemins Python au démarrage.

4

-v

Sortie verbeuse (trace détaillée sur les instructions d'importation).

5

-x

Désactive les exceptions intégrées basées sur les classes (utilisez simplement des chaînes); obsolète à partir de la version 1.6.

6

-c cmd

Exécute le script Python envoyé sous forme de chaîne cmd.

sept

File

Exécutez le script Python à partir du fichier donné.

Script depuis la ligne de commande

Un script Python peut être exécuté sur la ligne de commande en appelant l'interpréteur sur votre application, comme dans ce qui suit -

$python script.py # Unix/Linux

ou,

python% script.py # Unix/Linux

ou,

C:> python script.py # Windows/DOS

Note - Assurez-vous que le mode d'autorisation de fichier permet l'exécution.

Environnement de développement intégré

Vous pouvez également exécuter Python à partir d'un environnement d'interface utilisateur graphique (GUI), si vous avez une application GUI sur votre système qui prend en charge Python.

  • Unix - IDLE est le tout premier IDE Unix pour Python.

  • Windows - PythonWin est la première interface Windows pour Python et est un IDE avec une interface graphique.

  • Macintosh - La version Macintosh de Python avec l'IDE IDLE est disponible sur le site principal, téléchargeable sous forme de fichiers MacBinary ou BinHex'd.

Si vous ne parvenez pas à configurer correctement l'environnement, vous pouvez demander l'aide de votre administrateur système. Assurez-vous que l'environnement Python est correctement configuré et fonctionne parfaitement.

Nous pouvons également utiliser une autre plateforme Python appelée Anaconda. Il comprend des centaines de packages de science des données populaires et le package conda et le gestionnaire d'environnement virtuel pour Windows, Linux et MacOS. Vous pouvez le télécharger selon votre système d'exploitation à partir du lienhttps://www.anaconda.com/download/.

Pour ce tutoriel, nous utilisons la version Python 3.6.3 sur MS Windows.

L'apprentissage signifie l'acquisition de connaissances ou de compétences par l'étude ou l'expérience. Sur cette base, nous pouvons définir l'apprentissage automatique (ML) comme suit -

Il peut être défini comme le domaine de l'informatique, plus précisément une application de l'intelligence artificielle, qui offre aux systèmes informatiques la capacité d'apprendre avec des données et de s'améliorer par expérience sans être explicitement programmés.

Fondamentalement, l'objectif principal de l'apprentissage automatique est de permettre aux ordinateurs d'apprendre automatiquement sans intervention humaine. Maintenant, la question se pose de savoir comment un tel apprentissage peut être lancé et réalisé? Il peut être démarré avec les observations de données. Les données peuvent être des exemples, des instructions ou des expériences directes. Ensuite, sur la base de cette entrée, la machine prend une meilleure décision en recherchant des modèles dans les données.

Types d'apprentissage automatique (ML)

Les algorithmes d'apprentissage automatique aident le système informatique à apprendre sans être explicitement programmé. Ces algorithmes sont classés en supervisé ou non supervisé. Voyons maintenant quelques algorithmes -

Algorithmes d'apprentissage automatique supervisés

Il s'agit de l'algorithme d'apprentissage automatique le plus couramment utilisé. On l'appelle supervisé parce que le processus d'apprentissage de l'algorithme à partir de l'ensemble de données de formation peut être considéré comme un enseignant supervisant le processus d'apprentissage. Dans ce type d'algorithme ML, les résultats possibles sont déjà connus et les données d'entraînement sont également étiquetées avec des réponses correctes. Il peut être compris comme suit -

Supposons que nous ayons des variables d'entrée x et une variable de sortie y et nous avons appliqué un algorithme pour apprendre la fonction de mappage de l'entrée à la sortie telle que -

Y = f(x)

Maintenant, l'objectif principal est d'approximer si bien la fonction de mappage que lorsque nous avons de nouvelles données d'entrée (x), nous pouvons prédire la variable de sortie (Y) pour ces données.

Les problèmes d'inclinaison principalement supervisés peuvent être divisés en deux types de problèmes:

  • Classification - Un problème est appelé problème de classification lorsque nous avons des résultats catégorisés tels que «noir», «enseignement», «non-enseignement», etc.

  • Regression - Un problème est appelé problème de régression lorsque nous avons la sortie de valeur réelle telle que «distance», «kilogramme», etc.

Arbre de décision, forêt aléatoire, knn, régression logistique sont les exemples d'algorithmes d'apprentissage automatique supervisé.

Algorithmes d'apprentissage automatique non supervisés

Comme son nom l'indique, ces types d'algorithmes d'apprentissage automatique n'ont pas de superviseur pour fournir des conseils. C'est pourquoi les algorithmes d'apprentissage automatique non supervisés sont étroitement alignés sur ce que certains appellent la véritable intelligence artificielle. Il peut être compris comme suit -

Supposons que nous ayons la variable d'entrée x, alors il n'y aura pas de variables de sortie correspondantes comme c'est le cas dans les algorithmes d'apprentissage supervisé.

En termes simples, nous pouvons dire que dans l'apprentissage non supervisé, il n'y aura pas de réponse correcte ni d'enseignant pour les guider. Les algorithmes aident à découvrir des modèles intéressants dans les données.

Les problèmes d'apprentissage non supervisés peuvent être divisés en deux types de problèmes:

  • Clustering- Dans les problèmes de clustering, nous devons découvrir les regroupements inhérents aux données. Par exemple, regrouper les clients selon leur comportement d'achat.

  • Association- Un problème est appelé problème d'association car ce type de problème nécessite de découvrir les règles qui décrivent de grandes parties de nos données. Par exemple, trouver les clients qui achètent les deuxx et y.

K-means pour le clustering, l'algorithme Apriori pour l'association sont des exemples d'algorithmes d'apprentissage automatique non supervisés.

Algorithmes d'apprentissage automatique par renforcement

Ces types d'algorithmes d'apprentissage automatique sont très peu utilisés. Ces algorithmes entraînent les systèmes à prendre des décisions spécifiques. Fondamentalement, la machine est exposée à un environnement où elle s'entraîne continuellement en utilisant la méthode des essais et des erreurs. Ces algorithmes apprennent de l'expérience passée et essaient de capturer les meilleures connaissances possibles pour prendre des décisions précises. Le processus de décision de Markov est un exemple d'algorithmes d'apprentissage automatique par renforcement.

Algorithmes d'apprentissage automatique les plus courants

Dans cette section, nous découvrirons les algorithmes d'apprentissage automatique les plus courants. Les algorithmes sont décrits ci-dessous -

Régression linéaire

C'est l'un des algorithmes les plus connus en matière de statistiques et d'apprentissage automatique.

Concept de base - La régression principalement linéaire est un modèle linéaire qui suppose une relation linéaire entre les variables d'entrée dites x et la variable de sortie unique, dites y. En d'autres termes, nous pouvons dire que y peut être calculé à partir d'une combinaison linéaire des variables d'entrée x. La relation entre les variables peut être établie en ajustant une meilleure ligne.

Types de régression linéaire

La régression linéaire est des deux types suivants -

  • Simple linear regression - Un algorithme de régression linéaire est appelé régression linéaire simple s'il n'a qu'une seule variable indépendante.

  • Multiple linear regression - Un algorithme de régression linéaire est appelé régression linéaire multiple s'il comporte plus d'une variable indépendante.

La régression linéaire est principalement utilisée pour estimer les valeurs réelles basées sur des variables continues. Par exemple, la vente totale d'une boutique en une journée, basée sur des valeurs réelles, peut être estimée par régression linéaire.

Régression logistique

C'est un algorithme de classification et également connu sous le nom de logit régression.

La régression principalement logistique est un algorithme de classification utilisé pour estimer les valeurs discrètes telles que 0 ou 1, vrai ou faux, oui ou non en fonction d'un ensemble donné de variables indépendantes. Fondamentalement, il prédit la probabilité, par conséquent, sa sortie se situe entre 0 et 1.

Arbre de décision

L'arbre de décision est un algorithme d'apprentissage supervisé qui est principalement utilisé pour les problèmes de classification.

Fondamentalement, il s'agit d'un classificateur exprimé sous forme de partition récursive basée sur les variables indépendantes. L'arbre de décision a des nœuds qui forment l'arbre enraciné. L'arbre enraciné est un arbre dirigé avec un nœud appelé «racine». La racine n'a aucun bord entrant et tous les autres nœuds ont un bord entrant. Ces nœuds sont appelés feuilles ou nœuds de décision. Par exemple, considérez l'arbre de décision suivant pour voir si une personne est apte ou non.

Machine à vecteurs de soutien (SVM)

Il est utilisé pour les problèmes de classification et de régression. Mais il est principalement utilisé pour des problèmes de classification. Le concept principal de SVM est de tracer chaque élément de données comme un point dans un espace à n dimensions, la valeur de chaque entité étant la valeur d'une coordonnée particulière. Ici n seraient les fonctionnalités que nous aurions. Voici une représentation graphique simple pour comprendre le concept de SVM -

Dans le diagramme ci-dessus, nous avons deux caractéristiques, nous devons donc d'abord tracer ces deux variables dans un espace bidimensionnel où chaque point a deux coordonnées, appelées vecteurs de support. La ligne divise les données en deux groupes classés différents. Cette ligne serait le classificateur.

Bayes naïves

C'est aussi une technique de classification. La logique derrière cette technique de classification est d'utiliser le théorème de Bayes pour construire des classificateurs. L'hypothèse est que les prédicteurs sont indépendants. En termes simples, cela suppose que la présence d'une fonctionnalité particulière dans une classe n'est pas liée à la présence d'une autre fonctionnalité. Voici l'équation du théorème de Bayes -

$$ P \ left (\ frac {A} {B} \ right) = \ frac {P \ left (\ frac {B} {A} \ right) P \ left (A \ right)} {P \ left ( B \ droite)} $$

Le modèle Naïve Bayes est facile à construire et particulièrement utile pour les grands ensembles de données.

K-voisins les plus proches (KNN)

Il est utilisé à la fois pour la classification et la régression des problèmes. Il est largement utilisé pour résoudre les problèmes de classification. Le concept principal de cet algorithme est qu'il permet de stocker tous les cas disponibles et de classer les nouveaux cas par votes majoritaires de ses k voisins. Le cas étant alors assigné à la classe qui est la plus courante parmi ses K voisins les plus proches, mesurée par une fonction de distance. La fonction de distance peut être la distance euclidienne, Minkowski et Hamming. Considérez ce qui suit pour utiliser KNN -

  • Sur le plan informatique, les KNN sont coûteux que les autres algorithmes utilisés pour les problèmes de classification.

  • La normalisation des variables nécessaires sinon des variables de gamme plus élevée peut la biaiser.

  • Dans KNN, nous devons travailler sur une étape de prétraitement comme la suppression du bruit.

Clustering K-Means

Comme son nom l'indique, il est utilisé pour résoudre les problèmes de clustering. Il s'agit essentiellement d'un type d'apprentissage non supervisé. La logique principale de l'algorithme de clustering K-Means est de classer l'ensemble de données à travers un certain nombre de clusters. Suivez ces étapes pour former des clusters par K-means -

  • K-means choisit k nombre de points pour chaque cluster connu sous le nom de centroïdes.

  • Désormais, chaque point de données forme un cluster avec les centroïdes les plus proches, c'est-à-dire k clusters.

  • Maintenant, il trouvera les centres de gravité de chaque cluster en fonction des membres du cluster existants.

  • Nous devons répéter ces étapes jusqu'à ce que la convergence se produise.

Forêt aléatoire

C'est un algorithme de classification supervisé. L'avantage de l'algorithme de forêt aléatoire est qu'il peut être utilisé à la fois pour des problèmes de classification et de régression. Fondamentalement, c'est la collection d'arbres de décision (c'est-à-dire la forêt) ou vous pouvez dire l'ensemble des arbres de décision. Le concept de base de la forêt aléatoire est que chaque arbre donne une classification et la forêt choisit les meilleures classifications parmi eux. Voici les avantages de l'algorithme Random Forest -

  • Le classificateur de forêt aléatoire peut être utilisé pour les tâches de classification et de régression.

  • Ils peuvent gérer les valeurs manquantes.

  • Cela ne conviendra pas au modèle même si nous avons plus d'arbres dans la forêt.

Nous avons déjà étudié les algorithmes d'apprentissage automatique supervisés et non supervisés. Ces algorithmes nécessitent des données formatées pour démarrer le processus de formation. Nous devons préparer ou formater les données d'une certaine manière afin qu'elles puissent être fournies en tant qu'entrée d'algorithmes de ML.

Ce chapitre se concentre sur la préparation des données pour les algorithmes d'apprentissage automatique.

Prétraitement des données

Dans notre vie quotidienne, nous traitons beaucoup de données mais ces données sont sous forme brute. Pour fournir les données en tant qu'entrée d'algorithmes d'apprentissage automatique, nous devons les convertir en données significatives. C'est là que le prétraitement des données entre en scène. En d'autres termes simples, nous pouvons dire qu'avant de fournir les données aux algorithmes d'apprentissage automatique, nous devons prétraiter les données.

Étapes de prétraitement des données

Suivez ces étapes pour prétraiter les données en Python -

Step 1 − Importing the useful packages - Si nous utilisons Python, ce serait la première étape pour convertir les données dans un certain format, c'est-à-dire le prétraitement. Cela peut être fait comme suit -

import numpy as np
import sklearn.preprocessing

Ici, nous avons utilisé les deux packages suivants -

  • NumPy - Fondamentalement, NumPy est un package de traitement de tableau à usage général conçu pour manipuler efficacement de grands tableaux multidimensionnels d'enregistrements arbitraires sans sacrifier trop de vitesse pour de petits tableaux multidimensionnels.

  • Sklearn.preprocessing - Ce package fournit de nombreuses fonctions utilitaires et classes de transformateur communes pour changer les vecteurs de caractéristiques bruts en une représentation plus adaptée aux algorithmes d'apprentissage automatique.

Step 2 − Defining sample data - Après avoir importé les packages, nous devons définir des exemples de données afin de pouvoir appliquer des techniques de prétraitement à ces données. Nous allons maintenant définir les exemples de données suivants -

input_data = np.array([2.1, -1.9, 5.5],
                      [-1.5, 2.4, 3.5],
                      [0.5, -7.9, 5.6],
                      [5.9, 2.3, -5.8])

Step3 − Applying preprocessing technique - Dans cette étape, nous devons appliquer l'une des techniques de prétraitement.

La section suivante décrit les techniques de prétraitement des données.

Techniques de prétraitement des données

Les techniques de prétraitement des données sont décrites ci-dessous -

Binarisation

C'est la technique de prétraitement qui est utilisée lorsque nous devons convertir nos valeurs numériques en valeurs booléennes. Nous pouvons utiliser une méthode intégrée pour binariser les données d'entrée, par exemple en utilisant 0,5 comme valeur de seuil de la manière suivante -

data_binarized = preprocessing.Binarizer(threshold = 0.5).transform(input_data)
print("\nBinarized data:\n", data_binarized)

Maintenant, après avoir exécuté le code ci-dessus, nous obtiendrons la sortie suivante, toutes les valeurs supérieures à 0,5 (valeur de seuil) seraient converties en 1 et toutes les valeurs inférieures à 0,5 seraient converties en 0.

Binarized data

[[ 1. 0. 1.]
[ 0. 1. 1.]
[ 0. 0. 1.]
[ 1. 1. 0.]]

Élimination moyenne

Il s'agit d'une autre technique de prétraitement très courante utilisée dans l'apprentissage automatique. Fondamentalement, il est utilisé pour éliminer la moyenne du vecteur d'entités de sorte que chaque entité soit centrée sur zéro. Nous pouvons également supprimer le biais des entités dans le vecteur de caractéristiques. Pour appliquer la technique de prétraitement de suppression moyenne sur les exemples de données, nous pouvons écrire le code Python ci-dessous. Le code affichera la moyenne et l'écart type des données d'entrée -

print("Mean = ", input_data.mean(axis = 0))
print("Std deviation = ", input_data.std(axis = 0))

Nous obtiendrons la sortie suivante après avoir exécuté les lignes de code ci-dessus -

Mean = [ 1.75       -1.275       2.2]
Std deviation = [ 2.71431391  4.20022321  4.69414529]

Maintenant, le code ci-dessous supprimera la moyenne et l'écart type des données d'entrée -

data_scaled = preprocessing.scale(input_data)
print("Mean =", data_scaled.mean(axis=0))
print("Std deviation =", data_scaled.std(axis = 0))

Nous obtiendrons la sortie suivante après avoir exécuté les lignes de code ci-dessus -

Mean = [ 1.11022302e-16 0.00000000e+00 0.00000000e+00]
Std deviation = [ 1.             1.             1.]

Mise à l'échelle

Il s'agit d'une autre technique de prétraitement des données utilisée pour mettre à l'échelle les vecteurs de caractéristiques. La mise à l'échelle des vecteurs d'entités est nécessaire car les valeurs de chaque entité peuvent varier entre de nombreuses valeurs aléatoires. En d'autres termes, nous pouvons dire que la mise à l'échelle est importante car nous ne voulons pas qu'une fonctionnalité soit synthétiquement grande ou petite. Avec l'aide du code Python suivant, nous pouvons faire la mise à l'échelle de nos données d'entrée, c'est-à-dire, vecteur de caractéristiques -

# Min max scaling

data_scaler_minmax = preprocessing.MinMaxScaler(feature_range=(0,1))
data_scaled_minmax = data_scaler_minmax.fit_transform(input_data)
print ("\nMin max scaled data:\n", data_scaled_minmax)

Nous obtiendrons la sortie suivante après avoir exécuté les lignes de code ci-dessus -

Min max scaled data

[ [ 0.48648649  0.58252427   0.99122807]
[   0.          1.           0.81578947]
[   0.27027027  0.           1.        ]
[   1.          0. 99029126  0.        ]]

Normalisation

C'est une autre technique de prétraitement des données qui est utilisée pour modifier les vecteurs de caractéristiques. Un tel type de modification est nécessaire pour mesurer les vecteurs de caractéristiques à une échelle commune. Les éléments suivants sont deux types de normalisation qui peuvent être utilisés dans l'apprentissage automatique -

L1 Normalization

Il est également appelé Least Absolute Deviations. Ce type de normalisation modifie les valeurs de sorte que la somme des valeurs absolues soit toujours jusqu'à 1 dans chaque ligne. Il peut être implémenté sur les données d'entrée à l'aide du code Python suivant -

# Normalize data
data_normalized_l1 = preprocessing.normalize(input_data, norm = 'l1')
print("\nL1 normalized data:\n", data_normalized_l1)

La ligne de code ci-dessus génère la sortie suivante & miuns;

L1 normalized data:
[[ 0.22105263  -0.2          0.57894737]
[ -0.2027027    0.32432432   0.47297297]
[  0.03571429  -0.56428571   0.4       ]
[  0.42142857   0.16428571  -0.41428571]]

L2 Normalization

Il est également appelé least squares. Ce type de normalisation modifie les valeurs de sorte que la somme des carrés soit toujours jusqu'à 1 dans chaque ligne. Il peut être implémenté sur les données d'entrée à l'aide du code Python suivant -

# Normalize data
data_normalized_l2 = preprocessing.normalize(input_data, norm = 'l2')
print("\nL2 normalized data:\n", data_normalized_l2)

La ligne de code ci-dessus générera la sortie suivante -

L2 normalized data:
[[ 0.33946114  -0.30713151   0.88906489]
[ -0.33325106   0.53320169   0.7775858 ]
[  0.05156558  -0.81473612   0.57753446]
[  0.68706914   0.26784051  -0.6754239 ]]

Étiquetage des données

Nous savons déjà que des données dans un certain format sont nécessaires pour les algorithmes d'apprentissage automatique. Une autre exigence importante est que les données doivent être correctement étiquetées avant de les envoyer en tant qu'entrée d'algorithmes d'apprentissage automatique. Par exemple, si nous parlons de classification, il y a beaucoup d'étiquettes sur les données. Ces étiquettes se présentent sous la forme de mots, de nombres, etc. Fonctions liées à l'apprentissage automatique danssklearnattendez-vous à ce que les données aient des étiquettes numériques. Par conséquent, si les données sont sous une autre forme, elles doivent être converties en nombres. Ce processus de transformation des étiquettes de mots en forme numérique est appelé encodage d'étiquettes.

Étapes de codage des étiquettes

Suivez ces étapes pour encoder les étiquettes de données en Python -

Step1 − Importing the useful packages

Si nous utilisons Python, ce serait la première étape pour convertir les données dans un certain format, c'est-à-dire le prétraitement. Cela peut être fait comme suit -

import numpy as np
from sklearn import preprocessing

Step 2 − Defining sample labels

Après avoir importé les packages, nous devons définir des exemples d'étiquettes afin de pouvoir créer et entraîner l'encodeur d'étiquettes. Nous allons maintenant définir les exemples d'étiquettes suivantes -

# Sample input labels
input_labels = ['red','black','red','green','black','yellow','white']

Step 3 − Creating & training of label encoder object

Dans cette étape, nous devons créer l'encodeur d'étiquette et le former. Le code Python suivant vous aidera à faire cela -

# Creating the label encoder
encoder = preprocessing.LabelEncoder()
encoder.fit(input_labels)

Voici la sortie après l'exécution du code Python ci-dessus -

LabelEncoder()

Step4 − Checking the performance by encoding random ordered list

Cette étape peut être utilisée pour vérifier les performances en codant la liste ordonnée aléatoire. Le code Python suivant peut être écrit pour faire de même -

# encoding a set of labels
test_labels = ['green','red','black']
encoded_values = encoder.transform(test_labels)
print("\nLabels =", test_labels)

Les étiquettes seraient imprimées comme suit -

Labels = ['green', 'red', 'black']

Maintenant, nous pouvons obtenir la liste des valeurs encodées, c'est-à-dire les étiquettes de mots converties en nombres comme suit -

print("Encoded values =", list(encoded_values))

Les valeurs encodées seraient imprimées comme suit -

Encoded values = [1, 2, 0]

Step 5 − Checking the performance by decoding a random set of numbers −

Cette étape peut être utilisée pour vérifier les performances en décodant l'ensemble aléatoire de nombres. Le code Python suivant peut être écrit pour faire de même -

# decoding a set of values
encoded_values = [3,0,4,1]
decoded_list = encoder.inverse_transform(encoded_values)
print("\nEncoded values =", encoded_values)

Maintenant, les valeurs encodées seraient imprimées comme suit -

Encoded values = [3, 0, 4, 1]
print("\nDecoded labels =", list(decoded_list))

Maintenant, les valeurs décodées seraient imprimées comme suit -

Decoded labels = ['white', 'black', 'yellow', 'green']

Données v / s étiquetées sans étiquette

Les données non étiquetées consistent principalement en des échantillons d'objets naturels ou créés par l'homme qui peuvent facilement être obtenus dans le monde. Ils comprennent, audio, vidéo, photos, articles de presse, etc.

D'un autre côté, les données étiquetées prennent un ensemble de données non étiquetées et augmentent chaque élément de ces données non étiquetées avec une balise, une étiquette ou une classe qui est significative. Par exemple, si nous avons une photo, l'étiquette peut être apposée en fonction du contenu de la photo, c'est-à-dire qu'il s'agit d'une photo d'un garçon ou d'une fille ou d'un animal ou autre. L'étiquetage des données nécessite une expertise humaine ou un jugement sur un élément donné de données non étiquetées.

Il existe de nombreux scénarios où les données non étiquetées sont abondantes et faciles à obtenir, mais les données étiquetées nécessitent souvent un humain / expert pour les annoter. L'apprentissage semi-supervisé tente de combiner des données étiquetées et non étiquetées pour créer de meilleurs modèles.

Dans ce chapitre, nous nous concentrerons sur la mise en œuvre de l'apprentissage supervisé - classification.

La technique ou le modèle de classification tente de tirer des conclusions à partir des valeurs observées. Dans le problème de classification, nous avons les résultats catégorisés tels que «noir» ou «blanc» ou «enseignement» et «non-enseignement». Lors de la création du modèle de classification, nous avons besoin d'un jeu de données d'entraînement contenant des points de données et les étiquettes correspondantes. Par exemple, si nous voulons vérifier si l'image est celle d'une voiture ou non. Pour vérifier cela, nous allons construire un ensemble de données de formation ayant les deux classes liées à «voiture» et «pas de voiture». Ensuite, nous devons former le modèle à l'aide des exemples d'apprentissage. Les modèles de classification sont principalement utilisés dans la reconnaissance faciale, l'identification des spams, etc.

Étapes de construction d'un classificateur en Python

Pour créer un classificateur en Python, nous allons utiliser Python 3 et Scikit-learn qui est un outil d'apprentissage automatique. Suivez ces étapes pour créer un classificateur en Python -

Étape 1 - Importez Scikit-learn

Ce serait la toute première étape de la construction d'un classificateur en Python. Dans cette étape, nous installerons un package Python appelé Scikit-learn qui est l'un des meilleurs modules d'apprentissage automatique en Python. La commande suivante nous aidera à importer le package -

Import Sklearn

Étape 2 - Importez l'ensemble de données de Scikit-learn

Dans cette étape, nous pouvons commencer à travailler avec l'ensemble de données pour notre modèle d'apprentissage automatique. Ici, nous allons utiliserthe Base de données de diagnostic du cancer du sein au Wisconsin. L'ensemble de données comprend diverses informations sur les tumeurs du cancer du sein, ainsi que des étiquettes de classificationmalignant ou benign. L'ensemble de données comprend 569 instances, ou données, sur 569 tumeurs et comprend des informations sur 30 attributs ou caractéristiques, tels que le rayon de la tumeur, la texture, la douceur et la surface. À l'aide de la commande suivante, nous pouvons importer le jeu de données sur le cancer du sein de Scikit-learn -

from sklearn.datasets import load_breast_cancer

Maintenant, la commande suivante chargera l'ensemble de données.

data = load_breast_cancer()

Voici une liste des clés de dictionnaire importantes -

  • Noms des étiquettes de classification (target_names)
  • Les étiquettes réelles (cible)
  • Les noms d'attributs / d'entités (noms_fonctionnalités)
  • L'attribut (données)

Maintenant, à l'aide de la commande suivante, nous pouvons créer de nouvelles variables pour chaque ensemble important d'informations et affecter les données. En d'autres termes, nous pouvons organiser les données avec les commandes suivantes -

label_names = data['target_names']
labels = data['target']
feature_names = data['feature_names']
features = data['data']

Maintenant, pour clarifier les choses, nous pouvons imprimer les étiquettes de classe, l'étiquette de la première instance de données, les noms de nos fonctionnalités et la valeur de la fonctionnalité à l'aide des commandes suivantes -

print(label_names)

La commande ci-dessus affichera les noms de classe qui sont respectivement malins et bénins. Il est affiché comme la sortie ci-dessous -

['malignant' 'benign']

Maintenant, la commande ci-dessous montrera qu'ils sont mappés aux valeurs binaires 0 et 1. Ici, 0 représente un cancer malin et 1 représente un cancer bénin. Vous recevrez la sortie suivante -

print(labels[0])
0

Les deux commandes données ci-dessous produiront les noms des fonctionnalités et leurs valeurs.

print(feature_names[0])
mean radius
print(features[0])
[ 1.79900000e+01 1.03800000e+01 1.22800000e+02 1.00100000e+03
  1.18400000e-01 2.77600000e-01 3.00100000e-01 1.47100000e-01
  2.41900000e-01 7.87100000e-02 1.09500000e+00 9.05300000e-01
  8.58900000e+00 1.53400000e+02 6.39900000e-03 4.90400000e-02
  5.37300000e-02 1.58700000e-02 3.00300000e-02 6.19300000e-03
  2.53800000e+01 1.73300000e+01 1.84600000e+02 2.01900000e+03
  1.62200000e-01 6.65600000e-01 7.11900000e-01 2.65400000e-01
  4.60100000e-01 1.18900000e-01]

À partir de la sortie ci-dessus, nous pouvons voir que la première instance de données est une tumeur maligne dont le rayon est de 1,7990000e + 01.

Étape 3 - Organisation des données en ensembles

Dans cette étape, nous diviserons nos données en deux parties, à savoir un ensemble d'apprentissage et un ensemble de test. La division des données dans ces ensembles est très importante car nous devons tester notre modèle sur les données invisibles. Pour diviser les données en ensembles, sklearn a une fonction appelée letrain_test_split()fonction. À l'aide des commandes suivantes, nous pouvons diviser les données dans ces ensembles -

from sklearn.model_selection import train_test_split

La commande ci-dessus importera le train_test_splitLa fonction de sklearn et la commande ci-dessous diviseront les données en données d'entraînement et de test. Dans l'exemple ci-dessous, nous utilisons 40% des données à des fins de test et les données restantes seraient utilisées pour entraîner le modèle.

train, test, train_labels, test_labels = train_test_split(features,labels,test_size = 0.40, random_state = 42)

Étape 4 - Construction du modèle

Dans cette étape, nous construirons notre modèle. Nous allons utiliser l'algorithme Naïve Bayes pour construire le modèle. Les commandes suivantes peuvent être utilisées pour construire le modèle -

from sklearn.naive_bayes import GaussianNB

La commande ci-dessus importera le module GaussianNB. Maintenant, la commande suivante vous aidera à initialiser le modèle.

gnb = GaussianNB()

Nous allons entraîner le modèle en l'ajustant aux données en utilisant gnb.fit ().

model = gnb.fit(train, train_labels)

Étape 5 - Évaluer le modèle et sa précision

Dans cette étape, nous allons évaluer le modèle en faisant des prédictions sur nos données de test. Ensuite, nous découvrirons également sa précision. Pour faire des prédictions, nous utiliserons la fonction prédire (). La commande suivante vous aidera à le faire -

preds = gnb.predict(test)
print(preds)

[1 0 0 1 1 0 0 0 1 1 1 0 1 0 1 0 1 1 1 0 1 1 0 1 1 1 1 1 1
 0 1 1 1 1 1 1 0 1 0 1 1 0 1 1 1 1 1 1 1 1 0 0 1 1 1 1 1 0 
 0 1 1 0 0 1 1 1 0 0 1 1 0 0 1 0 1 1 1 1 1 1 0 1 1 0 0 0 0 
 0 1 1 1 1 1 1 1 1 0 0 1 0 0 1 0 0 1 1 1 0 1 1 0 1 1 0 0 0 
 1 1 1 0 0 1 1 0 1 0 0 1 1 0 0 0 1 1 1 0 1 1 0 0 1 0 1 1 0 
 1 0 0 1 1 1 1 1 1 1 0 0 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 0 
 1 1 0 1 1 1 1 1 1 0 0 0 1 1 0 1 0 1 1 1 1 0 1 1 0 1 1 1 0 
 1 0 0 1 1 1 1 1 1 1 1 0 1 1 1 1 1 0 1 0 0 1 1 0 1]

Les séries de 0 et de 1 ci-dessus sont les valeurs prédites pour les classes de tumeurs - malignes et bénignes.

Maintenant, en comparant les deux tableaux à savoir test_labels et preds, nous pouvons connaître la précision de notre modèle. Nous allons utiliser leaccuracy_score()fonction pour déterminer la précision. Considérez la commande suivante pour cela -

from sklearn.metrics import accuracy_score
print(accuracy_score(test_labels,preds))
0.951754385965

Le résultat montre que le classificateur NaïveBayes est précis à 95,17%.

De cette façon, à l'aide des étapes ci-dessus, nous pouvons construire notre classificateur en Python.

Construire un classificateur en Python

Dans cette section, nous allons apprendre à créer un classificateur en Python.

Classificateur Naïve Bayes

Naïve Bayes est une technique de classification utilisée pour construire un classificateur en utilisant le théorème de Bayes. L'hypothèse est que les prédicteurs sont indépendants. En termes simples, cela suppose que la présence d'une fonctionnalité particulière dans une classe n'est pas liée à la présence d'une autre fonctionnalité. Pour construire le classificateur Naïve Bayes, nous devons utiliser la bibliothèque python appelée scikit learn. Il existe trois types de modèles Naïve Bayes nommésGaussian, Multinomial and Bernoulli sous scikit learn package.

Pour créer un modèle de classifieur d'apprentissage automatique Naïve Bayes, nous avons besoin des éléments suivants & minus

Base de données

Nous allons utiliser l'ensemble de données nommé Breast Cancer Wisconsin Diagnostic Database. L'ensemble de données comprend diverses informations sur les tumeurs du cancer du sein, ainsi que des étiquettes de classificationmalignant ou benign. L'ensemble de données comprend 569 instances, ou données, sur 569 tumeurs et comprend des informations sur 30 attributs ou caractéristiques, tels que le rayon de la tumeur, la texture, la douceur et la surface. Nous pouvons importer cet ensemble de données à partir du package sklearn.

Modèle naïf de Bayes

Pour construire le classificateur Naïve Bayes, nous avons besoin d'un modèle Naïve Bayes. Comme indiqué précédemment, il existe trois types de modèles Naïve Bayes nommésGaussian, Multinomial et Bernoullisous scikit learn package. Ici, dans l'exemple suivant, nous allons utiliser le modèle Gaussian Naïve Bayes.

En utilisant ce qui précède, nous allons construire un modèle d'apprentissage automatique Naïve Bayes pour utiliser les informations sur la tumeur pour prédire si une tumeur est maligne ou bénigne.

Pour commencer, nous devons installer le module sklearn. Cela peut être fait à l'aide de la commande suivante -

Import Sklearn

Maintenant, nous devons importer l'ensemble de données nommé Breast Cancer Wisconsin Diagnostic Database.

from sklearn.datasets import load_breast_cancer

Maintenant, la commande suivante chargera l'ensemble de données.

data = load_breast_cancer()

Les données peuvent être organisées comme suit -

label_names = data['target_names']
labels = data['target']
feature_names = data['feature_names']
features = data['data']

Maintenant, pour clarifier les choses, nous pouvons imprimer les étiquettes de classe, l'étiquette de la première instance de données, les noms de nos fonctionnalités et la valeur de la fonctionnalité à l'aide des commandes suivantes -

print(label_names)

La commande ci-dessus affichera les noms de classe qui sont respectivement malins et bénins. Il est affiché comme la sortie ci-dessous -

['malignant' 'benign']

Maintenant, la commande donnée ci-dessous montrera qu'ils sont mappés aux valeurs binaires 0 et 1. Ici, 0 représente un cancer malin et 1 représente un cancer bénin. Il est affiché comme la sortie ci-dessous -

print(labels[0])
0

Les deux commandes suivantes produiront les noms et les valeurs des fonctions.

print(feature_names[0])
mean radius
print(features[0])

[ 1.79900000e+01 1.03800000e+01 1.22800000e+02 1.00100000e+03
  1.18400000e-01 2.77600000e-01 3.00100000e-01 1.47100000e-01
  2.41900000e-01 7.87100000e-02 1.09500000e+00 9.05300000e-01
  8.58900000e+00 1.53400000e+02 6.39900000e-03 4.90400000e-02
  5.37300000e-02 1.58700000e-02 3.00300000e-02 6.19300000e-03
  2.53800000e+01 1.73300000e+01 1.84600000e+02 2.01900000e+03
  1.62200000e-01 6.65600000e-01 7.11900000e-01 2.65400000e-01
  4.60100000e-01 1.18900000e-01]

À partir de la sortie ci-dessus, nous pouvons voir que la première instance de données est une tumeur maligne dont le rayon principal est 1,7990000e + 01.

Pour tester notre modèle sur des données invisibles, nous devons diviser nos données en données d'entraînement et de test. Cela peut être fait à l'aide du code suivant -

from sklearn.model_selection import train_test_split

La commande ci-dessus importera le train_test_splitLa fonction de sklearn et la commande ci-dessous diviseront les données en données d'entraînement et de test. Dans l'exemple ci-dessous, nous utilisons 40% des données pour les tests et les données restantes seraient utilisées pour entraîner le modèle.

train, test, train_labels, test_labels = 
train_test_split(features,labels,test_size = 0.40, random_state = 42)

Maintenant, nous construisons le modèle avec les commandes suivantes -

from sklearn.naive_bayes import GaussianNB

La commande ci-dessus importera le GaussianNBmodule. Maintenant, avec la commande donnée ci-dessous, nous devons initialiser le modèle.

gnb = GaussianNB()

Nous allons former le modèle en l'ajustant aux données en utilisant gnb.fit().

model = gnb.fit(train, train_labels)

Maintenant, évaluez le modèle en faisant des prédictions sur les données de test et cela peut être fait comme suit -

preds = gnb.predict(test)
print(preds)

[1 0 0 1 1 0 0 0 1 1 1 0 1 0 1 0 1 1 1 0 1 1 0 1 1 1 1 1 1
 0 1 1 1 1 1 1 0 1 0 1 1 0 1 1 1 1 1 1 1 1 0 0 1 1 1 1 1 0 
 0 1 1 0 0 1 1 1 0 0 1 1 0 0 1 0 1 1 1 1 1 1 0 1 1 0 0 0 0 
 0 1 1 1 1 1 1 1 1 0 0 1 0 0 1 0 0 1 1 1 0 1 1 0 1 1 0 0 0 
 1 1 1 0 0 1 1 0 1 0 0 1 1 0 0 0 1 1 1 0 1 1 0 0 1 0 1 1 0 
 1 0 0 1 1 1 1 1 1 1 0 0 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 0 
 1 1 0 1 1 1 1 1 1 0 0 0 1 1 0 1 0 1 1 1 1 0 1 1 0 1 1 1 0 
 1 0 0 1 1 1 1 1 1 1 1 0 1 1 1 1 1 0 1 0 0 1 1 0 1]

Les séries de 0 et de 1 ci-dessus sont les valeurs prédites pour les classes de tumeurs, c'est-à-dire malignes et bénignes.

Maintenant, en comparant les deux tableaux à savoir test_labels et preds, nous pouvons connaître la précision de notre modèle. Nous allons utiliser leaccuracy_score()fonction pour déterminer la précision. Considérez la commande suivante -

from sklearn.metrics import accuracy_score
print(accuracy_score(test_labels,preds))
0.951754385965

Le résultat montre que le classificateur NaïveBayes est précis à 95,17%.

C'était un classificateur d'apprentissage automatique basé sur le modèle gaussien Naïve Bayse.

Machines vectorielles de soutien (SVM)

Fondamentalement, Support Vector Machine (SVM) est un algorithme d'apprentissage automatique supervisé qui peut être utilisé à la fois pour la régression et la classification. Le concept principal de SVM est de tracer chaque élément de données comme un point dans un espace à n dimensions, la valeur de chaque entité étant la valeur d'une coordonnée particulière. Ici n seraient les fonctionnalités que nous aurions. Voici une représentation graphique simple pour comprendre le concept de SVM -

Dans le diagramme ci-dessus, nous avons deux fonctionnalités. Par conséquent, nous devons d'abord tracer ces deux variables dans un espace à deux dimensions où chaque point a deux coordonnées, appelées vecteurs de support. La ligne divise les données en deux groupes classés différents. Cette ligne serait le classificateur.

Ici, nous allons construire un classificateur SVM en utilisant les jeux de données scikit-learn et iris. La bibliothèque Scikitlearn a lesklearn.svmmodule et fournit sklearn.svm.svc pour la classification. Le classificateur SVM pour prédire la classe de l'usine d'iris basé sur 4 caractéristiques est présenté ci-dessous.

Base de données

Nous utiliserons le jeu de données iris qui contient 3 classes de 50 instances chacune, où chaque classe se réfère à un type de plante iris. Chaque instance a les quatre caractéristiques à savoir la longueur des sépales, la largeur des sépales, la longueur des pétales et la largeur des pétales. Le classificateur SVM pour prédire la classe de l'usine d'iris basé sur 4 caractéristiques est illustré ci-dessous.

Noyau

C'est une technique utilisée par SVM. Fondamentalement, ce sont les fonctions qui prennent un espace d'entrée de faible dimension et le transforment en un espace de dimension supérieure. Il convertit un problème non séparable en problème séparable. La fonction noyau peut être n'importe laquelle parmi les fonctions linéaire, polynomiale, rbf et sigmoïde. Dans cet exemple, nous utiliserons le noyau linéaire.

Importons maintenant les packages suivants -

import pandas as pd
import numpy as np
from sklearn import svm, datasets
import matplotlib.pyplot as plt

Maintenant, chargez les données d'entrée -

iris = datasets.load_iris()

Nous prenons les deux premières fonctionnalités -

X = iris.data[:, :2]
y = iris.target

Nous tracerons les limites de la machine vectorielle de support avec les données originales. Nous créons un maillage à tracer.

x_min, x_max = X[:, 0].min() - 1, X[:, 0].max() + 1
y_min, y_max = X[:, 1].min() - 1, X[:, 1].max() + 1
h = (x_max / x_min)/100
xx, yy = np.meshgrid(np.arange(x_min, x_max, h),
np.arange(y_min, y_max, h))
X_plot = np.c_[xx.ravel(), yy.ravel()]

Nous devons donner la valeur du paramètre de régularisation.

C = 1.0

Nous devons créer l'objet classificateur SVM.

Svc_classifier = svm_classifier.SVC(kernel='linear', 
C=C, decision_function_shape = 'ovr').fit(X, y)
Z = svc_classifier.predict(X_plot)
Z = Z.reshape(xx.shape)
plt.figure(figsize = (15, 5))
plt.subplot(121)
plt.contourf(xx, yy, Z, cmap = plt.cm.tab10, alpha = 0.3)
plt.scatter(X[:, 0], X[:, 1], c = y, cmap = plt.cm.Set1)
plt.xlabel('Sepal length')
plt.ylabel('Sepal width')
plt.xlim(xx.min(), xx.max())
plt.title('SVC with linear kernel')

Régression logistique

Fondamentalement, le modèle de régression logistique est l'un des membres de la famille d'algorithmes de classification supervisée. La régression logistique mesure la relation entre les variables dépendantes et les variables indépendantes en estimant les probabilités à l'aide d'une fonction logistique.

Ici, si nous parlons de variables dépendantes et indépendantes, alors la variable dépendante est la variable de classe cible que nous allons prédire et de l'autre côté les variables indépendantes sont les fonctionnalités que nous allons utiliser pour prédire la classe cible.

Dans la régression logistique, estimer les probabilités signifie prédire la probabilité d'occurrence de l'événement. Par exemple, le propriétaire de la boutique souhaite prédire que le client qui est entré dans la boutique achètera la station de lecture (par exemple) ou non. Il y aurait de nombreuses caractéristiques du client - sexe, âge, etc. qui seraient observées par le commerçant pour prédire l'occurrence probable, c'est-à-dire acheter une station de jeu ou non. La fonction logistique est la courbe sigmoïde qui est utilisée pour construire la fonction avec divers paramètres.

Conditions préalables

Avant de construire le classificateur à l'aide de la régression logistique, nous devons installer le package Tkinter sur notre système. Il peut être installé à partir dehttps://docs.python.org/2/library/tkinter.html.

Maintenant, avec l'aide du code donné ci-dessous, nous pouvons créer un classificateur en utilisant la régression logistique -

Tout d'abord, nous importerons quelques packages -

import numpy as np
from sklearn import linear_model
import matplotlib.pyplot as plt

Maintenant, nous devons définir les exemples de données qui peuvent être effectués comme suit -

X = np.array([[2, 4.8], [2.9, 4.7], [2.5, 5], [3.2, 5.5], [6, 5], [7.6, 4],
              [3.2, 0.9], [2.9, 1.9],[2.4, 3.5], [0.5, 3.4], [1, 4], [0.9, 5.9]])
y = np.array([0, 0, 0, 1, 1, 1, 2, 2, 2, 3, 3, 3])

Ensuite, nous devons créer le classificateur de régression logistique, ce qui peut être fait comme suit -

Classifier_LR = linear_model.LogisticRegression(solver = 'liblinear', C = 75)

Dernier point mais non le moindre, nous devons former ce classificateur -

Classifier_LR.fit(X, y)

Maintenant, comment pouvons-nous visualiser la sortie? Cela peut être fait en créant une fonction nommée Logistic_visualize () -

Def Logistic_visualize(Classifier_LR, X, y):
   min_x, max_x = X[:, 0].min() - 1.0, X[:, 0].max() + 1.0
   min_y, max_y = X[:, 1].min() - 1.0, X[:, 1].max() + 1.0

Dans la ligne ci-dessus, nous avons défini les valeurs minimale et maximale X et Y à utiliser dans la grille de maillage. De plus, nous définirons la taille du pas pour tracer la grille de maillage.

mesh_step_size = 0.02

Définissons la grille de maillage des valeurs X et Y comme suit -

x_vals, y_vals = np.meshgrid(np.arange(min_x, max_x, mesh_step_size),
                 np.arange(min_y, max_y, mesh_step_size))

À l'aide du code suivant, nous pouvons exécuter le classificateur sur la grille de maillage -

output = classifier.predict(np.c_[x_vals.ravel(), y_vals.ravel()])
output = output.reshape(x_vals.shape)
plt.figure()
plt.pcolormesh(x_vals, y_vals, output, cmap = plt.cm.gray)
 
plt.scatter(X[:, 0], X[:, 1], c = y, s = 75, edgecolors = 'black', 
linewidth=1, cmap = plt.cm.Paired)

La ligne de code suivante spécifiera les limites du tracé

plt.xlim(x_vals.min(), x_vals.max())
plt.ylim(y_vals.min(), y_vals.max())
plt.xticks((np.arange(int(X[:, 0].min() - 1), int(X[:, 0].max() + 1), 1.0)))
plt.yticks((np.arange(int(X[:, 1].min() - 1), int(X[:, 1].max() + 1), 1.0)))
plt.show()

Maintenant, après avoir exécuté le code, nous obtiendrons la sortie suivante, classificateur de régression logistique -

Classificateur d'arbre de décision

Un arbre de décision est essentiellement un organigramme d'arbre binaire où chaque nœud divise un groupe d'observations en fonction d'une variable caractéristique.

Ici, nous construisons un classificateur d'arbre de décision pour prédire l'homme ou la femme. Nous prendrons un très petit ensemble de données contenant 19 échantillons. Ces échantillons comprendraient deux caractéristiques - «hauteur» et «longueur des cheveux».

Prérequis

Pour construire le classificateur suivant, nous devons installer pydotplus et graphviz. Fondamentalement, graphviz est un outil pour dessiner des graphiques à l'aide de fichiers de points etpydotplusest un module du langage Dot de Graphviz. Il peut être installé avec le gestionnaire de packages ou pip.

Maintenant, nous pouvons construire le classificateur d'arbre de décision à l'aide du code Python suivant -

Pour commencer, importons quelques bibliothèques importantes comme suit -

import pydotplus
from sklearn import tree
from sklearn.datasets import load_iris
from sklearn.metrics import classification_report
from sklearn import cross_validation
import collections

Maintenant, nous devons fournir le jeu de données comme suit -

X = [[165,19],[175,32],[136,35],[174,65],[141,28],[176,15],[131,32],
[166,6],[128,32],[179,10],[136,34],[186,2],[126,25],[176,28],[112,38],
[169,9],[171,36],[116,25],[196,25]]

Y = ['Man','Woman','Woman','Man','Woman','Man','Woman','Man','Woman',
'Man','Woman','Man','Woman','Woman','Woman','Man','Woman','Woman','Man']
data_feature_names = ['height','length of hair']

X_train, X_test, Y_train, Y_test = cross_validation.train_test_split
(X, Y, test_size=0.40, random_state=5)

Après avoir fourni l'ensemble de données, nous devons ajuster le modèle, ce qui peut être fait comme suit -

clf = tree.DecisionTreeClassifier()
clf = clf.fit(X,Y)

La prédiction peut être faite à l'aide du code Python suivant -

prediction = clf.predict([[133,37]])
print(prediction)

Nous pouvons visualiser l'arbre de décision à l'aide du code Python suivant -

dot_data = tree.export_graphviz(clf,feature_names = data_feature_names,
            out_file = None,filled = True,rounded = True)
graph = pydotplus.graph_from_dot_data(dot_data)
colors = ('orange', 'yellow')
edges = collections.defaultdict(list)

for edge in graph.get_edge_list():
edges[edge.get_source()].append(int(edge.get_destination()))

for edge in edges: edges[edge].sort()

for i in range(2):dest = graph.get_node(str(edges[edge][i]))[0]
dest.set_fillcolor(colors[i])
graph.write_png('Decisiontree16.png')

Il donnera la prédiction pour le code ci-dessus comme [‘Woman’] et créez l'arbre de décision suivant -

Nous pouvons modifier les valeurs des fonctionnalités dans la prédiction pour la tester.

Classificateur de forêt aléatoire

Comme nous le savons, les méthodes d'ensemble sont les méthodes qui combinent des modèles d'apprentissage automatique en un modèle d'apprentissage automatique plus puissant. Random Forest, une collection d'arbres de décision, en fait partie. C'est mieux qu'un arbre de décision unique car tout en conservant les pouvoirs prédictifs, il peut réduire le surajustement en faisant la moyenne des résultats. Ici, nous allons mettre en œuvre le modèle de forêt aléatoire sur l'ensemble de données scikit learn sur le cancer.

Importez les packages nécessaires -

from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_breast_cancer
cancer = load_breast_cancer()
import matplotlib.pyplot as plt
import numpy as np

Maintenant, nous devons fournir le jeu de données qui peut être fait comme suit et moins

cancer = load_breast_cancer()
X_train, X_test, y_train,
y_test = train_test_split(cancer.data, cancer.target, random_state = 0)

Après avoir fourni l'ensemble de données, nous devons ajuster le modèle, ce qui peut être fait comme suit -

forest = RandomForestClassifier(n_estimators = 50, random_state = 0)
forest.fit(X_train,y_train)

Maintenant, obtenez la précision sur la formation ainsi que sur le sous-ensemble de test: si nous augmentons le nombre d'estimateurs, la précision du sous-ensemble de test sera également augmentée.

print('Accuracy on the training subset:(:.3f)',format(forest.score(X_train,y_train)))
print('Accuracy on the training subset:(:.3f)',format(forest.score(X_test,y_test)))

Production

Accuracy on the training subset:(:.3f) 1.0
Accuracy on the training subset:(:.3f) 0.965034965034965

Maintenant, comme l'arbre de décision, la forêt aléatoire a le feature_importancemodule qui fournira une meilleure vue du poids des fonctionnalités que l'arbre de décision. Il peut être tracé et visualisé comme suit -

n_features = cancer.data.shape[1]
plt.barh(range(n_features),forest.feature_importances_, align='center')
plt.yticks(np.arange(n_features),cancer.feature_names)
plt.xlabel('Feature Importance')
plt.ylabel('Feature')
plt.show()

Performance d'un classificateur

Après avoir implémenté un algorithme d'apprentissage automatique, nous devons déterminer l'efficacité du modèle. Les critères de mesure de l'efficacité peuvent être basés sur des ensembles de données et des mesures. Pour évaluer différents algorithmes d'apprentissage automatique, nous pouvons utiliser différentes mesures de performance. Par exemple, supposons que si un classificateur est utilisé pour distinguer les images de différents objets, nous pouvons utiliser les métriques de performance de classification telles que la précision moyenne, AUC, etc. très important car le choix des métriques influence la façon dont les performances d'un algorithme d'apprentissage automatique sont mesurées et comparées. Voici quelques-unes des mesures -

Matrice de confusion

Fondamentalement, il est utilisé pour les problèmes de classification où la sortie peut être de deux ou plusieurs types de classes. C'est le moyen le plus simple de mesurer les performances d'un classificateur. Une matrice de confusion est essentiellement un tableau à deux dimensions, à savoir «Réel» et «Prévu». Les deux dimensions ont «True Positives (TP)», «True Negatives (TN)», «False Positives (FP)», «False Negatives (FN)».

Dans la matrice de confusion ci-dessus, 1 correspond à une classe positive et 0 à une classe négative.

Voici les termes associés à la matrice de confusion -

  • True Positives − Les TP sont les cas où la classe réelle du point de données était 1 et la prédiction est également 1.

  • True Negatives − Les TN sont les cas où la classe réelle du point de données était 0 et la prédiction est également 0.

  • False Positives − Les PF sont les cas où la classe réelle du point de données était 0 et la prédiction est également 1.

  • False Negatives − Les FN sont les cas où la classe réelle du point de données était 1 et la valeur prédite est également 0.

Précision

La matrice de confusion elle-même n'est pas une mesure de la performance en tant que telle, mais presque toutes les matrices de performance sont basées sur la matrice de confusion. L'un d'eux est la précision. Dans les problèmes de classification, il peut être défini comme le nombre de prédictions correctes faites par le modèle sur toutes sortes de prédictions faites. La formule de calcul de la précision est la suivante -

$$ Précision = \ frac {TP + TN} {TP + FP + FN + TN} $$

Précision

Il est principalement utilisé dans la récupération de documents. Il peut être défini comme le nombre de documents retournés corrects. Voici la formule pour calculer la précision -

$$ Précision = \ frac {TP} {TP + FP} $$

Rappel ou sensibilité

Il peut être défini comme le nombre de positifs renvoyés par le modèle. Voici la formule pour calculer le rappel / la sensibilité du modèle -

$$ Recall = \ frac {TP} {TP + FN} $$

Spécificité

Il peut être défini comme le nombre de négatifs retournés par le modèle. C'est exactement l'opposé du rappel. Voici la formule pour calculer la spécificité du modèle -

$$ Spécificité = \ frac {TN} {TN + FP} $$

Problème de déséquilibre de classe

Le déséquilibre de classe est le scénario où le nombre d'observations appartenant à une classe est significativement plus faible que celles appartenant aux autres classes. Par exemple, ce problème est prédominant dans le scénario où nous devons identifier les maladies rares, les transactions frauduleuses en banque, etc.

Exemple de classes déséquilibrées

Prenons un exemple d'ensemble de données de détection de fraude pour comprendre le concept de classe déséquilibrée -

Total observations = 5000
Fraudulent Observations = 50
Non-Fraudulent Observations = 4950
Event Rate = 1%

Solution

Balancing the classes’agit comme une solution aux classes déséquilibrées. L'objectif principal de l'équilibrage des classes est soit d'augmenter la fréquence de la classe minoritaire, soit de diminuer la fréquence de la classe majoritaire. Voici les approches pour résoudre le problème des classes de déséquilibres -

Rééchantillonnage

Le rééchantillonnage est une série de méthodes utilisées pour reconstruire les ensembles de données d'échantillons - à la fois des ensembles d'apprentissage et des ensembles de test. Un rééchantillonnage est effectué pour améliorer la précision du modèle. Voici quelques techniques de rééchantillonnage -

  • Random Under-Sampling- Cette technique vise à équilibrer la distribution des classes en éliminant aléatoirement les exemples de classes majoritaires. Ceci est fait jusqu'à ce que les instances de la classe majoritaire et minoritaire soient équilibrées.

Total observations = 5000
Fraudulent Observations = 50
Non-Fraudulent Observations = 4950
Event Rate = 1%

Dans ce cas, nous prélevons 10% d'échantillons sans remplacement à partir d'instances non frauduleuses, puis nous les combinons avec les instances frauduleuses -

Observations non frauduleuses après sous-échantillonnage aléatoire = 10% de 4950 = 495

Total des observations après les avoir combinées avec des observations frauduleuses = 50 + 495 = 545

Par conséquent, le taux d'événements pour le nouvel ensemble de données après sous-échantillonnage = 9%

Le principal avantage de cette technique est qu'elle permet de réduire le temps d'exécution et d'améliorer le stockage. Mais d'un autre côté, il peut rejeter des informations utiles tout en réduisant le nombre d'échantillons de données d'apprentissage.

  • Random Over-Sampling - Cette technique vise à équilibrer la distribution des classes en augmentant le nombre d'instances dans la classe minoritaire en les répliquant.

Total observations = 5000
Fraudulent Observations = 50
Non-Fraudulent Observations = 4950
Event Rate = 1%

Dans le cas où nous reproduisions 50 observations frauduleuses 30 fois, les observations frauduleuses après avoir répliqué les observations de classe minoritaire seraient de 1500. Et puis les observations totales dans les nouvelles données après suréchantillonnage seraient de 4950 + 1500 = 6450. D'où le taux d'événements pour le nouvel ensemble de données serait 1500/6450 = 23%.

Le principal avantage de cette méthode est qu'il n'y aurait aucune perte d'informations utiles. Mais d'un autre côté, il a des chances accrues de sur-ajustement parce qu'il reproduit les événements de la classe minoritaire.

Techniques d'ensemble

Cette méthodologie est essentiellement utilisée pour modifier les algorithmes de classification existants pour les rendre appropriés aux ensembles de données déséquilibrés. Dans cette approche, nous construisons plusieurs classificateurs en deux étapes à partir des données d'origine, puis agrégons leurs prédictions. Le classificateur de forêt aléatoire est un exemple de classificateur basé sur un ensemble.

La régression est l'un des outils statistiques et d'apprentissage automatique les plus importants. Nous n'aurions pas tort de dire que le parcours de l'apprentissage automatique part de la régression. Elle peut être définie comme la technique paramétrique qui nous permet de prendre des décisions basées sur des données ou en d'autres termes nous permet de faire des prédictions basées sur des données en apprenant la relation entre les variables d'entrée et de sortie. Ici, les variables de sortie dépendant des variables d'entrée sont des nombres réels à valeur continue. Dans la régression, la relation entre les variables d'entrée et de sortie est importante et elle nous aide à comprendre comment la valeur de la variable de sortie change avec le changement de variable d'entrée. La régression est fréquemment utilisée pour prédire les prix, l'économie, les variations, etc.

Construire des régresseurs en Python

Dans cette section, nous allons apprendre à créer un régresseur unique et multivariable.

Régresseur linéaire / Régresseur à variable unique

Laissez-nous important quelques paquets requis -

import numpy as np
from sklearn import linear_model
import sklearn.metrics as sm
import matplotlib.pyplot as plt

Maintenant, nous devons fournir les données d'entrée et nous avons enregistré nos données dans le fichier nommé linear.txt.

input = 'D:/ProgramData/linear.txt'

Nous devons charger ces données en utilisant le np.loadtxt fonction.

input_data = np.loadtxt(input, delimiter=',')
X, y = input_data[:, :-1], input_data[:, -1]

La prochaine étape serait de former le modèle. Laissez-nous donner des échantillons de formation et de test.

training_samples = int(0.6 * len(X))
testing_samples = len(X) - num_training

X_train, y_train = X[:training_samples], y[:training_samples]

X_test, y_test = X[training_samples:], y[training_samples:]

Maintenant, nous devons créer un objet régresseur linéaire.

reg_linear = linear_model.LinearRegression()

Entraînez l'objet avec les échantillons d'apprentissage.

reg_linear.fit(X_train, y_train)

Nous devons faire la prédiction avec les données de test.

y_test_pred = reg_linear.predict(X_test)

Maintenant, tracez et visualisez les données.

plt.scatter(X_test, y_test, color = 'red')
plt.plot(X_test, y_test_pred, color = 'black', linewidth = 2)
plt.xticks(())
plt.yticks(())
plt.show()

Production

Maintenant, nous pouvons calculer les performances de notre régression linéaire comme suit -

print("Performance of Linear regressor:")
print("Mean absolute error =", round(sm.mean_absolute_error(y_test, y_test_pred), 2))
print("Mean squared error =", round(sm.mean_squared_error(y_test, y_test_pred), 2))
print("Median absolute error =", round(sm.median_absolute_error(y_test, y_test_pred), 2))
print("Explain variance score =", round(sm.explained_variance_score(y_test, y_test_pred),
2))
print("R2 score =", round(sm.r2_score(y_test, y_test_pred), 2))

Production

Performance du régresseur linéaire -

Mean absolute error = 1.78
Mean squared error = 3.89
Median absolute error = 2.01
Explain variance score = -0.09
R2 score = -0.09

Dans le code ci-dessus, nous avons utilisé ces petites données. Si vous voulez un grand ensemble de données, vous pouvez utiliser sklearn.dataset pour importer un plus grand ensemble de données.

2,4.82.9,4.72.5,53.2,5.56,57.6,43.2,0.92.9,1.92.4,
3.50.5,3.41,40.9,5.91.2,2.583.2,5.65.1,1.54.5,
1.22.3,6.32.1,2.8

Régresseur multivariable

Tout d'abord, importons quelques packages requis -

import numpy as np
from sklearn import linear_model
import sklearn.metrics as sm
import matplotlib.pyplot as plt
from sklearn.preprocessing import PolynomialFeatures

Maintenant, nous devons fournir les données d'entrée et nous avons enregistré nos données dans le fichier nommé linear.txt.

input = 'D:/ProgramData/Mul_linear.txt'

Nous chargerons ces données en utilisant le np.loadtxt fonction.

input_data = np.loadtxt(input, delimiter=',')
X, y = input_data[:, :-1], input_data[:, -1]

La prochaine étape serait de former le modèle; nous donnerons des échantillons de formation et de test.

training_samples = int(0.6 * len(X))
testing_samples = len(X) - num_training

X_train, y_train = X[:training_samples], y[:training_samples]

X_test, y_test = X[training_samples:], y[training_samples:]

Maintenant, nous devons créer un objet régresseur linéaire.

reg_linear_mul = linear_model.LinearRegression()

Entraînez l'objet avec les échantillons d'apprentissage.

reg_linear_mul.fit(X_train, y_train)

Maintenant, nous devons enfin faire la prédiction avec les données de test.

y_test_pred = reg_linear_mul.predict(X_test)

print("Performance of Linear regressor:")
print("Mean absolute error =", round(sm.mean_absolute_error(y_test, y_test_pred), 2))
print("Mean squared error =", round(sm.mean_squared_error(y_test, y_test_pred), 2))
print("Median absolute error =", round(sm.median_absolute_error(y_test, y_test_pred), 2))
print("Explain variance score =", round(sm.explained_variance_score(y_test, y_test_pred), 2))
print("R2 score =", round(sm.r2_score(y_test, y_test_pred), 2))

Production

Performance du régresseur linéaire -

Mean absolute error = 0.6
Mean squared error = 0.65
Median absolute error = 0.41
Explain variance score = 0.34
R2 score = 0.33

Maintenant, nous allons créer un polynôme de degré 10 et former le régresseur. Nous fournirons l'exemple de point de données.

polynomial = PolynomialFeatures(degree = 10)
X_train_transformed = polynomial.fit_transform(X_train)
datapoint = [[2.23, 1.35, 1.12]]
poly_datapoint = polynomial.fit_transform(datapoint)

poly_linear_model = linear_model.LinearRegression()
poly_linear_model.fit(X_train_transformed, y_train)
print("\nLinear regression:\n", reg_linear_mul.predict(datapoint))
print("\nPolynomial regression:\n", poly_linear_model.predict(poly_datapoint))

Production

Régression linéaire -

[2.40170462]

Régression polynomiale -

[1.8697225]

Dans le code ci-dessus, nous avons utilisé ces petites données. Si vous voulez un grand ensemble de données, vous pouvez utiliser sklearn.dataset pour importer un plus grand ensemble de données.

2,4.8,1.2,3.22.9,4.7,1.5,3.62.5,5,2.8,23.2,5.5,3.5,2.16,5,
2,3.27.6,4,1.2,3.23.2,0.9,2.3,1.42.9,1.9,2.3,1.22.4,3.5,
2.8,3.60.5,3.4,1.8,2.91,4,3,2.50.9,5.9,5.6,0.81.2,2.58,
3.45,1.233.2,5.6,2,3.25.1,1.5,1.2,1.34.5,1.2,4.1,2.32.3,
6.3,2.5,3.22.1,2.8,1.2,3.6

Dans ce chapitre, nous nous concentrerons sur la programmation logique et sur la manière dont elle contribue à l'intelligence artificielle.

Nous savons déjà que la logique est l'étude des principes du raisonnement correct ou, en termes simples, c'est l'étude de ce qui vient après quoi. Par exemple, si deux déclarations sont vraies, nous pouvons en déduire n'importe quelle troisième instruction.

Concept

La programmation logique est la combinaison de deux mots, logique et programmation. La programmation logique est un paradigme de programmation dans lequel les problèmes sont exprimés sous forme de faits et de règles par des instructions de programme mais dans un système de logique formelle. Tout comme d'autres paradigmes de programmation comme orienté objet, fonctionnel, déclaratif et procédural, etc., c'est aussi une manière particulière d'aborder la programmation.

Comment résoudre les problèmes de programmation logique

La programmation logique utilise des faits et des règles pour résoudre le problème. C'est pourquoi ils sont appelés les blocs de construction de la programmation logique. Un objectif doit être spécifié pour chaque programme en programmation logique. Pour comprendre comment un problème peut être résolu en programmation logique, nous devons connaître les éléments de base - faits et règles -

Les faits

En fait, chaque programme logique a besoin de faits avec lesquels travailler pour pouvoir atteindre l'objectif donné. Les faits sont essentiellement des déclarations vraies sur le programme et les données. Par exemple, Delhi est la capitale de l'Inde.

Règles

En fait, les règles sont les contraintes qui nous permettent de tirer des conclusions sur le domaine du problème. Règles essentiellement écrites comme des clauses logiques pour exprimer divers faits. Par exemple, si nous construisons un jeu, toutes les règles doivent être définies.

Les règles sont très importantes pour résoudre tout problème de programmation logique. Les règles sont essentiellement des conclusions logiques qui peuvent exprimer les faits. Voici la syntaxe de la règle -

A∶− B1, B2, ..., B n .

Ici, A est la tête et B1, B2, ... Bn est le corps.

Par exemple - ancêtre (X, Y): - père (X, Y).

ancêtre (X, Z): - père (X, Y), ancêtre (Y, Z).

Cela peut être lu comme, pour chaque X et Y, si X est le père de Y et Y est un ancêtre de Z, X est l'ancêtre de Z. Pour chaque X et Y, X est l'ancêtre de Z, si X est le père de Y et Y est un ancêtre de Z.

Installer des packages utiles

Pour démarrer la programmation logique en Python, nous devons installer les deux packages suivants -

Kanren

Cela nous fournit un moyen de simplifier la façon dont nous avons créé du code pour la logique métier. Cela nous permet d'exprimer la logique en termes de règles et de faits. La commande suivante vous aidera à installer kanren -

pip install kanren

SymPy

SymPy est une bibliothèque Python pour les mathématiques symboliques. Il vise à devenir un système d'algèbre informatique (CAS) complet tout en gardant le code aussi simple que possible afin d'être compréhensible et facilement extensible. La commande suivante vous aidera à installer SymPy -

pip install sympy

Exemples de programmation logique

Voici quelques exemples qui peuvent être résolus par programmation logique -

Correspondance d'expressions mathématiques

En fait, nous pouvons trouver les valeurs inconnues en utilisant la programmation logique de manière très efficace. Le code Python suivant vous aidera à faire correspondre une expression mathématique -

Pensez d'abord à importer les packages suivants -

from kanren import run, var, fact
from kanren.assoccomm import eq_assoccomm as eq
from kanren.assoccomm import commutative, associative

Nous devons définir les opérations mathématiques que nous allons utiliser -

add = 'add'
mul = 'mul'

L'addition et la multiplication sont des processus communicatifs. Par conséquent, nous devons le spécifier et cela peut être fait comme suit -

fact(commutative, mul)
fact(commutative, add)
fact(associative, mul)
fact(associative, add)

Il est obligatoire de définir des variables; cela peut être fait comme suit -

a, b = var('a'), var('b')

Nous devons faire correspondre l'expression avec le modèle d'origine. Nous avons le modèle original suivant, qui est fondamentalement (5 + a) * b -

Original_pattern = (mul, (add, 5, a), b)

Nous avons les deux expressions suivantes à faire correspondre avec le modèle d'origine -

exp1 = (mul, 2, (add, 3, 1))
exp2 = (add,5,(mul,8,1))

La sortie peut être imprimée avec la commande suivante -

print(run(0, (a,b), eq(original_pattern, exp1)))
print(run(0, (a,b), eq(original_pattern, exp2)))

Après avoir exécuté ce code, nous obtiendrons la sortie suivante -

((3,2))
()

La première sortie représente les valeurs pour a et b. La première expression correspondait au modèle d'origine et a renvoyé les valeurs dea et b mais la deuxième expression ne correspondait pas au modèle d'origine, donc rien n'a été renvoyé.

Vérification des nombres premiers

Avec l'aide de la programmation logique, nous pouvons trouver les nombres premiers à partir d'une liste de nombres et pouvons également générer des nombres premiers. Le code Python ci-dessous trouvera le nombre premier dans une liste de nombres et générera également les 10 premiers nombres premiers.

Considérons d'abord l'importation des packages suivants -

from kanren import isvar, run, membero
from kanren.core import success, fail, goaleval, condeseq, eq, var
from sympy.ntheory.generate import prime, isprime
import itertools as it

Maintenant, nous allons définir une fonction appelée prime_check qui vérifiera les nombres premiers en fonction des nombres donnés en tant que données.

def prime_check(x):
if isvar(x):
   return condeseq([(eq,x,p)] for p in map(prime, it.count(1)))
else:
   return success if isprime(x) else fail

Maintenant, nous devons déclarer une variable qui sera utilisée -

x = var()
print((set(run(0,x,(membero,x,(12,14,15,19,20,21,22,23,29,30,41,44,52,62,65,85)),
(prime_check,x)))))
print((run(10,x,prime_check(x))))

La sortie du code ci-dessus sera la suivante -

{19, 23, 29, 41}
(2, 3, 5, 7, 11, 13, 17, 19, 23, 29)

Résoudre des puzzles

La programmation logique peut être utilisée pour résoudre de nombreux problèmes comme 8-puzzles, Zebra puzzle, Sudoku, N-queen, etc. Ici, nous prenons un exemple d'une variante de Zebra puzzle qui est la suivante -

There are five houses.
The English man lives in the red house.
The Swede has a dog.
The Dane drinks tea.
The green house is immediately to the left of the white house.
They drink coffee in the green house.
The man who smokes Pall Mall has birds.
In the yellow house they smoke Dunhill.
In the middle house they drink milk.
The Norwegian lives in the first house.
The man who smokes Blend lives in the house next to the house with cats.
In a house next to the house where they have a horse, they smoke Dunhill.
The man who smokes Blue Master drinks beer.
The German smokes Prince.
The Norwegian lives next to the blue house.
They drink water in a house next to the house where they smoke Blend.

Nous le résolvons pour la question who owns zebra avec l'aide de Python.

Importons les packages nécessaires -

from kanren import *
from kanren.core import lall
import time

Maintenant, nous devons définir deux fonctions - left() et next() pour vérifier à qui appartient la maison ou à côté de qui est la maison -

def left(q, p, list):
   return membero((q,p), zip(list, list[1:]))
def next(q, p, list):
   return conde([left(q, p, list)], [left(p, q, list)])

Maintenant, nous allons déclarer une maison variable comme suit -

houses = var()

Nous devons définir les règles à l'aide du package lall comme suit.

Il y a 5 maisons -

rules_zebraproblem = lall(
   (eq, (var(), var(), var(), var(), var()), houses),

   (membero,('Englishman', var(), var(), var(), 'red'), houses),
   (membero,('Swede', var(), var(), 'dog', var()), houses),
   (membero,('Dane', var(), 'tea', var(), var()), houses),
   (left,(var(), var(), var(), var(), 'green'),
   (var(), var(), var(), var(), 'white'), houses),
   (membero,(var(), var(), 'coffee', var(), 'green'), houses),
   (membero,(var(), 'Pall Mall', var(), 'birds', var()), houses),
   (membero,(var(), 'Dunhill', var(), var(), 'yellow'), houses),
   (eq,(var(), var(), (var(), var(), 'milk', var(), var()), var(), var()), houses),
   (eq,(('Norwegian', var(), var(), var(), var()), var(), var(), var(), var()), houses),
   (next,(var(), 'Blend', var(), var(), var()),
   (var(), var(), var(), 'cats', var()), houses),
   (next,(var(), 'Dunhill', var(), var(), var()),
   (var(), var(), var(), 'horse', var()), houses),
   (membero,(var(), 'Blue Master', 'beer', var(), var()), houses),
   (membero,('German', 'Prince', var(), var(), var()), houses),
   (next,('Norwegian', var(), var(), var(), var()),
   (var(), var(), var(), var(), 'blue'), houses),
   (next,(var(), 'Blend', var(), var(), var()),
   (var(), var(), 'water', var(), var()), houses),
   (membero,(var(), var(), var(), 'zebra', var()), houses)
)

Maintenant, exécutez le solveur avec les contraintes précédentes -

solutions = run(0, houses, rules_zebraproblem)

À l'aide du code suivant, nous pouvons extraire la sortie du solveur -

output_zebra = [house for house in solutions[0] if 'zebra' in house][0][0]

Le code suivant aidera à imprimer la solution -

print ('\n'+ output_zebra + 'owns zebra.')

La sortie du code ci-dessus serait la suivante -

German owns zebra.

Les algorithmes d'apprentissage automatique non supervisés n'ont pas de superviseur pour fournir des conseils. C'est pourquoi ils sont étroitement liés à ce que certains appellent la véritable intelligence artificielle.

Dans l'apprentissage non supervisé, il n'y aurait pas de réponse correcte et pas d'enseignant pour les conseils. Les algorithmes doivent découvrir le modèle intéressant des données pour l'apprentissage.

Qu'est-ce que le clustering?

Fondamentalement, il s'agit d'un type de méthode d'apprentissage non supervisé et d'une technique courante d'analyse de données statistiques utilisée dans de nombreux domaines. Le regroupement consiste principalement à diviser l'ensemble des observations en sous-ensembles, appelés groupes, de telle sorte que les observations dans le même groupe sont similaires dans un sens et elles sont différentes des observations dans d'autres groupes. En termes simples, nous pouvons dire que l'objectif principal du clustering est de regrouper les données sur la base de la similitude et de la dissemblance.

Par exemple, le diagramme suivant montre un type similaire de données dans différents clusters -

Algorithmes de clustering des données

Voici quelques algorithmes courants pour regrouper les données -

Algorithme K-Means

L'algorithme de clustering K-means est l'un des algorithmes bien connus pour le clustering des données. Nous devons supposer que le nombre de grappes est déjà connu. Ceci est également appelé clustering plat. C'est un algorithme de clustering itératif. Les étapes ci-dessous doivent être suivies pour cet algorithme -

Step 1 - Nous devons spécifier le nombre souhaité de K sous-groupes.

Step 2- Fixez le nombre de clusters et attribuez de manière aléatoire chaque point de données à un cluster. Ou en d'autres termes, nous devons classer nos données en fonction du nombre de clusters.

Dans cette étape, les centroïdes de cluster doivent être calculés.

Comme il s'agit d'un algorithme itératif, nous devons mettre à jour les emplacements des centres de gravité K à chaque itération jusqu'à ce que nous trouvions les optima globaux ou, en d'autres termes, que les centres de gravité atteignent leurs emplacements optimaux.

Le code suivant aidera à implémenter l'algorithme de clustering K-means en Python. Nous allons utiliser le module Scikit-learn.

Importons les packages nécessaires -

import matplotlib.pyplot as plt
import seaborn as sns; sns.set()
import numpy as np
from sklearn.cluster import KMeans

La ligne de code suivante vous aidera à générer le jeu de données bidimensionnel, contenant quatre objets blob, en utilisant make_blob du sklearn.dataset paquet.

from sklearn.datasets.samples_generator import make_blobs

X, y_true = make_blobs(n_samples = 500, centers = 4,
            cluster_std = 0.40, random_state = 0)

Nous pouvons visualiser l'ensemble de données en utilisant le code suivant -

plt.scatter(X[:, 0], X[:, 1], s = 50);
plt.show()

Ici, nous initialisons kmeans pour être l'algorithme KMeans, avec le paramètre requis du nombre de clusters (n_clusters).

kmeans = KMeans(n_clusters = 4)

Nous devons former le modèle K-means avec les données d'entrée.

kmeans.fit(X)
y_kmeans = kmeans.predict(X)
plt.scatter(X[:, 0], X[:, 1], c = y_kmeans, s = 50, cmap = 'viridis')

centers = kmeans.cluster_centers_

Le code donné ci-dessous nous aidera à tracer et à visualiser les résultats de la machine en fonction de nos données, et l'ajustement en fonction du nombre de clusters à trouver.

plt.scatter(centers[:, 0], centers[:, 1], c = 'black', s = 200, alpha = 0.5);
plt.show()

Algorithme de décalage moyen

C'est un autre algorithme de clustering populaire et puissant utilisé dans l'apprentissage non supervisé. Il ne fait aucune hypothèse, il s'agit donc d'un algorithme non paramétrique. Il est également appelé clustering hiérarchique ou analyse de cluster à décalage moyen. Les étapes suivantes seraient les étapes de base de cet algorithme -

  • Tout d'abord, nous devons commencer par les points de données affectés à un cluster qui leur est propre.

  • Désormais, il calcule les centres de gravité et met à jour l'emplacement des nouveaux centres de gravité.

  • En répétant ce processus, on rapproche le pic d'amas c'est-à-dire vers la région de densité la plus élevée.

  • Cet algorithme s'arrête au stade où les centres de gravité ne bougent plus.

Avec l'aide du code suivant, nous implémentons l'algorithme de clustering Mean Shift en Python. Nous allons utiliser le module Scikit-learn.

Importons les packages nécessaires -

import numpy as np
from sklearn.cluster import MeanShift
import matplotlib.pyplot as plt
from matplotlib import style
style.use("ggplot")

Le code suivant vous aidera à générer le jeu de données bidimensionnel, contenant quatre objets blob, en utilisant make_blob du sklearn.dataset paquet.

from sklearn.datasets.samples_generator import make_blobs

Nous pouvons visualiser l'ensemble de données avec le code suivant

centers = [[2,2],[4,5],[3,10]]
X, _ = make_blobs(n_samples = 500, centers = centers, cluster_std = 1)
plt.scatter(X[:,0],X[:,1])
plt.show()

Maintenant, nous devons former le modèle de cluster Mean Shift avec les données d'entrée.

ms = MeanShift()
ms.fit(X)
labels = ms.labels_
cluster_centers = ms.cluster_centers_

Le code suivant imprimera les centres de cluster et le nombre prévu de cluster selon les données d'entrée -

print(cluster_centers)
n_clusters_ = len(np.unique(labels))
print("Estimated clusters:", n_clusters_)
[[ 3.23005036 3.84771893]
[ 3.02057451 9.88928991]]
Estimated clusters: 2

Le code donné ci-dessous aidera à tracer et à visualiser les résultats de la machine en fonction de nos données, et l'ajustement en fonction du nombre de clusters à trouver.

colors = 10*['r.','g.','b.','c.','k.','y.','m.']
   for i in range(len(X)):
   plt.plot(X[i][0], X[i][1], colors[labels[i]], markersize = 10)
plt.scatter(cluster_centers[:,0],cluster_centers[:,1],
   marker = "x",color = 'k', s = 150, linewidths = 5, zorder = 10)
plt.show()

Mesure de la performance du clustering

Les données du monde réel ne sont pas naturellement organisées en nombre de clusters distinctifs. Pour cette raison, il n'est pas facile de visualiser et de tirer des inférences. C'est pourquoi nous devons mesurer la performance du clustering ainsi que sa qualité. Cela peut être fait à l'aide de l'analyse de la silhouette.

Analyse de la silhouette

Cette méthode peut être utilisée pour vérifier la qualité du clustering en mesurant la distance entre les clusters. Fondamentalement, il fournit un moyen d'évaluer les paramètres tels que le nombre de clusters en donnant un score de silhouette. Ce score est une métrique qui mesure la proximité de chaque point d'un cluster par rapport aux points des clusters voisins.

Analyse du score de silhouette

Le score a une plage de [-1, 1]. Voici l'analyse de ce score -

  • Score of +1 - Un score proche de +1 indique que l'échantillon est éloigné du cluster voisin.

  • Score of 0 - Le score 0 indique que l'échantillon est sur ou très proche de la limite de décision entre deux grappes voisines.

  • Score of -1 - Un score négatif indique que les échantillons ont été attribués aux mauvais groupes.

Calcul du score de silhouette

Dans cette section, nous allons apprendre à calculer le score de silhouette.

Le score de silhouette peut être calculé en utilisant la formule suivante -

$$ silhouette score = \ frac {\ left (pq \ right)} {max \ left (p, q \ right)} $$

Voici la distance moyenne aux points du cluster le plus proche dont le point de données ne fait pas partie. Et, est la distance intra-cluster moyenne à tous les points de son propre cluster.

Pour trouver le nombre optimal de clusters, nous devons exécuter à nouveau l'algorithme de clustering en important le metrics module du sklearnpaquet. Dans l'exemple suivant, nous exécuterons l'algorithme de clustering K-means pour trouver le nombre optimal de clusters -

Importez les packages nécessaires comme indiqué -

import matplotlib.pyplot as plt
import seaborn as sns; sns.set()
import numpy as np
from sklearn.cluster import KMeans

À l'aide du code suivant, nous allons générer le jeu de données bidimensionnel, contenant quatre blobs, en utilisant make_blob du sklearn.dataset paquet.

from sklearn.datasets.samples_generator import make_blobs

X, y_true = make_blobs(n_samples = 500, centers = 4, cluster_std = 0.40, random_state = 0)

Initialisez les variables comme indiqué -

scores = []
values = np.arange(2, 10)

Nous devons itérer le modèle K-means sur toutes les valeurs et également l'entraîner avec les données d'entrée.

for num_clusters in values:
kmeans = KMeans(init = 'k-means++', n_clusters = num_clusters, n_init = 10)
kmeans.fit(X)

Maintenant, estimez le score de silhouette pour le modèle de clustering actuel à l'aide de la métrique de distance euclidienne -

score = metrics.silhouette_score(X, kmeans.labels_,
metric = 'euclidean', sample_size = len(X))

La ligne de code suivante aidera à afficher le nombre de clusters ainsi que le score Silhouette.

print("\nNumber of clusters =", num_clusters)
print("Silhouette score =", score)
scores.append(score)

Vous recevrez la sortie suivante -

Number of clusters = 9
Silhouette score = 0.340391138371

num_clusters = np.argmax(scores) + values[0]
print('\nOptimal number of clusters =', num_clusters)

Maintenant, la sortie pour le nombre optimal de clusters serait la suivante -

Optimal number of clusters = 2

Trouver les voisins les plus proches

Si nous voulons créer des systèmes de recommandation tels qu'un système de recommandation de films, nous devons comprendre le concept de recherche des voisins les plus proches. C'est parce que le système de recommandation utilise le concept de voisins les plus proches.

le concept of finding nearest neighborspeut être défini comme le processus de recherche du point le plus proche du point d'entrée à partir de l'ensemble de données donné. L'utilisation principale de cet algorithme KNN) K-plus proche voisins) est de construire des systèmes de classification qui classifient un point de données sur la proximité du point de données d'entrée à diverses classes.

Le code Python ci-dessous aide à trouver les K voisins les plus proches d'un ensemble de données donné -

Importez les packages nécessaires comme indiqué ci-dessous. Ici, nous utilisons leNearestNeighbors module du sklearn paquet

import numpy as np
import matplotlib.pyplot as plt
from sklearn.neighbors import NearestNeighbors

Définissons maintenant les données d'entrée -

A = np.array([[3.1, 2.3], [2.3, 4.2], [3.9, 3.5], [3.7, 6.4], [4.8, 1.9], 
             [8.3, 3.1], [5.2, 7.5], [4.8, 4.7], [3.5, 5.1], [4.4, 2.9],])

Maintenant, nous devons définir les voisins les plus proches -

k = 3

Nous devons également donner les données de test à partir desquelles les voisins les plus proches doivent être trouvés -

test_data = [3.3, 2.9]

Le code suivant peut visualiser et tracer les données d'entrée définies par nous -

plt.figure()
plt.title('Input data')
plt.scatter(A[:,0], A[:,1], marker = 'o', s = 100, color = 'black')

Maintenant, nous devons construire le K Nearest Neighbor. L'objet doit également être formé

knn_model = NearestNeighbors(n_neighbors = k, algorithm = 'auto').fit(X)
distances, indices = knn_model.kneighbors([test_data])

Maintenant, nous pouvons imprimer les K voisins les plus proches comme suit

print("\nK Nearest Neighbors:")
for rank, index in enumerate(indices[0][:k], start = 1):
   print(str(rank) + " is", A[index])

Nous pouvons visualiser les voisins les plus proches avec le point de données de test

plt.figure()
plt.title('Nearest neighbors')
plt.scatter(A[:, 0], X[:, 1], marker = 'o', s = 100, color = 'k')
plt.scatter(A[indices][0][:][:, 0], A[indices][0][:][:, 1],
   marker = 'o', s = 250, color = 'k', facecolors = 'none')
plt.scatter(test_data[0], test_data[1],
   marker = 'x', s = 100, color = 'k')
plt.show()

Production

K Nearest Neighbors

1 is [ 3.1 2.3]
2 is [ 3.9 3.5]
3 is [ 4.4 2.9]

Classificateur K-Nearest Neighbours

Un classificateur KNN (K-Nearest Neighbours) est un modèle de classification qui utilise l'algorithme des voisins les plus proches pour classer un point de données donné. Nous avons implémenté l'algorithme KNN dans la dernière section, maintenant nous allons construire un classificateur KNN en utilisant cet algorithme.

Concept de classificateur KNN

Le concept de base de la classification K-plus proche voisin est de trouver un nombre prédéfini, c'est-à-dire le «k» - d'échantillons d'apprentissage les plus proches en distance d'un nouvel échantillon, qui doit être classé. Les nouveaux échantillons recevront leur étiquette des voisins eux-mêmes. Les classificateurs KNN ont une constante définie par l'utilisateur fixe pour le nombre de voisins qui doivent être déterminés. Pour la distance, la distance euclidienne standard est le choix le plus courant. Le classificateur KNN fonctionne directement sur les échantillons appris plutôt que de créer les règles d'apprentissage. L'algorithme KNN est l'un des plus simples de tous les algorithmes d'apprentissage automatique. Il a été assez réussi dans un grand nombre de problèmes de classification et de régression, par exemple, la reconnaissance de caractères ou l'analyse d'images.

Example

Nous construisons un classificateur KNN pour reconnaître les chiffres. Pour cela, nous utiliserons le jeu de données MNIST. Nous écrirons ce code dans le Jupyter Notebook.

Importez les packages nécessaires comme indiqué ci-dessous.

Ici, nous utilisons le KNeighborsClassifier module du sklearn.neighbors paquet -

from sklearn.datasets import *
import pandas as pd
%matplotlib inline
from sklearn.neighbors import KNeighborsClassifier
import matplotlib.pyplot as plt
import numpy as np

Le code suivant affichera l'image du chiffre pour vérifier quelle image nous devons tester -

def Image_display(i):
   plt.imshow(digit['images'][i],cmap = 'Greys_r')
   plt.show()

Maintenant, nous devons charger le jeu de données MNIST. En fait, il y a au total 1797 images, mais nous utilisons les 1600 premières images comme échantillon d'apprentissage et les 197 autres seraient conservées à des fins de test.

digit = load_digits()
digit_d = pd.DataFrame(digit['data'][0:1600])

Maintenant, en affichant les images, nous pouvons voir la sortie comme suit -

Image_display(0)

Affichage_image (0)

L'image de 0 s'affiche comme suit -

Affichage_image (9)

L'image de 9 s'affiche comme suit -

digit.keys ()

Nous devons maintenant créer l'ensemble de données d'entraînement et de test et fournir l'ensemble de données de test aux classificateurs KNN.

train_x = digit['data'][:1600]
train_y = digit['target'][:1600]
KNN = KNeighborsClassifier(20)
KNN.fit(train_x,train_y)

La sortie suivante créera le constructeur de classificateur K voisin le plus proche -

KNeighborsClassifier(algorithm = 'auto', leaf_size = 30, metric = 'minkowski',
   metric_params = None, n_jobs = 1, n_neighbors = 20, p = 2,
   weights = 'uniform')

Nous devons créer l'échantillon de test en fournissant tout nombre arbitraire supérieur à 1600, qui étaient les échantillons d'apprentissage.

test = np.array(digit['data'][1725])
test1 = test.reshape(1,-1)
Image_display(1725)

Affichage_image (6)

L'image de 6 s'affiche comme suit -

Nous allons maintenant prédire les données de test comme suit -

KNN.predict(test1)

Le code ci-dessus générera la sortie suivante -

array([6])

Maintenant, considérez ce qui suit -

digit['target_names']

Le code ci-dessus générera la sortie suivante -

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

Le traitement du langage naturel (PNL) fait référence à une méthode de communication par IA avec des systèmes intelligents utilisant un langage naturel tel que l'anglais.

Le traitement du langage naturel est nécessaire lorsque vous souhaitez qu'un système intelligent tel qu'un robot fonctionne selon vos instructions, lorsque vous souhaitez entendre la décision d'un système expert clinique basé sur le dialogue, etc.

Le domaine de la PNL consiste à faire des ordinateurs des tâches utiles avec les langages naturels que les humains utilisent. L'entrée et la sortie d'un système NLP peuvent être -

  • Speech
  • Texte écrit

Composantes de la PNL

Dans cette section, nous découvrirons les différents composants de la PNL. Il existe deux composants de la PNL. Les composants sont décrits ci-dessous -

Compréhension du langage naturel (NLU)

Cela implique les tâches suivantes -

  • Cartographie de l'entrée donnée en langage naturel en représentations utiles.

  • Analyser différents aspects de la langue.

Génération du langage naturel (NLG)

C'est le processus de production d'expressions et de phrases significatives sous forme de langage naturel à partir d'une représentation interne. Cela implique -

  • Text planning - Cela inclut la récupération du contenu pertinent de la base de connaissances.

  • Sentence planning - Cela comprend le choix des mots requis, la formation de phrases significatives, la définition du ton de la phrase.

  • Text Realization - Il s'agit de mapper le plan de phrase en structure de phrase.

Difficultés en NLU

Le NLU est très riche en forme et en structure; cependant, il est ambigu. Il peut y avoir différents niveaux d'ambiguïté -

Ambiguïté lexicale

C'est à un niveau très primitif tel que le niveau des mots. Par exemple, traiter le mot «planche» comme un nom ou un verbe?

Ambiguïté au niveau de la syntaxe

Une phrase peut être analysée de différentes manières. Par exemple, "Il a soulevé le scarabée avec un bonnet rouge." - A-t-il utilisé une casquette pour soulever le scarabée ou il a soulevé un scarabée qui avait une casquette rouge?

Ambiguïté référentielle

Se référant à quelque chose utilisant des pronoms. Par exemple, Rima est allée à Gauri. Elle a dit: «Je suis fatiguée.» - Qui est fatigué exactement?

Terminologie PNL

Voyons maintenant quelques termes importants de la terminologie PNL.

  • Phonology - C'est l'étude de l'organisation du son systématiquement.

  • Morphology - C'est une étude de la construction de mots à partir d'unités primitives significatives.

  • Morpheme - C'est une unité primitive de sens dans une langue.

  • Syntax- Cela fait référence à l'arrangement des mots pour faire une phrase. Il s'agit également de déterminer le rôle structurel des mots dans la phrase et dans les phrases.

  • Semantics - Il s'intéresse à la signification des mots et à la manière de combiner les mots en phrases et phrases significatives.

  • Pragmatics - Il traite de l'utilisation et de la compréhension des phrases dans différentes situations et de la manière dont l'interprétation de la phrase est affectée.

  • Discourse - Il traite de la façon dont la phrase immédiatement précédente peut affecter l'interprétation de la phrase suivante.

  • World Knowledge - Il comprend les connaissances générales sur le monde.

Étapes de la PNL

Cette section présente les différentes étapes de la PNL.

Analyse lexicale

Il s'agit d'identifier et d'analyser la structure des mots. Lexique d'une langue désigne l'ensemble des mots et des phrases d'une langue. L'analyse lexicale divise l'ensemble du txt en paragraphes, phrases et mots.

Analyse syntaxique (analyse syntaxique)

Cela implique l'analyse des mots dans la phrase pour la grammaire et l'organisation des mots d'une manière qui montre la relation entre les mots. La phrase telle que «L'école va au garçon» est rejetée par l'analyseur syntaxique anglais.

Analyse sémantique

Il tire la signification exacte ou la signification du dictionnaire du texte. La signification du texte est vérifiée. Cela se fait en mappant des structures syntaxiques et des objets dans le domaine de la tâche. L'analyseur sémantique ne tient pas compte des phrases telles que «crème glacée chaude».

Intégration du discours

Le sens de toute phrase dépend du sens de la phrase juste avant elle. En outre, il apporte également le sens de la phrase immédiatement suivante.

Analyse pragmatique

Pendant ce temps, ce qui a été dit est réinterprété sur ce que cela signifiait réellement. Il s'agit de dériver les aspects de la langue qui nécessitent une connaissance du monde réel.

Dans ce chapitre, nous allons apprendre comment démarrer avec le package de boîte à outils en langage naturel.

Prérequis

Si nous voulons créer des applications avec un traitement en langage naturel, le changement de contexte rend la tâche plus difficile. Le facteur de contexte influence la manière dont la machine comprend une phrase particulière. Par conséquent, nous devons développer des applications en langage naturel en utilisant des approches d'apprentissage automatique afin que la machine puisse également comprendre la façon dont un humain peut comprendre le contexte.

Pour créer de telles applications, nous utiliserons le package Python appelé NLTK (Natural Language Toolkit Package).

Importer NLTK

Nous devons installer NLTK avant de l'utiliser. Il peut être installé à l'aide de la commande suivante -

pip install nltk

Pour créer un package conda pour NLTK, utilisez la commande suivante -

conda install -c anaconda nltk

Maintenant, après avoir installé le package NLTK, nous devons l'importer via l'invite de commande python. Nous pouvons l'importer en écrivant la commande suivante sur l'invite de commande Python -

>>> import nltk

Téléchargement des données de NLTK

Maintenant, après l'importation de NLTK, nous devons télécharger les données requises. Cela peut être fait à l'aide de la commande suivante sur l'invite de commande Python -

>>> nltk.download()

Installation d'autres packages nécessaires

Pour créer des applications de traitement du langage naturel à l'aide de NLTK, nous devons installer les packages nécessaires. Les packages sont les suivants -

gensim

C'est une bibliothèque de modélisation sémantique robuste qui est utile pour de nombreuses applications. Nous pouvons l'installer en exécutant la commande suivante -

pip install gensim

modèle

Il est utilisé pour faire gensimle package fonctionne correctement. Nous pouvons l'installer en exécutant la commande suivante

pip install pattern

Concept de tokenisation, de stemming et de lemmatisation

Dans cette section, nous comprendrons ce qu'est la tokenisation, la racine et la lemmatisation.

Tokenisation

Il peut être défini comme le processus de fractionnement du texte donné, c'est-à-dire la séquence de caractères en unités plus petites appelées jetons. Les jetons peuvent être des mots, des chiffres ou des signes de ponctuation. Il est également appelé segmentation de mots. Voici un exemple simple de tokenisation -

Input - La mangue, la banane, l'ananas et la pomme sont tous des fruits.

Output -

Le processus de rupture du texte donné peut être effectué à l'aide de la localisation des limites des mots. La fin d'un mot et le début d'un nouveau mot sont appelés limites de mots. Le système d'écriture et la structure typographique des mots influencent les frontières.

Dans le module Python NLTK, nous avons différents packages liés à la tokenisation que nous pouvons utiliser pour diviser le texte en jetons selon nos besoins. Certains des packages sont les suivants -

Paquet sent_tokenize

Comme son nom l'indique, ce package divisera le texte d'entrée en phrases. Nous pouvons importer ce package à l'aide du code Python suivant -

from nltk.tokenize import sent_tokenize

package word_tokenize

Ce package divise le texte d'entrée en mots. Nous pouvons importer ce package à l'aide du code Python suivant -

from nltk.tokenize import word_tokenize

Package WordPunctTokenizer

Ce package divise le texte d'entrée en mots ainsi que les signes de ponctuation. Nous pouvons importer ce package à l'aide du code Python suivant -

from nltk.tokenize import WordPuncttokenizer

Tige

En travaillant avec des mots, nous rencontrons de nombreuses variations pour des raisons grammaticales. Le concept de variations signifie ici que nous devons traiter différentes formes des mêmes mots commedemocracy, democratic, et democratization. Il est très nécessaire que les machines comprennent que ces différents mots ont la même forme de base. De cette manière, il serait utile d'extraire les formes de base des mots pendant que nous analysons le texte.

Nous pouvons y parvenir en stoppant. De cette manière, nous pouvons dire que la radicalisation est le processus heuristique d'extraction des formes de base des mots en coupant les extrémités des mots.

Dans le module Python NLTK, nous avons différents packages liés à la tige. Ces packages peuvent être utilisés pour obtenir les formes de mot de base. Ces packages utilisent des algorithmes. Certains des packages sont les suivants -

Forfait PorterStemmer

Ce package Python utilise l'algorithme de Porter pour extraire le formulaire de base. Nous pouvons importer ce package à l'aide du code Python suivant -

from nltk.stem.porter import PorterStemmer

Par exemple, si nous donnons le mot ‘writing’ en tant que contribution à cela, nous obtiendrons le mot ‘write’ après la tige.

Forfait LancasterStemmer

Ce package Python utilisera l'algorithme de Lancaster pour extraire le formulaire de base. Nous pouvons importer ce package à l'aide du code Python suivant -

from nltk.stem.lancaster import LancasterStemmer

Par exemple, si nous donnons le mot ‘writing’ en tant que contribution à cela, nous obtiendrons le mot ‘write’ après la tige.

Forfait SnowballStemmer

Ce package Python utilisera l'algorithme de la boule de neige pour extraire le formulaire de base. Nous pouvons importer ce package à l'aide du code Python suivant -

from nltk.stem.snowball import SnowballStemmer

Par exemple, si nous donnons le mot ‘writing’ en tant que contribution à cela, nous obtiendrons le mot ‘write’ après la tige.

Tous ces algorithmes ont un niveau de rigueur différent. Si nous comparons ces trois embouts, alors les embouts Porter sont les moins stricts et Lancaster est le plus strict. La tige de boule de neige est bonne à utiliser en termes de vitesse et de rigueur.

Lemmatisation

On peut également extraire la forme de base des mots par lemmatisation. Il accomplit essentiellement cette tâche en utilisant un vocabulaire et une analyse morphologique des mots, visant normalement à supprimer uniquement les fins flexionnelles. Ce type de forme de base de tout mot est appelé lemme.

La principale différence entre la radicalisation et la lemmatisation est l'utilisation du vocabulaire et l'analyse morphologique des mots. Une autre différence est que la racine réduit le plus souvent les mots liés par dérivation alors que la lemmatisation ne fait généralement que réduire les différentes formes flexionnelles d'un lemme. Par exemple, si nous fournissons le mot vu comme mot d'entrée, la racine pourrait renvoyer le mot «s» mais la lemmatisation tenterait de renvoyer le mot voir ou voir selon que l'utilisation du jeton était un verbe ou un nom.

Dans le module Python NLTK, nous avons le package suivant lié au processus de lemmatisation que nous pouvons utiliser pour obtenir les formes de base du mot -

Package WordNetLemmatizer

Ce package Python extraira la forme de base du mot selon qu'il est utilisé comme nom ou comme verbe. Nous pouvons importer ce package à l'aide du code Python suivant -

from nltk.stem import WordNetLemmatizer

Chunking: diviser les données en morceaux

C'est l'un des processus importants du traitement du langage naturel. Le travail principal de la segmentation est d'identifier les parties du discours et les phrases courtes comme les phrases nominales. Nous avons déjà étudié le processus de tokenisation, la création de tokens. La segmentation est essentiellement l'étiquetage de ces jetons. En d'autres termes, la segmentation nous montrera la structure de la phrase.

Dans la section suivante, nous découvrirons les différents types de Chunking.

Types de segmentation

Il existe deux types de segmentation. Les types sont les suivants -

Chunking up

Dans ce processus de découpage, l'objet, les choses, etc. évoluent vers un caractère plus général et le langage devient plus abstrait. Il y a plus de chances d'accord. Dans ce processus, nous effectuons un zoom arrière. Par exemple, si nous décomposons la question «à quoi servent les voitures»? Nous pouvons obtenir la réponse «transport».

Réduire

Dans ce processus de découpage, l'objet, les choses, etc. évoluent vers une plus grande spécificité et le langage est plus pénétré. La structure plus profonde serait examinée en morceaux. Dans ce processus, nous faisons un zoom avant. Par exemple, si nous réduisons la question «Parlez spécifiquement d'une voiture»? Nous obtiendrons des informations plus petites sur la voiture.

Example

Dans cet exemple, nous allons faire du segment Noun-Phrase, une catégorie de segmentation qui trouvera les morceaux de phrases nominales dans la phrase, en utilisant le module NLTK en Python -

Follow these steps in python for implementing noun phrase chunking −

Step 1- Dans cette étape, nous devons définir la grammaire de la segmentation. Cela comprendrait les règles que nous devons suivre.

Step 2- Dans cette étape, nous devons créer un analyseur de blocs. Il analyserait la grammaire et donnerait la sortie.

Step 3 - Dans cette dernière étape, la sortie est produite dans un format arborescent.

Importons le package NLTK nécessaire comme suit -

import nltk

Maintenant, nous devons définir la phrase. Ici, DT signifie le déterminant, VBP signifie le verbe, JJ signifie l'adjectif, IN signifie la préposition et NN signifie le nom.

sentence=[("a","DT"),("clever","JJ"),("fox","NN"),("was","VBP"),
          ("jumping","VBP"),("over","IN"),("the","DT"),("wall","NN")]

Maintenant, nous devons donner la grammaire. Ici, nous donnerons la grammaire sous forme d'expression régulière.

grammar = "NP:{<DT>?<JJ>*<NN>}"

Nous devons définir un analyseur qui analysera la grammaire.

parser_chunking = nltk.RegexpParser(grammar)

L'analyseur analyse la phrase comme suit -

parser_chunking.parse(sentence)

Ensuite, nous devons obtenir la sortie. La sortie est générée dans la variable simple appeléeoutput_chunk.

Output_chunk = parser_chunking.parse(sentence)

Lors de l'exécution du code suivant, nous pouvons dessiner notre sortie sous la forme d'un arbre.

output.draw()

Modèle Bag of Word (BoW)

Bag of Word (BoW), un modèle de traitement du langage naturel, est essentiellement utilisé pour extraire les caractéristiques du texte afin que le texte puisse être utilisé dans la modélisation, comme dans les algorithmes d'apprentissage automatique.

Maintenant, la question se pose de savoir pourquoi nous devons extraire les fonctionnalités du texte. C'est parce que les algorithmes d'apprentissage automatique ne peuvent pas fonctionner avec des données brutes et qu'ils ont besoin de données numériques pour pouvoir en extraire des informations significatives. La conversion de données texte en données numériques est appelée extraction de caractéristiques ou codage de caractéristiques.

Comment ça fonctionne

Il s'agit d'une approche très simple pour extraire les fonctionnalités du texte. Supposons que nous ayons un document texte et que nous voulions le convertir en données numériques ou disons vouloir en extraire les caractéristiques, puis tout d'abord ce modèle extrait un vocabulaire de tous les mots du document. Ensuite, en utilisant une matrice de termes de document, il construira un modèle. De cette manière, BoW représente le document comme un sac de mots uniquement. Toutes les informations sur l'ordre ou la structure des mots dans le document sont supprimées.

Concept de matrice de termes de document

L'algorithme BoW construit un modèle à l'aide de la matrice des termes du document. Comme son nom l'indique, la matrice des termes du document est la matrice des différents nombres de mots présents dans le document. À l'aide de cette matrice, le document texte peut être représenté comme une combinaison pondérée de différents mots. En définissant le seuil et en choisissant les mots les plus significatifs, nous pouvons construire un histogramme de tous les mots des documents pouvant être utilisés comme vecteur de caractéristiques. Voici un exemple pour comprendre le concept de matrice de termes de document -

Example

Supposons que nous ayons les deux phrases suivantes -

  • Sentence 1 - Nous utilisons le modèle Bag of Words.

  • Sentence 2 - Le modèle Bag of Words est utilisé pour extraire les fonctionnalités.

Maintenant, en considérant ces deux phrases, nous avons les 13 mots distincts suivants -

  • we
  • are
  • using
  • the
  • bag
  • of
  • words
  • model
  • is
  • used
  • for
  • extracting
  • features

Maintenant, nous devons construire un histogramme pour chaque phrase en utilisant le nombre de mots dans chaque phrase -

  • Sentence 1 - [1,1,1,1,1,1,1,1,0,0,0,0,0]

  • Sentence 2 - [0,0,0,1,1,1,1,1,1,1,1,1,1]

De cette façon, nous avons les vecteurs de caractéristiques qui ont été extraits. Chaque vecteur de caractéristiques a 13 dimensions car nous avons 13 mots distincts.

Concept des statistiques

Le concept des statistiques est appelé TermFrequency-Inverse Document Frequency (tf-idf). Chaque mot est important dans le document. Les statistiques nous aident à comprendre l'importance de chaque mot.

Fréquence des termes (tf)

C'est la mesure de la fréquence à laquelle chaque mot apparaît dans un document. Il peut être obtenu en divisant le nombre de chaque mot par le nombre total de mots dans un document donné.

Fréquence inverse des documents (idf)

C'est la mesure de l'unicité d'un mot à ce document dans l'ensemble de documents donné. Pour calculer idf et formuler un vecteur de caractéristiques distinctives, nous devons réduire le poids des mots courants comme le et peser les mots rares.

Construire un modèle de sac de mots en NLTK

Dans cette section, nous définirons une collection de chaînes en utilisant CountVectorizer pour créer des vecteurs à partir de ces phrases.

Importons le package nécessaire -

from sklearn.feature_extraction.text import CountVectorizer

Définissez maintenant l'ensemble des phrases.

Sentences = ['We are using the Bag of Word model', 'Bag of Word model is
           used for extracting the features.']

vectorizer_count = CountVectorizer()

features_text = vectorizer.fit_transform(Sentences).todense()

print(vectorizer.vocabulary_)

Le programme ci-dessus génère la sortie comme indiqué ci-dessous. Cela montre que nous avons 13 mots distincts dans les deux phrases ci-dessus -

{'we': 11, 'are': 0, 'using': 10, 'the': 8, 'bag': 1, 'of': 7,
 'word': 12, 'model': 6, 'is': 5, 'used': 9, 'for': 4, 'extracting': 2, 'features': 3}

Ce sont les vecteurs de caractéristiques (texte sous forme numérique) qui peuvent être utilisés pour l'apprentissage automatique.

Résoudre les problèmes

Dans cette section, nous allons résoudre quelques problèmes connexes.

Prédiction de catégorie

Dans un ensemble de documents, non seulement les mots mais la catégorie des mots sont également importants; dans quelle catégorie de texte appartient un mot particulier. Par exemple, nous voulons prédire si une phrase donnée appartient à la catégorie email, news, sports, ordinateur, etc. Dans l'exemple suivant, nous allons utiliser tf-idf pour formuler un vecteur de caractéristiques afin de trouver la catégorie de documents. Nous utiliserons les données de 20 jeux de données de groupes de discussion de sklearn.

Nous devons importer les packages nécessaires -

from sklearn.datasets import fetch_20newsgroups
from sklearn.naive_bayes import MultinomialNB
from sklearn.feature_extraction.text import TfidfTransformer
from sklearn.feature_extraction.text import CountVectorizer

Définissez la carte des catégories. Nous utilisons cinq catégories différentes appelées Religion, Autos, Sports, Electronique et Espace.

category_map = {'talk.religion.misc':'Religion','rec.autos''Autos',
   'rec.sport.hockey':'Hockey','sci.electronics':'Electronics', 'sci.space': 'Space'}

Créer l'ensemble d'entraînement -

training_data = fetch_20newsgroups(subset = 'train',
   categories = category_map.keys(), shuffle = True, random_state = 5)

Construisez un vectoriseur de comptage et extrayez le terme comptage -

vectorizer_count = CountVectorizer()
train_tc = vectorizer_count.fit_transform(training_data.data)
print("\nDimensions of training data:", train_tc.shape)

Le transformateur tf-idf est créé comme suit -

tfidf = TfidfTransformer()
train_tfidf = tfidf.fit_transform(train_tc)

Maintenant, définissez les données de test -

input_data = [
   'Discovery was a space shuttle',
   'Hindu, Christian, Sikh all are religions',
   'We must have to drive safely',
   'Puck is a disk made of rubber',
   'Television, Microwave, Refrigrated all uses electricity'
]

Les données ci-dessus nous aideront à former un classificateur multinomial Naive Bayes -

classifier = MultinomialNB().fit(train_tfidf, training_data.target)

Transformez les données d'entrée à l'aide du vectoriseur de comptage -

input_tc = vectorizer_count.transform(input_data)

Maintenant, nous allons transformer les données vectorisées en utilisant le transformateur tfidf -

input_tfidf = tfidf.transform(input_tc)

Nous allons prédire les catégories de sortie -

predictions = classifier.predict(input_tfidf)

La sortie est générée comme suit -

for sent, category in zip(input_data, predictions):
   print('\nInput Data:', sent, '\n Category:', \
      category_map[training_data.target_names[category]])

Le prédicteur de catégorie génère la sortie suivante -

Dimensions of training data: (2755, 39297)

Input Data: Discovery was a space shuttle
Category: Space

Input Data: Hindu, Christian, Sikh all are religions
Category: Religion

Input Data: We must have to drive safely
Category: Autos

Input Data: Puck is a disk made of rubber
Category: Hockey

Input Data: Television, Microwave, Refrigrated all uses electricity
Category: Electronics

Recherche de genre

Dans cet énoncé de problème, un classificateur serait formé pour trouver le sexe (masculin ou féminin) en fournissant les noms. Nous devons utiliser une heuristique pour construire un vecteur de caractéristiques et entraîner le classificateur. Nous utiliserons les données étiquetées du package scikit-learn. Voici le code Python pour créer un chercheur de genre -

Importons les packages nécessaires -

import random

from nltk import NaiveBayesClassifier
from nltk.classify import accuracy as nltk_accuracy
from nltk.corpus import names

Nous devons maintenant extraire les N dernières lettres du mot d'entrée. Ces lettres agiront comme des caractéristiques -

def extract_features(word, N = 2):
   last_n_letters = word[-N:]
   return {'feature': last_n_letters.lower()}
	
if __name__=='__main__':

Créez les données d'entraînement en utilisant les noms étiquetés (hommes et femmes) disponibles dans NLTK -

male_list = [(name, 'male') for name in names.words('male.txt')]
female_list = [(name, 'female') for name in names.words('female.txt')]
data = (male_list + female_list)

random.seed(5)
random.shuffle(data)

Maintenant, les données de test seront créées comme suit -

namesInput = ['Rajesh', 'Gaurav', 'Swati', 'Shubha']

Définissez le nombre d'échantillons utilisés pour former et tester avec le code suivant

train_sample = int(0.8 * len(data))

Maintenant, nous devons parcourir différentes longueurs pour que la précision puisse être comparée -

for i in range(1, 6):
   print('\nNumber of end letters:', i)
   features = [(extract_features(n, i), gender) for (n, gender) in data]
   train_data, test_data = features[:train_sample],
features[train_sample:]
   classifier = NaiveBayesClassifier.train(train_data)

La précision du classificateur peut être calculée comme suit -

accuracy_classifier = round(100 * nltk_accuracy(classifier, test_data), 2)
   print('Accuracy = ' + str(accuracy_classifier) + '%')

Maintenant, nous pouvons prédire la sortie -

for name in namesInput:
   print(name, '==>', classifier.classify(extract_features(name, i)))

Le programme ci-dessus générera la sortie suivante -

Number of end letters: 1
Accuracy = 74.7%
Rajesh -> female
Gaurav -> male
Swati -> female
Shubha -> female

Number of end letters: 2
Accuracy = 78.79%
Rajesh -> male
Gaurav -> male
Swati -> female
Shubha -> female

Number of end letters: 3
Accuracy = 77.22%
Rajesh -> male
Gaurav -> female
Swati -> female
Shubha -> female

Number of end letters: 4
Accuracy = 69.98%
Rajesh -> female
Gaurav -> female
Swati -> female
Shubha -> female

Number of end letters: 5
Accuracy = 64.63%
Rajesh -> female
Gaurav -> female
Swati -> female
Shubha -> female

Dans la sortie ci-dessus, nous pouvons voir que la précision du nombre maximum de lettres de fin est de deux et qu'elle diminue à mesure que le nombre de lettres de fin augmente.

Modélisation de sujets: identification des modèles dans les données texte

Nous savons que les documents sont généralement regroupés en thèmes. Parfois, nous devons identifier les modèles dans un texte qui correspondent à un sujet particulier. La technique pour faire cela s'appelle la modélisation de sujets. En d'autres termes, nous pouvons dire que la modélisation de sujets est une technique pour découvrir des thèmes abstraits ou une structure cachée dans un ensemble de documents donné.

Nous pouvons utiliser la technique de modélisation de sujet dans les scénarios suivants -

Classification du texte

À l'aide de la modélisation de sujets, la classification peut être améliorée car elle regroupe des mots similaires plutôt que d'utiliser chaque mot séparément comme une caractéristique.

Systèmes de recommandation

À l'aide de la modélisation de sujets, nous pouvons créer les systèmes de recommandation en utilisant des mesures de similarité.

Algorithmes pour la modélisation de sujets

La modélisation de sujet peut être implémentée à l'aide d'algorithmes. Les algorithmes sont les suivants -

Allocation de Dirichlet Latent (LDA)

Cet algorithme est le plus populaire pour la modélisation de sujets. Il utilise les modèles graphiques probabilistes pour la mise en œuvre de la modélisation thématique. Nous devons importer le package gensim en Python pour utiliser le slgorithme LDA.

Analyse sémantique latente (LDA) ou indexation sémantique latente (LSI)

Cet algorithme est basé sur l'algèbre linéaire. Fondamentalement, il utilise le concept de SVD (Singular Value Decomposition) sur la matrice des termes du document.

Factorisation matricielle non négative (NMF)

Il est également basé sur l'algèbre linéaire.

Tous les algorithmes mentionnés ci-dessus pour la modélisation de sujets auraient le number of topics en paramètre, Document-Word Matrix comme entrée et WTM (Word Topic Matrix) & TDM (Topic Document Matrix) comme sortie.

Prédire le suivant dans une séquence d'entrée donnée est un autre concept important de l'apprentissage automatique. Ce chapitre vous donne une explication détaillée sur l'analyse des données de séries chronologiques.

introduction

Les données de série chronologique désignent les données qui se trouvent dans une série d'intervalles de temps particuliers. Si nous voulons créer une prédiction de séquence dans l'apprentissage automatique, nous devons gérer des données séquentielles et du temps. Les données de série sont un résumé des données séquentielles. L'ordre des données est une caractéristique importante des données séquentielles.

Concept de base de l'analyse de séquence ou de l'analyse des séries chronologiques

L'analyse de séquence ou l'analyse de séries chronologiques consiste à prédire le suivant dans une séquence d'entrée donnée en fonction de l'observation précédente. La prédiction peut porter sur tout ce qui peut venir: un symbole, un nombre, la météo du lendemain, le prochain terme de discours, etc. L'analyse de séquence peut être très pratique dans des applications telles que l'analyse boursière, les prévisions météorologiques et les recommandations de produits.

Example

Prenons l'exemple suivant pour comprendre la prédiction de séquence. IciA,B,C,D sont les valeurs données et vous devez prédire la valeur E en utilisant un modèle de prédiction de séquence.

Installer des packages utiles

Pour l'analyse des données de séries chronologiques à l'aide de Python, nous devons installer les packages suivants -

Pandas

Pandas est une bibliothèque open source sous licence BSD qui fournit des outils haute performance, faciles à utiliser la structure de données et d'analyse de données pour Python. Vous pouvez installer Pandas à l'aide de la commande suivante -

pip install pandas

Si vous utilisez Anaconda et que vous souhaitez installer en utilisant le conda gestionnaire de packages, vous pouvez utiliser la commande suivante -

conda install -c anaconda pandas

hmmlearn

Il s'agit d'une bibliothèque open source sous licence BSD qui se compose d'algorithmes et de modèles simples pour apprendre les modèles de Markov cachés (HMM) en Python. Vous pouvez l'installer à l'aide de la commande suivante -

pip install hmmlearn

Si vous utilisez Anaconda et que vous souhaitez installer en utilisant le conda gestionnaire de packages, vous pouvez utiliser la commande suivante -

conda install -c omnia hmmlearn

PyStruct

Il s'agit d'une bibliothèque d'apprentissage et de prédiction structurée. Les algorithmes d'apprentissage implémentés dans PyStruct ont des noms tels que les champs aléatoires conditionnels (CRF), les réseaux aléatoires de Markov à marge maximale (M3N) ou les machines vectorielles de support structurel. Vous pouvez l'installer à l'aide de la commande suivante -

pip install pystruct

CVXOPT

Il est utilisé pour l'optimisation convexe basée sur le langage de programmation Python. C'est aussi un progiciel gratuit. Vous pouvez l'installer à l'aide de la commande suivante -

pip install cvxopt

Si vous utilisez Anaconda et que vous souhaitez installer en utilisant le conda gestionnaire de packages, vous pouvez utiliser la commande suivante -

conda install -c anaconda cvdoxt

Pandas: gestion, découpage et extraction de statistiques à partir de données de séries chronologiques

Pandas est un outil très utile si vous devez travailler avec des données de séries chronologiques. Avec l'aide de Pandas, vous pouvez effectuer les opérations suivantes -

  • Créez une plage de dates à l'aide du pd.date_range paquet

  • Indexez les pandas avec des dates en utilisant le pd.Series paquet

  • Rééchantillonner en utilisant le ts.resample paquet

  • Changer la fréquence

Exemple

L'exemple suivant montre comment gérer et découper les données de séries chronologiques à l'aide de Pandas. Notez qu'ici, nous utilisons les données mensuelles d'oscillation arctique, qui peuvent être téléchargées à partir de Monthly.ao.index.b50.current.ascii et peuvent être converties au format texte pour notre utilisation.

Gestion des données de séries chronologiques

Pour gérer les données de séries chronologiques, vous devrez effectuer les étapes suivantes -

La première étape consiste à importer les packages suivants -

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

Ensuite, définissez une fonction qui lira les données du fichier d'entrée, comme indiqué dans le code ci-dessous -

def read_data(input_file):
   input_data = np.loadtxt(input_file, delimiter = None)

Maintenant, convertissez ces données en séries chronologiques. Pour cela, créez la plage de dates de notre série chronologique. Dans cet exemple, nous conservons un mois comme fréquence de données. Notre fichier contient les données qui commencent à partir de janvier 1950.

dates = pd.date_range('1950-01', periods = input_data.shape[0], freq = 'M')

Dans cette étape, nous créons les données de séries chronologiques à l'aide de Pandas Series, comme indiqué ci-dessous -

output = pd.Series(input_data[:, index], index = dates)	
return output
	
if __name__=='__main__':

Entrez le chemin du fichier d'entrée comme indiqué ici -

input_file = "/Users/admin/AO.txt"

Maintenant, convertissez la colonne au format de série temporelle, comme indiqué ici -

timeseries = read_data(input_file)

Enfin, tracez et visualisez les données à l'aide des commandes affichées -

plt.figure()
timeseries.plot()
plt.show()

Vous observerez les parcelles comme indiqué dans les images suivantes -

Découpage des données de séries chronologiques

Le découpage consiste à ne récupérer qu'une partie des données de la série chronologique. Dans le cadre de l'exemple, nous découpons les données uniquement de 1980 à 1990. Observez le code suivant qui effectue cette tâche -

timeseries['1980':'1990'].plot()
   <matplotlib.axes._subplots.AxesSubplot at 0xa0e4b00>

plt.show()

Lorsque vous exécutez le code pour découper les données de la série chronologique, vous pouvez observer le graphique suivant comme indiqué dans l'image ici -

Extraction de statistiques à partir de données de séries chronologiques

Vous devrez extraire des statistiques à partir d'une donnée donnée, dans les cas où vous devez tirer des conclusions importantes. La moyenne, la variance, la corrélation, la valeur maximale et la valeur minimale font partie de ces statistiques. Vous pouvez utiliser le code suivant si vous souhaitez extraire de telles statistiques à partir d'une série chronologique donnée -

Signifier

Vous pouvez utiliser le mean() fonction, pour trouver la moyenne, comme indiqué ici -

timeseries.mean()

Ensuite, la sortie que vous observerez pour l'exemple discuté est -

-0.11143128165238671

Maximum

Vous pouvez utiliser le max() fonction, pour trouver le maximum, comme indiqué ici -

timeseries.max()

Ensuite, la sortie que vous observerez pour l'exemple discuté est -

3.4952999999999999

Le minimum

Vous pouvez utiliser la fonction min (), pour trouver le minimum, comme indiqué ici -

timeseries.min()

Ensuite, la sortie que vous observerez pour l'exemple discuté est -

-4.2656999999999998

Tout obtenir en même temps

Si vous souhaitez calculer toutes les statistiques à la fois, vous pouvez utiliser le describe() fonction comme indiqué ici -

timeseries.describe()

Ensuite, la sortie que vous observerez pour l'exemple discuté est -

count   817.000000
mean     -0.111431
std       1.003151
min      -4.265700
25%      -0.649430
50%      -0.042744
75%       0.475720
max       3.495300
dtype: float64

Rééchantillonnage

Vous pouvez rééchantillonner les données à une fréquence de temps différente. Les deux paramètres pour effectuer le rééchantillonnage sont -

  • Période de temps
  • Method

Rééchantillonnage avec moyenne ()

Vous pouvez utiliser le code suivant pour rééchantillonner les données avec la méthode mean (), qui est la méthode par défaut -

timeseries_mm = timeseries.resample("A").mean()
timeseries_mm.plot(style = 'g--')
plt.show()

Ensuite, vous pouvez observer le graphique suivant comme la sortie du rééchantillonnage à l'aide de mean () -

Rééchantillonnage avec médiane ()

Vous pouvez utiliser le code suivant pour rééchantillonner les données à l'aide du median()méthode -

timeseries_mm = timeseries.resample("A").median()
timeseries_mm.plot()
plt.show()

Ensuite, vous pouvez observer le graphique suivant comme la sortie du ré-échantillonnage avec median () -

Rolling Mean

Vous pouvez utiliser le code suivant pour calculer la moyenne de roulement (mobile) -

timeseries.rolling(window = 12, center = False).mean().plot(style = '-g')
plt.show()

Ensuite, vous pouvez observer le graphique suivant comme la sortie de la moyenne de roulement (mobile) -

Analyse des données séquentielles par modèle de Markov caché (HMM)

HMM est un modèle statistique largement utilisé pour les données ayant une continuité et une extensibilité telles que l'analyse du marché boursier de séries chronologiques, le bilan de santé et la reconnaissance vocale. Cette section traite en détail de l'analyse des données séquentielles à l'aide du modèle de Markov caché (HMM).

Modèle de Markov caché (HMM)

HMM est un modèle stochastique basé sur le concept de chaîne de Markov basé sur l'hypothèse que la probabilité de futures statistiques dépend uniquement de l'état actuel du processus plutôt que de tout état qui l'a précédé. Par exemple, lorsque vous lancez une pièce, nous ne pouvons pas dire que le résultat du cinquième tirage sera une tête. En effet, une pièce n'a pas de mémoire et le résultat suivant ne dépend pas du résultat précédent.

Mathématiquement, HMM se compose des variables suivantes -

États (S)

C'est un ensemble d'états cachés ou latents présents dans un HMM. Il est noté S.

Symboles de sortie (O)

Il s'agit d'un ensemble de symboles de sortie possibles présents dans un HMM. Il est noté O.

Matrice de probabilité de transition d'état (A)

C'est la probabilité de faire la transition d'un état à chacun des autres états. Il est noté A.

Matrice de probabilité d'émission d'observation (B)

C'est la probabilité d'émettre / d'observer un symbole dans un état particulier. Il est noté B.

Matrice de probabilité antérieure (Π)

C'est la probabilité de démarrer à un état particulier à partir de divers états du système. Il est noté Π.

Par conséquent, un HMM peut être défini comme = (S,O,A,B,),

où,

  • S = {s1,s2,…,sN} est un ensemble de N états possibles,
  • O = {o1,o2,…,oM} est un ensemble de M symboles d'observation possibles,
  • A est un NN matrice de probabilité de transition d'état (TPM),
  • B est un NM observation ou matrice de probabilité d'émission (EPM),
  • π est un vecteur de distribution de probabilité d'état initial à N dimensions.

Exemple: analyse des données boursières

Dans cet exemple, nous allons analyser les données du marché boursier, étape par étape, pour avoir une idée du fonctionnement du HMM avec des données séquentielles ou chronologiques. Veuillez noter que nous implémentons cet exemple en Python.

Importez les packages nécessaires comme indiqué ci-dessous -

import datetime
import warnings

Maintenant, utilisez les données boursières du matpotlib.finance paquet, comme indiqué ici -

import numpy as np
from matplotlib import cm, pyplot as plt
from matplotlib.dates import YearLocator, MonthLocator
try:
   from matplotlib.finance import quotes_historical_yahoo_och1
except ImportError:
   from matplotlib.finance import (
      quotes_historical_yahoo as quotes_historical_yahoo_och1)

from hmmlearn.hmm import GaussianHMM

Chargez les données à partir d'une date de début et d'une date de fin, c'est-à-dire entre deux dates spécifiques comme indiqué ici -

start_date = datetime.date(1995, 10, 10)
end_date = datetime.date(2015, 4, 25)
quotes = quotes_historical_yahoo_och1('INTC', start_date, end_date)

Dans cette étape, nous extrairons les guillemets de clôture chaque jour. Pour cela, utilisez la commande suivante -

closing_quotes = np.array([quote[2] for quote in quotes])

Maintenant, nous allons extraire le volume d'actions échangées chaque jour. Pour cela, utilisez la commande suivante -

volumes = np.array([quote[5] for quote in quotes])[1:]

Ici, prenez la différence en pourcentage des cours de clôture des actions, en utilisant le code ci-dessous -

diff_percentages = 100.0 * np.diff(closing_quotes) / closing_quotes[:-]
dates = np.array([quote[0] for quote in quotes], dtype = np.int)[1:]
training_data = np.column_stack([diff_percentages, volumes])

Dans cette étape, créez et entraînez le HMM gaussien. Pour cela, utilisez le code suivant -

hmm = GaussianHMM(n_components = 7, covariance_type = 'diag', n_iter = 1000)
with warnings.catch_warnings():
   warnings.simplefilter('ignore')
   hmm.fit(training_data)

Maintenant, générez des données en utilisant le modèle HMM, en utilisant les commandes affichées -

num_samples = 300
samples, _ = hmm.sample(num_samples)

Enfin, dans cette étape, nous traçons et visualisons le pourcentage de différence et le volume des actions échangées en sortie sous forme de graphique.

Utilisez le code suivant pour tracer et visualiser les pourcentages de différence -

plt.figure()
plt.title('Difference percentages')
plt.plot(np.arange(num_samples), samples[:, 0], c = 'black')

Utilisez le code suivant pour tracer et visualiser le volume d'actions échangées -

plt.figure()
plt.title('Volume of shares')
plt.plot(np.arange(num_samples), samples[:, 1], c = 'black')
plt.ylim(ymin = 0)
plt.show()

Dans ce chapitre, nous en apprendrons davantage sur la reconnaissance vocale à l'aide de l'IA avec Python.

La parole est le moyen le plus élémentaire de communication humaine adulte. Le but fondamental du traitement de la parole est de fournir une interaction entre un humain et une machine.

Le système de traitement de la parole a principalement trois tâches -

  • First, reconnaissance vocale qui permet à la machine de saisir les mots, les phrases et les phrases que nous prononçons

  • Second, traitement du langage naturel pour permettre à la machine de comprendre ce que nous parlons, et

  • Third, synthèse vocale pour permettre à la machine de parler.

Ce chapitre se concentre sur speech recognition, le processus de compréhension des mots prononcés par les êtres humains. N'oubliez pas que les signaux vocaux sont capturés à l'aide d'un microphone et qu'ils doivent ensuite être compris par le système.

Construire un logiciel de reconnaissance vocale

La reconnaissance vocale ou la reconnaissance vocale automatique (ASR) est le centre d'attention des projets d'IA comme la robotique. Sans ASR, il n'est pas possible d'imaginer un robot cognitif interagissant avec un humain. Cependant, il n'est pas assez facile de créer un logiciel de reconnaissance vocale.

Difficultés à développer un système de reconnaissance vocale

Développer un système de reconnaissance vocale de haute qualité est vraiment un problème difficile. La difficulté de la technologie de reconnaissance vocale peut être largement caractérisée selon un certain nombre de dimensions, comme indiqué ci-dessous -

  • Size of the vocabulary- La taille du vocabulaire a un impact sur la facilité de développement d'un ASR. Considérez les tailles de vocabulaire suivantes pour une meilleure compréhension.

    • Un vocabulaire de petite taille se compose de 2 à 100 mots, par exemple, comme dans un système de menu vocal

    • Un vocabulaire de taille moyenne se compose de plusieurs centaines à 1000 mots, par exemple, comme dans une tâche de recherche de base de données

    • Un vocabulaire de grande taille se compose de plusieurs 10 000 mots, comme dans une tâche de dictée générale.

    Notez que plus la taille du vocabulaire est grande, plus il est difficile d'effectuer la reconnaissance.

  • Channel characteristics- La qualité des canaux est également une dimension importante. Par exemple, la parole humaine contient une bande passante élevée avec une plage de fréquences complète, tandis qu'une parole téléphonique se compose d'une bande passante faible avec une plage de fréquences limitée. Notez que c'est plus dur dans ce dernier.

  • Speaking mode- La facilité de développement d'un ASR dépend également du mode de parole, c'est-à-dire si la parole est en mode mot isolé, ou en mode mot connecté, ou en mode parole continue. Notez qu'un discours continu est plus difficile à reconnaître.

  • Speaking style- Un discours lu peut être dans un style formel, ou spontané et conversationnel avec un style décontracté. Ce dernier est plus difficile à reconnaître.

  • Speaker dependency- La parole peut être dépendante du locuteur, adaptative ou indépendante du locuteur. Un haut-parleur indépendant est le plus difficile à construire.

  • Type of noise- Le bruit est un autre facteur à prendre en compte lors du développement d'un ASR. Le rapport signal / bruit peut se situer dans diverses plages, en fonction de l'environnement acoustique qui observe moins de bruit de fond par rapport à plus -

    • Si le rapport signal sur bruit est supérieur à 30 dB, il est considéré comme une plage haute

    • Si le rapport signal sur bruit se situe entre 30 dB et 10 dB, il est considéré comme un SNR moyen

    • Si le rapport signal sur bruit est inférieur à 10 dB, il est considéré comme une plage basse

    Par exemple, le type de bruit de fond tel que le bruit stationnaire, non humain, la parole de fond et la diaphonie par d'autres locuteurs contribue également à la difficulté du problème.

  • Microphone characteristics- La qualité du microphone peut être bonne, moyenne ou inférieure à la moyenne. De plus, la distance entre la bouche et le micro-téléphone peut varier. Ces facteurs doivent également être pris en compte pour les systèmes de reconnaissance.

Malgré ces difficultés, les chercheurs ont beaucoup travaillé sur divers aspects de la parole tels que la compréhension du signal vocal, le locuteur et l'identification des accents.

Vous devrez suivre les étapes ci-dessous pour créer un logiciel de reconnaissance vocale -

Visualiser les signaux audio - Lire à partir d'un fichier et travailler dessus

Il s'agit de la première étape de la construction d'un système de reconnaissance vocale, car il permet de comprendre comment un signal audio est structuré. Voici quelques étapes courantes qui peuvent être suivies pour travailler avec des signaux audio:

Enregistrement

Lorsque vous devez lire le signal audio d'un fichier, enregistrez-le d'abord à l'aide d'un microphone.

Échantillonnage

Lors de l'enregistrement avec microphone, les signaux sont stockés sous une forme numérisée. Mais pour y travailler, la machine en a besoin sous forme numérique discrète. Par conséquent, nous devons effectuer un échantillonnage à une certaine fréquence et convertir le signal sous la forme numérique discrète. Le choix de la haute fréquence d'échantillonnage implique que lorsque les humains écoutent le signal, ils le ressentent comme un signal audio continu.

Exemple

L'exemple suivant montre une approche par étapes pour analyser un signal audio, à l'aide de Python, qui est stocké dans un fichier. La fréquence de ce signal audio est de 44 100 HZ.

Importez les packages nécessaires comme indiqué ici -

import numpy as np
import matplotlib.pyplot as plt
from scipy.io import wavfile

Maintenant, lisez le fichier audio stocké. Il renverra deux valeurs: la fréquence d'échantillonnage et le signal audio. Fournissez le chemin du fichier audio où il est stocké, comme indiqué ici -

frequency_sampling, audio_signal = wavfile.read("/Users/admin/audio_file.wav")

Affichez les paramètres tels que la fréquence d'échantillonnage du signal audio, le type de données du signal et sa durée, à l'aide des commandes indiquées -

print('\nSignal shape:', audio_signal.shape)
print('Signal Datatype:', audio_signal.dtype)
print('Signal duration:', round(audio_signal.shape[0] / 
float(frequency_sampling), 2), 'seconds')

Cette étape consiste à normaliser le signal comme indiqué ci-dessous -

audio_signal = audio_signal / np.power(2, 15)

Dans cette étape, nous extrayons les 100 premières valeurs de ce signal à visualiser. Utilisez les commandes suivantes à cet effet -

audio_signal = audio_signal [:100]
time_axis = 1000 * np.arange(0, len(signal), 1) / float(frequency_sampling)

Maintenant, visualisez le signal en utilisant les commandes données ci-dessous -

plt.plot(time_axis, signal, color='blue')
plt.xlabel('Time (milliseconds)')
plt.ylabel('Amplitude')
plt.title('Input audio signal')
plt.show()

Vous pourrez voir un graphique de sortie et des données extraites pour le signal audio ci-dessus comme indiqué dans l'image ici

Signal shape: (132300,)
Signal Datatype: int16
Signal duration: 3.0 seconds

Caractérisation du signal audio: transformation en domaine fréquentiel

La caractérisation d'un signal audio implique la conversion du signal du domaine temporel en domaine fréquentiel et la compréhension de ses composantes fréquentielles par. C'est une étape importante car elle donne beaucoup d'informations sur le signal. Vous pouvez utiliser un outil mathématique tel que la transformation de Fourier pour effectuer cette transformation.

Exemple

L'exemple suivant montre, étape par étape, comment caractériser le signal, à l'aide de Python, qui est stocké dans un fichier. Notez qu'ici, nous utilisons l'outil mathématique de transformée de Fourier pour le convertir en domaine fréquentiel.

Importez les packages nécessaires, comme indiqué ici -

import numpy as np
import matplotlib.pyplot as plt
from scipy.io import wavfile

Maintenant, lisez le fichier audio stocké. Il renverra deux valeurs: la fréquence d'échantillonnage et le signal audio. Fournissez le chemin du fichier audio où il est stocké comme indiqué dans la commande ici -

frequency_sampling, audio_signal = wavfile.read("/Users/admin/sample.wav")

Dans cette étape, nous afficherons les paramètres tels que la fréquence d'échantillonnage du signal audio, le type de données du signal et sa durée, en utilisant les commandes données ci-dessous -

print('\nSignal shape:', audio_signal.shape)
print('Signal Datatype:', audio_signal.dtype)
print('Signal duration:', round(audio_signal.shape[0] / 
float(frequency_sampling), 2), 'seconds')

Dans cette étape, nous devons normaliser le signal, comme indiqué dans la commande suivante -

audio_signal = audio_signal / np.power(2, 15)

Cette étape consiste à extraire la longueur et la demi-longueur du signal. Utilisez les commandes suivantes à cet effet -

length_signal = len(audio_signal)
half_length = np.ceil((length_signal + 1) / 2.0).astype(np.int)

Maintenant, nous devons appliquer des outils mathématiques pour transformer en domaine fréquentiel. Ici, nous utilisons la transformée de Fourier.

signal_frequency = np.fft.fft(audio_signal)

Maintenant, faites la normalisation du signal du domaine fréquentiel et mettez-le au carré -

signal_frequency = abs(signal_frequency[0:half_length]) / length_signal
signal_frequency **= 2

Ensuite, extrayez la longueur et la demi-longueur du signal transformé en fréquence -

len_fts = len(signal_frequency)

Notez que le signal transformé de Fourier doit être ajusté pour les cas pairs et impairs.

if length_signal % 2:
   signal_frequency[1:len_fts] *= 2
else:
   signal_frequency[1:len_fts-1] *= 2

Maintenant, extrayez la puissance en décibales (dB) -

signal_power = 10 * np.log10(signal_frequency)

Ajustez la fréquence en kHz pour l'axe X -

x_axis = np.arange(0, len_half, 1) * (frequency_sampling / length_signal) / 1000.0

Maintenant, visualisez la caractérisation du signal comme suit -

plt.figure()
plt.plot(x_axis, signal_power, color='black')
plt.xlabel('Frequency (kHz)')
plt.ylabel('Signal power (dB)')
plt.show()

Vous pouvez observer le graphique de sortie du code ci-dessus comme indiqué dans l'image ci-dessous -

Génération d'un signal audio monotone

Les deux étapes que vous avez vues jusqu'à présent sont importantes pour connaître les signaux. Maintenant, cette étape sera utile si vous souhaitez générer le signal audio avec certains paramètres prédéfinis. Notez que cette étape enregistrera le signal audio dans un fichier de sortie.

Exemple

Dans l'exemple suivant, nous allons générer un signal monotone, en utilisant Python, qui sera stocké dans un fichier. Pour cela, vous devrez suivre les étapes suivantes -

Importez les packages nécessaires comme indiqué -

import numpy as np
import matplotlib.pyplot as plt
from scipy.io.wavfile import write

Fournissez le fichier dans lequel le fichier de sortie doit être enregistré

output_file = 'audio_signal_generated.wav'

Maintenant, spécifiez les paramètres de votre choix, comme indiqué -

duration = 4 # in seconds
frequency_sampling = 44100 # in Hz
frequency_tone = 784
min_val = -4 * np.pi
max_val = 4 * np.pi

Dans cette étape, nous pouvons générer le signal audio, comme indiqué -

t = np.linspace(min_val, max_val, duration * frequency_sampling)
audio_signal = np.sin(2 * np.pi * tone_freq * t)

Maintenant, enregistrez le fichier audio dans le fichier de sortie -

write(output_file, frequency_sampling, signal_scaled)

Extrayez les 100 premières valeurs de notre graphique, comme indiqué -

audio_signal = audio_signal[:100]
time_axis = 1000 * np.arange(0, len(signal), 1) / float(sampling_freq)

Maintenant, visualisez le signal audio généré comme suit -

plt.plot(time_axis, signal, color='blue')
plt.xlabel('Time in milliseconds')
plt.ylabel('Amplitude')
plt.title('Generated audio signal')
plt.show()

Vous pouvez observer le graphique comme indiqué dans la figure donnée ici -

Extraction de fonctionnalités à partir de la parole

Il s'agit de l'étape la plus importante dans la construction d'un module de reconnaissance vocale car après avoir converti le signal vocal dans le domaine fréquentiel, nous devons le convertir en la forme utilisable de vecteur de caractéristiques. Nous pouvons utiliser différentes techniques d'extraction de caractéristiques comme MFCC, PLP, PLP-RASTA etc. à cette fin.

Exemple

Dans l'exemple suivant, nous allons extraire les fonctionnalités du signal, étape par étape, en utilisant Python, en utilisant la technique MFCC.

Importez les packages nécessaires, comme indiqué ici -

import numpy as np
import matplotlib.pyplot as plt
from scipy.io import wavfile
from python_speech_features import mfcc, logfbank

Maintenant, lisez le fichier audio stocké. Il renverra deux valeurs - la fréquence d'échantillonnage et le signal audio. Indiquez le chemin du fichier audio dans lequel il est stocké.

frequency_sampling, audio_signal = wavfile.read("/Users/admin/audio_file.wav")

Notez que nous prenons ici les 15 000 premiers échantillons pour analyse.

audio_signal = audio_signal[:15000]

Utilisez les techniques MFCC et exécutez la commande suivante pour extraire les fonctionnalités MFCC -

features_mfcc = mfcc(audio_signal, frequency_sampling)

Maintenant, imprimez les paramètres MFCC, comme indiqué -

print('\nMFCC:\nNumber of windows =', features_mfcc.shape[0])
print('Length of each feature =', features_mfcc.shape[1])

Maintenant, tracez et visualisez les fonctionnalités MFCC en utilisant les commandes données ci-dessous -

features_mfcc = features_mfcc.T
plt.matshow(features_mfcc)
plt.title('MFCC')

Dans cette étape, nous travaillons avec les fonctionnalités de banque de filtres comme indiqué -

Extraire les fonctionnalités de la banque de filtres -

filterbank_features = logfbank(audio_signal, frequency_sampling)

Maintenant, imprimez les paramètres du banc de filtres.

print('\nFilter bank:\nNumber of windows =', filterbank_features.shape[0])
print('Length of each feature =', filterbank_features.shape[1])

Maintenant, tracez et visualisez les fonctionnalités du banc de filtres.

filterbank_features = filterbank_features.T
plt.matshow(filterbank_features)
plt.title('Filter bank')
plt.show()

À la suite des étapes ci-dessus, vous pouvez observer les sorties suivantes: Figure1 pour MFCC et Figure2 pour Filter Bank

Reconnaissance des mots prononcés

La reconnaissance vocale signifie que lorsque les humains parlent, une machine le comprend. Ici, nous utilisons l'API Google Speech en Python pour y arriver. Nous devons installer les packages suivants pour cela -

  • Pyaudio - Il peut être installé en utilisant pip install Pyaudio commander.

  • SpeechRecognition - Ce package peut être installé en utilisant pip install SpeechRecognition.

  • Google-Speech-API - Il peut être installé en utilisant la commande pip install google-api-python-client.

Exemple

Observez l'exemple suivant pour comprendre la reconnaissance des mots prononcés -

Importez les packages nécessaires comme indiqué -

import speech_recognition as sr

Créez un objet comme indiqué ci-dessous -

recording = sr.Recognizer()

Maintenant le Microphone() le module prendra la voix comme entrée -

with sr.Microphone() as source: recording.adjust_for_ambient_noise(source)
   print("Please Say something:")
   audio = recording.listen(source)

Maintenant, l'API Google reconnaîtrait la voix et donnerait le résultat.

try:
   print("You said: \n" + recording.recognize_google(audio))
except Exception as e:
   print(e)

Vous pouvez voir la sortie suivante -

Please Say Something:
You said:

Par exemple, si vous avez dit tutorialspoint.com, le système le reconnaît correctement comme suit -

tutorialspoint.com

La recherche heuristique joue un rôle clé dans l'intelligence artificielle. Dans ce chapitre, vous en apprendrez plus en détail.

Concept de recherche heuristique en IA

L'heuristique est une règle empirique qui nous conduit à la solution probable. La plupart des problèmes de l'intelligence artificielle sont de nature exponentielle et ont de nombreuses solutions possibles. Vous ne savez pas exactement quelles solutions sont correctes et vérifier toutes les solutions coûterait très cher.

Ainsi, l'utilisation de l'heuristique restreint la recherche de solution et élimine les mauvaises options. La méthode d'utilisation de l'heuristique pour diriger la recherche dans l'espace de recherche est appelée recherche heuristique. Les techniques heuristiques sont très utiles car la recherche peut être accélérée lorsque vous les utilisez.

Différence entre la recherche non informée et informée

Il existe deux types de stratégies de contrôle ou de techniques de recherche: non informées et informées. Ils sont expliqués en détail comme indiqué ici -

Recherche non informée

Elle est également appelée recherche aveugle ou stratégie de contrôle aveugle. Il est nommé ainsi car il n'y a des informations que sur la définition du problème et aucune autre information supplémentaire n'est disponible sur les états. Ce type de techniques de recherche chercherait dans tout l'espace d'états pour obtenir la solution. Breadth First Search (BFS) et Depth First Search (DFS) sont des exemples de recherche non informée.

Recherche informée

Elle est également appelée recherche heuristique ou stratégie de contrôle heuristique. Il est nommé ainsi parce qu'il y a des informations supplémentaires sur les états. Ces informations supplémentaires sont utiles pour calculer la préférence parmi les nœuds enfants à explorer et à développer. Il y aurait une fonction heuristique associée à chaque nœud. Best First Search (BFS), A *, Mean et Analysis sont des exemples de recherche éclairée.

Problèmes de satisfaction des contraintes (CSP)

La contrainte signifie une restriction ou une limitation. En IA, les problèmes de satisfaction des contraintes sont les problèmes qui doivent être résolus sous certaines contraintes. L'accent doit être mis sur le fait de ne pas violer la contrainte tout en résolvant de tels problèmes. Enfin, lorsque nous atteignons la solution finale, CSP doit obéir à la restriction.

Problème du monde réel résolu par la satisfaction des contraintes

Les sections précédentes ont traité de la création de problèmes de satisfaction des contraintes. Maintenant, appliquons cela aux problèmes du monde réel aussi. Voici quelques exemples de problèmes du monde réel résolus par la satisfaction de contraintes:

Résolution d'une relation algébrique

Avec l'aide du problème de satisfaction de contraintes, nous pouvons résoudre des relations algébriques. Dans cet exemple, nous allons essayer de résoudre une simple relation algébriquea*2 = b. Il renverra la valeur dea et b dans la fourchette que nous définirions.

Après avoir terminé ce programme Python, vous serez en mesure de comprendre les bases de la résolution de problèmes avec la satisfaction des contraintes.

Notez qu'avant d'écrire le programme, nous devons installer le package Python appelé python-constraint. Vous pouvez l'installer à l'aide de la commande suivante -

pip install python-constraint

Les étapes suivantes vous montrent un programme Python pour résoudre une relation algébrique en utilisant la satisfaction de contraintes -

Importez le constraint package en utilisant la commande suivante -

from constraint import *

Maintenant, créez un objet de module nommé problem() comme indiqué ci-dessous -

problem = Problem()

Maintenant, définissez les variables. Notez que nous avons ici deux variables a et b, et nous définissons 10 comme leur plage, ce qui signifie que nous avons obtenu la solution dans les 10 premiers nombres.

problem.addVariable('a', range(10))
problem.addVariable('b', range(10))

Ensuite, définissez la contrainte particulière que nous voulons appliquer à ce problème. Observez qu'ici nous utilisons la contraintea*2 = b.

problem.addConstraint(lambda a, b: a * 2 == b)

Maintenant, créez l'objet de getSolution() module en utilisant la commande suivante -

solutions = problem.getSolutions()

Enfin, imprimez la sortie en utilisant la commande suivante -

print (solutions)

Vous pouvez observer la sortie du programme ci-dessus comme suit -

[{'a': 4, 'b': 8}, {'a': 3, 'b': 6}, {'a': 2, 'b': 4}, {'a': 1, 'b': 2}, {'a': 0, 'b': 0}]

Carré magique

Un carré magique est un arrangement de nombres distincts, généralement des entiers, dans une grille carrée, où les nombres de chaque ligne et de chaque colonne, et les nombres de la diagonale, s'additionnent tous au même nombre appelé «constante magique» .

Ce qui suit est une exécution pas à pas d'un code Python simple pour générer des carrés magiques -

Définissez une fonction nommée magic_square, comme indiqué ci-dessous -

def magic_square(matrix_ms):
   iSize = len(matrix_ms[0])
   sum_list = []

Le code suivant montre le code pour la verticale des carrés -

for col in range(iSize):
   sum_list.append(sum(row[col] for row in matrix_ms))

Le code suivant montre le code pour l'horizontale des carrés -

sum_list.extend([sum (lines) for lines in matrix_ms])

Le code suivant montre le code pour l'horizontale des carrés -

dlResult = 0
for i in range(0,iSize):
   dlResult +=matrix_ms[i][i]
sum_list.append(dlResult)
drResult = 0
for i in range(iSize-1,-1,-1):
   drResult +=matrix_ms[i][i]
sum_list.append(drResult)

if len(set(sum_list))>1:
   return False
return True

Maintenant, donnez la valeur de la matrice et vérifiez la sortie -

print(magic_square([[1,2,3], [4,5,6], [7,8,9]]))

Vous pouvez observer que la sortie serait False car la somme n'est pas au même nombre.

print(magic_square([[3,9,2], [3,5,7], [9,1,6]]))

Vous pouvez observer que la sortie serait True comme la somme est le même nombre, c'est-à-dire 15 ici.

Les jeux se jouent avec une stratégie. Chaque joueur ou équipe ferait une stratégie avant de commencer le jeu et ils doivent changer ou construire une nouvelle stratégie en fonction de la ou des situation (s) actuelle (s) du jeu.

Algorithmes de recherche

Vous devrez également envisager les jeux informatiques avec la même stratégie que ci-dessus. Notez que les algorithmes de recherche sont ceux qui déterminent la stratégie dans les jeux informatiques.

Comment ça fonctionne

Le but des algorithmes de recherche est de trouver l'ensemble optimal de coups afin qu'ils puissent atteindre la destination finale et gagner. Ces algorithmes utilisent l'ensemble des conditions gagnantes, différentes pour chaque partie, pour trouver les meilleurs coups.

Visualisez un jeu vidéo sous forme d'arbre. Nous savons que l'arbre a des nœuds. En partant de la racine, nous pouvons arriver au nœud final gagnant, mais avec des mouvements optimaux. C'est le travail des algorithmes de recherche. Chaque nœud d'un tel arbre représente un état futur. Les algorithmes de recherche parcourent cet arbre pour prendre des décisions à chaque étape ou nœud du jeu.

Recherche combinée

L'inconvénient majeur de l'utilisation des algorithmes de recherche est qu'ils sont exhaustifs par nature, c'est pourquoi ils explorent l'ensemble de l'espace de recherche pour trouver la solution qui conduit au gaspillage de ressources. Ce serait plus compliqué si ces algorithmes avaient besoin de rechercher tout l'espace de recherche pour trouver la solution finale.

Pour éliminer ce genre de problème, nous pouvons utiliser la recherche combinatoire qui utilise l'heuristique pour explorer l'espace de recherche et réduit sa taille en éliminant les éventuels faux mouvements. Par conséquent, de tels algorithmes peuvent économiser les ressources. Certains des algorithmes qui utilisent l'heuristique pour rechercher l'espace et économiser les ressources sont discutés ici -

Algorithme Minimax

C'est la stratégie utilisée par la recherche combinatoire qui utilise l'heuristique pour accélérer la stratégie de recherche. Le concept de stratégie Minimax peut être compris avec l'exemple des jeux à deux joueurs, dans lesquels chaque joueur essaie de prédire le prochain mouvement de l'adversaire et essaie de minimiser cette fonction. De plus, pour gagner, le joueur essaie toujours de maximiser sa propre fonction en fonction de la situation actuelle.

L'heuristique joue un rôle important dans ce type de stratégies comme Minimax. Chaque nœud de l'arbre aurait une fonction heuristique associée. Sur la base de cette heuristique, il faudra prendre la décision de se diriger vers le nœud qui leur profiterait le plus.

Taille alpha-bêta

Un problème majeur avec l'algorithme Minimax est qu'il peut explorer les parties de l'arbre qui ne sont pas pertinentes, ce qui entraîne un gaspillage de ressources. Par conséquent, il doit y avoir une stratégie pour décider quelle partie de l'arbre est pertinente et laquelle n'est pas pertinente et laisser la partie non pertinente inexplorée. L'élagage alpha-bêta est l'un de ces types de stratégie.

L'objectif principal de l'algorithme d'élagage Alpha-Beta est d'éviter de rechercher les parties de l'arbre qui n'ont pas de solution. Le concept principal de la taille Alpha-Beta est d'utiliser deux bornes nomméesAlpha, la limite inférieure maximale, et Beta, la limite supérieure minimale. Ces deux paramètres sont les valeurs qui restreignent l'ensemble des solutions possibles. Il compare la valeur du nœud actuel avec la valeur des paramètres alpha et bêta, afin de pouvoir se déplacer vers la partie de l'arborescence qui contient la solution et ignorer le reste.

Algorithme Negamax

Cet algorithme n'est pas différent de l'algorithme Minimax, mais il a une implémentation plus élégante. Le principal inconvénient de l'utilisation de l'algorithme Minimax est que nous devons définir deux fonctions heuristiques différentes. Le lien entre ces heuristiques est que, meilleur est l'état d'un jeu pour un joueur, pire c'est pour l'autre joueur. Dans l'algorithme de Negamax, le même travail de deux fonctions heuristiques est effectué à l'aide d'une seule fonction heuristique.

Construire des robots pour jouer à des jeux

Pour créer des bots pour jouer à des jeux à deux joueurs en IA, nous devons installer le easyAIbibliothèque. C'est un framework d'intelligence artificielle qui fournit toutes les fonctionnalités pour créer des jeux à deux joueurs. Vous pouvez le télécharger à l'aide de la commande suivante -

pip install easyAI

Un bot pour jouer la dernière pièce debout

Dans ce jeu, il y aurait une pile de pièces. Chaque joueur doit prendre un certain nombre de pièces de cette pile. Le but du jeu est d'éviter de prendre la dernière pièce de la pile. Nous utiliserons la classeLastCoinStanding hérité du TwoPlayersGame classe de la easyAIbibliothèque. Le code suivant montre le code Python pour ce jeu -

Importez les packages requis comme indiqué -

from easyAI import TwoPlayersGame, id_solve, Human_Player, AI_Player
from easyAI.AI import TT

Maintenant, héritez de la classe du TwoPlayerGame classe pour gérer toutes les opérations du jeu -

class LastCoin_game(TwoPlayersGame):
   def __init__(self, players):

Maintenant, définissez les joueurs et le joueur qui va commencer la partie.

self.players = players
self.nplayer = 1

Maintenant, définissez le nombre de pièces dans le jeu, ici nous utilisons 15 pièces pour le jeu.

self.num_coins = 15

Définissez le nombre maximum de pièces qu'un joueur peut prendre lors d'un mouvement.

self.max_coins = 4

Maintenant, il y a certaines choses à définir comme indiqué dans le code suivant. Définissez les mouvements possibles.

def possible_moves(self):
   return [str(a) for a in range(1, self.max_coins + 1)]

Définir la suppression des pièces

def make_move(self, move):
   self.num_coins -= int(move)

Définissez qui a pris la dernière pièce.

def win_game(self):
   return self.num_coins <= 0

Définissez quand arrêter le jeu, c'est-à-dire quand quelqu'un gagne.

def is_over(self):
   return self.win()

Définissez comment calculer le score.

def score(self):
   return 100 if self.win_game() else 0

Définissez le nombre de pièces restant dans la pile.

def show(self):
   print(self.num_coins, 'coins left in the pile')
if __name__ == "__main__":
   tt = TT()
   LastCoin_game.ttentry = lambda self: self.num_coins

Résoudre le jeu avec le bloc de code suivant -

r, d, m = id_solve(LastCoin_game,
   range(2, 20), win_score=100, tt=tt)
print(r, d, m)

Décider qui commencera le jeu

game = LastCoin_game([AI_Player(tt), Human_Player()])
game.play()

Vous pouvez trouver la sortie suivante et un jeu simple de ce jeu -

d:2, a:0, m:1
d:3, a:0, m:1
d:4, a:0, m:1
d:5, a:0, m:1
d:6, a:100, m:4
1 6 4
15 coins left in the pile
Move #1: player 1 plays 4 :
11 coins left in the pile
Player 2 what do you play ? 2
Move #2: player 2 plays 2 :
9 coins left in the pile
Move #3: player 1 plays 3 :
6 coins left in the pile
Player 2 what do you play ? 1
Move #4: player 2 plays 1 :
5 coins left in the pile
Move #5: player 1 plays 4 :
1 coins left in the pile
Player 2 what do you play ? 1
Move #6: player 2 plays 1 :
0 coins left in the pile

Un robot pour jouer au Tic Tac Toe

Tic-Tac-Toe est très familier et l'un des jeux les plus populaires. Créons ce jeu en utilisant leeasyAIbibliothèque en Python. Le code suivant est le code Python de ce jeu -

Importez les packages comme indiqué -

from easyAI import TwoPlayersGame, AI_Player, Negamax
from easyAI.Player import Human_Player

Hériter de la classe du TwoPlayerGame classe pour gérer toutes les opérations du jeu -

class TicTacToe_game(TwoPlayersGame):
   def __init__(self, players):

Maintenant, définissez les joueurs et le joueur qui va commencer le jeu -

self.players = players
self.nplayer = 1

Définir le type de carte -

self.board = [0] * 9

Maintenant, il y a certaines choses à définir comme suit -

Définir les mouvements possibles

def possible_moves(self):
   return [x + 1 for x, y in enumerate(self.board) if y == 0]

Définir le mouvement d'un joueur -

def make_move(self, move):
   self.board[int(move) - 1] = self.nplayer

Pour booster l'IA, définissez quand un joueur effectue un mouvement -

def umake_move(self, move):
   self.board[int(move) - 1] = 0

Définir la condition de perte qu'un adversaire a trois dans une ligne

def condition_for_lose(self):
   possible_combinations = [[1,2,3], [4,5,6], [7,8,9],
      [1,4,7], [2,5,8], [3,6,9], [1,5,9], [3,5,7]]
   return any([all([(self.board[z-1] == self.nopponent)
      for z in combination]) for combination in possible_combinations])

Définir un chèque pour la fin du jeu

def is_over(self):
   return (self.possible_moves() == []) or self.condition_for_lose()

Afficher la position actuelle des joueurs dans le jeu

def show(self):
   print('\n'+'\n'.join([' '.join([['.', 'O', 'X'][self.board[3*j + i]]
      for i in range(3)]) for j in range(3)]))

Calculez les scores.

def scoring(self):
   return -100 if self.condition_for_lose() else 0

Définir la méthode principale pour définir l'algorithme et démarrer le jeu -

if __name__ == "__main__":
   algo = Negamax(7)
   TicTacToe_game([Human_Player(), AI_Player(algo)]).play()

Vous pouvez voir la sortie suivante et un jeu simple de ce jeu -

. . .
. . .
. . .
Player 1 what do you play ? 1
Move #1: player 1 plays 1 :
O . .
. . .
. . .
Move #2: player 2 plays 5 :
O . .
. X .
121
. . .
Player 1 what do you play ? 3
Move #3: player 1 plays 3 :
O . O
. X .
. . .
Move #4: player 2 plays 2 :
O X O
. X .
. . .
Player 1 what do you play ? 4
Move #5: player 1 plays 4 :
O X O
O X .
. . .
Move #6: player 2 plays 8 :
O X O
O X .
. X .

Les réseaux neuronaux sont des dispositifs informatiques parallèles qui tentent de créer un modèle informatique du cerveau. L'objectif principal derrière est de développer un système pour effectuer diverses tâches de calcul plus rapidement que les systèmes traditionnels. Ces tâches incluent la reconnaissance et la classification de modèles, l'approximation, l'optimisation et le clustering de données.

Qu'est-ce que les réseaux de neurones artificiels (ANN)

Le réseau de neurones artificiels (ANN) est un système informatique efficace dont le thème central est emprunté à l'analogie des réseaux de neurones biologiques. Les ANN sont également appelés systèmes neuronaux artificiels, systèmes de traitement distribués parallèles et systèmes connexionnistes. ANN acquiert une grande collection d'unités qui sont interconnectées selon un certain modèle pour permettre les communications entre elles. Ces unités, également appeléesnodes ou neurons, sont des processeurs simples qui fonctionnent en parallèle.

Chaque neurone est connecté à un autre neurone via un connection link. Chaque lien de connexion est associé à un poids contenant les informations sur le signal d'entrée. Il s'agit de l'information la plus utile pour les neurones pour résoudre un problème particulier car leweightexcite ou inhibe généralement le signal qui est communiqué. Chaque neurone a son état interne qui s'appelleactivation signal. Les signaux de sortie, qui sont produits après la combinaison des signaux d'entrée et de la règle d'activation, peuvent être envoyés à d'autres unités.

Si vous souhaitez étudier en détail les réseaux de neurones, vous pouvez suivre le lien - Artificial Neural Network .

Installer des packages utiles

Pour créer des réseaux de neurones en Python, nous pouvons utiliser un package puissant pour les réseaux de neurones appelé NeuroLab. Il s'agit d'une bibliothèque d'algorithmes de réseaux de neurones de base avec des configurations de réseau flexibles et des algorithmes d'apprentissage pour Python. Vous pouvez installer ce package à l'aide de la commande suivante sur l'invite de commande -

pip install NeuroLab

Si vous utilisez l'environnement Anaconda, utilisez la commande suivante pour installer NeuroLab -

conda install -c labfabulous neurolab

Création de réseaux de neurones

Dans cette section, construisons des réseaux de neurones en Python en utilisant le package NeuroLab.

Classificateur basé sur Perceptron

Les perceptrons sont les éléments constitutifs de l'ANN. Si vous voulez en savoir plus sur Perceptron, vous pouvez suivre le lien - artificial_neural_network

Voici une exécution pas à pas du code Python pour créer un classificateur basé sur le perceptron de réseau neuronal simple -

Importez les packages nécessaires comme indiqué -

import matplotlib.pyplot as plt
import neurolab as nl

Entrez les valeurs d'entrée. Notez qu'il s'agit d'un exemple d'apprentissage supervisé, vous devrez donc également fournir des valeurs cibles.

input = [[0, 0], [0, 1], [1, 0], [1, 1]]
target = [[0], [0], [0], [1]]

Créez le réseau avec 2 entrées et 1 neurone -

net = nl.net.newp([[0, 1],[0, 1]], 1)

Maintenant, formez le réseau. Ici, nous utilisons la règle Delta pour l'entraînement.

error_progress = net.train(input, target, epochs=100, show=10, lr=0.1)

Maintenant, visualisez la sortie et tracez le graphique -

plt.figure()
plt.plot(error_progress)
plt.xlabel('Number of epochs')
plt.ylabel('Training error')
plt.grid()
plt.show()

Vous pouvez voir le graphique suivant montrant la progression de l'entraînement à l'aide de la métrique d'erreur -

Réseaux de neurones monocouche

Dans cet exemple, nous créons un réseau de neurones à couche unique composé de neurones indépendants agissant sur les données d'entrée pour produire la sortie. Notez que nous utilisons le fichier texte nomméneural_simple.txt comme notre entrée.

Importez les packages utiles comme indiqué -

import numpy as np
import matplotlib.pyplot as plt
import neurolab as nl

Chargez l'ensemble de données comme suit -

input_data = np.loadtxt(“/Users/admin/neural_simple.txt')

Voici les données que nous allons utiliser. Notez que dans ces données, les deux premières colonnes sont les caractéristiques et les deux dernières colonnes sont les étiquettes.

array([[2. , 4. , 0. , 0. ],
      [1.5, 3.9, 0. , 0. ],
      [2.2, 4.1, 0. , 0. ],
      [1.9, 4.7, 0. , 0. ],
      [5.4, 2.2, 0. , 1. ],
      [4.3, 7.1, 0. , 1. ],
      [5.8, 4.9, 0. , 1. ],
      [6.5, 3.2, 0. , 1. ],
      [3. , 2. , 1. , 0. ],
      [2.5, 0.5, 1. , 0. ],
      [3.5, 2.1, 1. , 0. ],
      [2.9, 0.3, 1. , 0. ],
      [6.5, 8.3, 1. , 1. ],
      [3.2, 6.2, 1. , 1. ],
      [4.9, 7.8, 1. , 1. ],
      [2.1, 4.8, 1. , 1. ]])

Maintenant, séparez ces quatre colonnes en 2 colonnes de données et 2 étiquettes -

data = input_data[:, 0:2]
labels = input_data[:, 2:]

Tracez les données d'entrée à l'aide des commandes suivantes -

plt.figure()
plt.scatter(data[:,0], data[:,1])
plt.xlabel('Dimension 1')
plt.ylabel('Dimension 2')
plt.title('Input data')

Maintenant, définissez les valeurs minimale et maximale pour chaque dimension comme indiqué ici -

dim1_min, dim1_max = data[:,0].min(), data[:,0].max()
dim2_min, dim2_max = data[:,1].min(), data[:,1].max()

Ensuite, définissez le nombre de neurones dans la couche de sortie comme suit -

nn_output_layer = labels.shape[1]

Maintenant, définissez un réseau de neurones monocouche -

dim1 = [dim1_min, dim1_max]
dim2 = [dim2_min, dim2_max]
neural_net = nl.net.newp([dim1, dim2], nn_output_layer)

Entraînez le réseau neuronal avec le nombre d'époques et le taux d'apprentissage comme indiqué -

error = neural_net.train(data, labels, epochs = 200, show = 20, lr = 0.01)

Maintenant, visualisez et tracez la progression de l'entraînement à l'aide des commandes suivantes -

plt.figure()
plt.plot(error)
plt.xlabel('Number of epochs')
plt.ylabel('Training error')
plt.title('Training error progress')
plt.grid()
plt.show()

Maintenant, utilisez les points de données de test dans le classificateur ci-dessus -

print('\nTest Results:')
data_test = [[1.5, 3.2], [3.6, 1.7], [3.6, 5.7],[1.6, 3.9]] for item in data_test:
   print(item, '-->', neural_net.sim([item])[0])

Vous pouvez trouver les résultats du test comme indiqué ici -

[1.5, 3.2] --> [1. 0.]
[3.6, 1.7] --> [1. 0.]
[3.6, 5.7] --> [1. 1.]
[1.6, 3.9] --> [1. 0.]

Vous pouvez voir les graphiques suivants comme la sortie du code discuté jusqu'à présent -

Réseaux de neurones multicouches

Dans cet exemple, nous créons un réseau neuronal multicouche composé de plusieurs couches pour extraire les modèles sous-jacents dans les données d'entraînement. Ce réseau neuronal multicouche fonctionnera comme un régresseur. Nous allons générer des points de données basés sur l'équation: y = 2x 2 +8.

Importez les packages nécessaires comme indiqué -

import numpy as np
import matplotlib.pyplot as plt
import neurolab as nl

Générez un point de données basé sur l'équation mentionnée ci-dessus -

min_val = -30
max_val = 30
num_points = 160
x = np.linspace(min_val, max_val, num_points)
y = 2 * np.square(x) + 8
y /= np.linalg.norm(y)

Maintenant, remodelez cet ensemble de données comme suit -

data = x.reshape(num_points, 1)
labels = y.reshape(num_points, 1)

Visualisez et tracez l'ensemble de données d'entrée à l'aide des commandes suivantes -

plt.figure()
plt.scatter(data, labels)
plt.xlabel('Dimension 1')
plt.ylabel('Dimension 2')
plt.title('Data-points')

Maintenant, construisez le réseau neuronal ayant deux couches cachées avec neurolab avec ten neurones dans la première couche cachée, six dans la deuxième couche cachée et one dans la couche de sortie.

neural_net = nl.net.newff([[min_val, max_val]], [10, 6, 1])

Maintenant, utilisez l'algorithme d'apprentissage du gradient -

neural_net.trainf = nl.train.train_gd

Maintenant, formez le réseau dans le but d'apprendre sur les données générées ci-dessus -

error = neural_net.train(data, labels, epochs = 1000, show = 100, goal = 0.01)

Maintenant, exécutez les réseaux de neurones sur les points de données d'entraînement -

output = neural_net.sim(data)
y_pred = output.reshape(num_points)

Maintenant tâche de tracé et de visualisation -

plt.figure()
plt.plot(error)
plt.xlabel('Number of epochs')
plt.ylabel('Error')
plt.title('Training error progress')

Nous allons maintenant tracer la sortie réelle par rapport à la sortie prévue -

x_dense = np.linspace(min_val, max_val, num_points * 2)
y_dense_pred = neural_net.sim(x_dense.reshape(x_dense.size,1)).reshape(x_dense.size)
plt.figure()
plt.plot(x_dense, y_dense_pred, '-', x, y, '.', x, y_pred, 'p')
plt.title('Actual vs predicted')
plt.show()

À la suite des commandes ci-dessus, vous pouvez observer les graphiques comme indiqué ci-dessous -

Dans ce chapitre, vous apprendrez en détail les concepts d'apprentissage par renforcement dans l'IA avec Python.

Bases de l'apprentissage par renforcement

Ce type d'apprentissage est utilisé pour renforcer ou renforcer le réseau sur la base d'informations critiques. Autrement dit, un réseau formé dans le cadre de l'apprentissage par renforcement reçoit des commentaires de l'environnement. Cependant, la rétroaction est évaluative et non instructive comme dans le cas de l'apprentissage supervisé. Sur la base de ce retour d'expérience, le réseau effectue les ajustements des poids pour obtenir de meilleures informations critiques à l'avenir.

Ce processus d'apprentissage est similaire à l'apprentissage supervisé mais nous pourrions avoir très moins d'informations. La figure suivante donne le schéma de principe de l'apprentissage par renforcement -

Blocs de construction: environnement et agent

L'environnement et l'agent sont les principaux éléments constitutifs de l'apprentissage par renforcement en IA. Cette section les aborde en détail -

Agent

Un agent est tout ce qui peut percevoir son environnement à travers des capteurs et agit sur cet environnement à travers des effecteurs.

  • UNE human agent a des organes sensoriels tels que les yeux, les oreilles, le nez, la langue et la peau parallèles aux capteurs, et d'autres organes tels que les mains, les jambes, la bouche, pour les effecteurs.

  • UNE robotic agent remplace les caméras et les télémètres infrarouges pour les capteurs, ainsi que divers moteurs et actionneurs pour les effecteurs.

  • UNE software agent a encodé des chaînes de bits comme programmes et actions.

Terminologie des agents

Les termes suivants sont plus fréquemment utilisés dans l'apprentissage par renforcement en IA -

  • Performance Measure of Agent - Ce sont les critères qui déterminent le succès d'un agent.

  • Behavior of Agent - C'est l'action que l'agent effectue après une séquence donnée de percepts.

  • Percept - Ce sont les entrées perceptives de l'agent à une instance donnée.

  • Percept Sequence - C'est l'histoire de tout ce qu'un agent a perçu jusqu'à ce jour.

  • Agent Function - C'est une carte de la séquence précepte à une action.

Environnement

Certains programmes fonctionnent de manière entièrement artificial environment limité à l'entrée au clavier, la base de données, les systèmes de fichiers informatiques et la sortie de caractères sur un écran.

En revanche, certains agents logiciels, tels que les robots logiciels ou les softbots, existent dans des domaines de softbot riches et illimités. Le simulateur a unvery detailed, et complex environment. L'agent logiciel doit choisir parmi un large éventail d'actions en temps réel.

Par exemple, un softbot conçu pour analyser les préférences en ligne du client et afficher des éléments intéressants pour le client fonctionne dans le real ainsi qu'un artificial environnement.

Propriétés de l'environnement

L'environnement a des propriétés multiples comme indiqué ci-dessous -

  • Discrete/Continuous- S'il y a un nombre limité d'états distincts et clairement définis de l'environnement, l'environnement est discret, sinon il est continu. Par exemple, les échecs sont un environnement discret et la conduite est un environnement continu.

  • Observable/Partially Observable- s'il est possible de déterminer l'état complet de l'environnement à chaque instant à partir des percepts, il est observable; sinon, il n'est que partiellement observable.

  • Static/Dynamic- Si l'environnement ne change pas pendant qu'un agent agit, alors il est statique; sinon c'est dynamique.

  • Single agent/Multiple agents - L'environnement peut contenir d'autres agents qui peuvent être de nature identique ou différente de celle de l'agent.

  • Accessible/Inaccessible- Si l'appareil sensoriel de l'agent peut avoir accès à l'état complet de l'environnement, alors l'environnement est accessible à cet agent; sinon, il est inaccessible.

  • Deterministic/Non-deterministic- Si l'état suivant de l'environnement est complètement déterminé par l'état actuel et les actions de l'agent, alors l'environnement est déterministe; sinon, il est non déterministe.

  • Episodic/Non-episodic- Dans un environnement épisodique, chaque épisode consiste en ce que l'agent perçoit puis agit. La qualité de son action dépend uniquement de l'épisode lui-même. Les épisodes suivants ne dépendent pas des actions des épisodes précédents. Les environnements épisodiques sont beaucoup plus simples car l'agent n'a pas besoin de penser à l'avenir.

Construire un environnement avec Python

Pour créer un agent d'apprentissage par renforcement, nous utiliserons le OpenAI Gym package qui peut être installé à l'aide de la commande suivante -

pip install gym

Il existe différents environnements dans OpenAI gym qui peuvent être utilisés à diverses fins. Peu d'entre eux sontCartpole-v0, Hopper-v1, et MsPacman-v0. Ils nécessitent des moteurs différents. La documentation détaillée deOpenAI Gym peut être trouvé sur https://gym.openai.com/docs/#environments.

Le code suivant montre un exemple de code Python pour l'environnement cartpole-v0 -

import gym
env = gym.make('CartPole-v0')
env.reset()
for _ in range(1000):
   env.render()
   env.step(env.action_space.sample())

Vous pouvez construire d'autres environnements de la même manière.

Construire un agent d'apprentissage avec Python

Pour créer un agent d'apprentissage par renforcement, nous utiliserons le OpenAI Gym paquet comme indiqué -

import gym
env = gym.make('CartPole-v0')
for _ in range(20):
   observation = env.reset()
   for i in range(100):
      env.render()
      print(observation)
      action = env.action_space.sample()
      observation, reward, done, info = env.step(action)
      if done:
         print("Episode finished after {} timesteps".format(i+1))
         break

Observez que le mât peut s'équilibrer.

Ce chapitre traite en détail des algorithmes génétiques de l'IA.

Que sont les algorithmes génétiques?

Les algorithmes génétiques (AG) sont des algorithmes basés sur la recherche basés sur les concepts de sélection naturelle et de génétique. Les GA sont un sous-ensemble d'une branche beaucoup plus large du calcul connue sous le nom de calcul évolutif.

Les AG ont été développés par John Holland et ses étudiants et collègues de l'Université du Michigan, notamment David E. Goldberg. Il a depuis été essayé sur divers problèmes d'optimisation avec un grand succès.

Dans les AG, nous avons un pool de solutions possibles au problème donné. Ces solutions subissent ensuite une recombinaison et une mutation (comme dans la génétique naturelle), produisent de nouveaux enfants et le processus se répète sur plusieurs générations. Chaque individu (ou solution candidate) se voit attribuer une valeur de fitness (en fonction de sa valeur de fonction objective) et les individus plus en forme ont une plus grande chance de s'accoupler et de céderfitterpersonnes. Ceci est conforme à la théorie darwinienne deSurvival of the Fittest.

Ainsi, il garde evolving de meilleurs individus ou solutions au fil des générations, jusqu'à ce qu'il atteigne un critère d'arrêt.

Les algorithmes génétiques sont de nature suffisamment aléatoire, mais ils fonctionnent bien mieux que la recherche locale aléatoire (où nous essayons simplement des solutions aléatoires, en gardant une trace des meilleures à ce jour), car ils exploitent également les informations historiques.

Comment utiliser GA pour les problèmes d'optimisation?

L'optimisation est une action visant à rendre la conception, la situation, les ressources et le système aussi efficaces que possible. Le diagramme suivant montre le processus d'optimisation -

Étapes du mécanisme GA pour le processus d'optimisation

Ce qui suit est une séquence d'étapes du mécanisme GA lorsqu'il est utilisé pour l'optimisation des problèmes.

  • Étape 1 - Générez la population initiale de manière aléatoire.

  • Étape 2 - Sélectionnez la solution initiale avec les meilleures valeurs de fitness.

  • Étape 3 - Recombinez les solutions sélectionnées à l'aide d'opérateurs de mutation et de croisement.

  • Étape 4 - Insérez une progéniture dans la population.

  • Étape 5 - Maintenant, si la condition d'arrêt est remplie, renvoyez la solution avec sa meilleure valeur de fitness. Sinon, passez à l'étape 2.

Installation des packages nécessaires

Pour résoudre le problème en utilisant des algorithmes génétiques en Python, nous allons utiliser un package puissant pour GA appelé DEAP. Il s'agit d'une bibliothèque de nouveaux cadres de calcul évolutifs pour le prototypage rapide et le test d'idées. Nous pouvons installer ce package à l'aide de la commande suivante sur l'invite de commande -

pip install deap

Si vous utilisez anaconda environnement, puis la commande suivante peut être utilisée pour installer deap -

conda install -c conda-forge deap

Implémentation de solutions à l'aide d'algorithmes génétiques

Cette section vous explique la mise en œuvre de solutions utilisant des algorithmes génétiques.

Générer des modèles de bits

L'exemple suivant vous montre comment générer une chaîne de bits qui contiendrait 15 uns, en fonction de la One Max problème.

Importez les packages nécessaires comme indiqué -

import random
from deap import base, creator, tools

Définissez la fonction d'évaluation. C'est la première étape pour créer un algorithme génétique.

def eval_func(individual):
   target_sum = 15
   return len(individual) - abs(sum(individual) - target_sum),

Maintenant, créez la boîte à outils avec les bons paramètres -

def create_toolbox(num_bits):
   creator.create("FitnessMax", base.Fitness, weights=(1.0,))
   creator.create("Individual", list, fitness=creator.FitnessMax)

Initialiser la boîte à outils

toolbox = base.Toolbox()
toolbox.register("attr_bool", random.randint, 0, 1)
toolbox.register("individual", tools.initRepeat, creator.Individual,
   toolbox.attr_bool, num_bits)
toolbox.register("population", tools.initRepeat, list, toolbox.individual)

Enregistrer l'opérateur d'évaluation -

toolbox.register("evaluate", eval_func)

Maintenant, enregistrez l'opérateur de croisement -

toolbox.register("mate", tools.cxTwoPoint)

Enregistrer un opérateur de mutation -

toolbox.register("mutate", tools.mutFlipBit, indpb = 0.05)

Définir l'opérateur pour l'élevage -

toolbox.register("select", tools.selTournament, tournsize = 3)
return toolbox
if __name__ == "__main__":
   num_bits = 45
   toolbox = create_toolbox(num_bits)
   random.seed(7)
   population = toolbox.population(n = 500)
   probab_crossing, probab_mutating = 0.5, 0.2
   num_generations = 10
   print('\nEvolution process starts')

Évaluer l'ensemble de la population -

fitnesses = list(map(toolbox.evaluate, population))
for ind, fit in zip(population, fitnesses):
   ind.fitness.values = fit
print('\nEvaluated', len(population), 'individuals')

Créer et itérer à travers les générations -

for g in range(num_generations):
   print("\n- Generation", g)

Sélection des individus de la prochaine génération -

offspring = toolbox.select(population, len(population))

Maintenant, clonez les individus sélectionnés -

offspring = list(map(toolbox.clone, offspring))

Appliquer le croisement et la mutation sur la progéniture -

for child1, child2 in zip(offspring[::2], offspring[1::2]):
   if random.random() < probab_crossing:
   toolbox.mate(child1, child2)

Supprimer la valeur de fitness de l'enfant

del child1.fitness.values
del child2.fitness.values

Maintenant, appliquez la mutation -

for mutant in offspring:
   if random.random() < probab_mutating:
   toolbox.mutate(mutant)
   del mutant.fitness.values

Évaluer les individus dont l'aptitude physique est invalide -

invalid_ind = [ind for ind in offspring if not ind.fitness.valid]
fitnesses = map(toolbox.evaluate, invalid_ind)
for ind, fit in zip(invalid_ind, fitnesses):
   ind.fitness.values = fit
print('Evaluated', len(invalid_ind), 'individuals')

Maintenant, remplacez la population par l'individu de la prochaine génération -

population[:] = offspring

Imprimer les statistiques des générations actuelles -

fits = [ind.fitness.values[0] for ind in population]
length = len(population)
mean = sum(fits) / length
sum2 = sum(x*x for x in fits)
std = abs(sum2 / length - mean**2)**0.5
print('Min =', min(fits), ', Max =', max(fits))
print('Average =', round(mean, 2), ', Standard deviation =',
round(std, 2))
print("\n- Evolution ends")

Imprimer la sortie finale -

best_ind = tools.selBest(population, 1)[0]
   print('\nBest individual:\n', best_ind)
   print('\nNumber of ones:', sum(best_ind))
Following would be the output:
Evolution process starts
Evaluated 500 individuals
- Generation 0
Evaluated 295 individuals
Min = 32.0 , Max = 45.0
Average = 40.29 , Standard deviation = 2.61
- Generation 1
Evaluated 292 individuals
Min = 34.0 , Max = 45.0
Average = 42.35 , Standard deviation = 1.91
- Generation 2
Evaluated 277 individuals
Min = 37.0 , Max = 45.0
Average = 43.39 , Standard deviation = 1.46
… … … …
- Generation 9
Evaluated 299 individuals
Min = 40.0 , Max = 45.0
Average = 44.12 , Standard deviation = 1.11
- Evolution ends
Best individual:
[0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0, 1, 
 1, 0, 0, 0, 1, 0, 0, 0, 1, 1, 0, 0, 0, 1, 0, 0, 0,
 1, 0, 0, 1, 1, 1, 0, 0, 1, 0, 1]
Number of ones: 15

Problème de régression de symboles

C'est l'un des problèmes les plus connus de la programmation génétique. Tous les problèmes de régression symbolique utilisent une distribution de données arbitraire et tentent d'ajuster les données les plus précises avec une formule symbolique. Habituellement, une mesure comme le RMSE (Root Mean Square Error) est utilisée pour mesurer la forme physique d'un individu. C'est un problème de régresseur classique et ici nous utilisons l'équation5x3-6x2+8x=1. Nous devons suivre toutes les étapes comme suit dans l'exemple ci-dessus, mais la partie principale serait de créer les ensembles primitifs car ce sont les blocs de construction pour les individus afin que l'évaluation puisse commencer. Ici, nous utiliserons l'ensemble classique de primitives.

Le code Python suivant explique cela en détail -

import operator
import math
import random
import numpy as np
from deap import algorithms, base, creator, tools, gp
def division_operator(numerator, denominator):
   if denominator == 0:
      return 1
   return numerator / denominator
def eval_func(individual, points):
   func = toolbox.compile(expr=individual)
   return math.fsum(mse) / len(points),
def create_toolbox():
   pset = gp.PrimitiveSet("MAIN", 1)
   pset.addPrimitive(operator.add, 2)
   pset.addPrimitive(operator.sub, 2)
   pset.addPrimitive(operator.mul, 2)
   pset.addPrimitive(division_operator, 2)
   pset.addPrimitive(operator.neg, 1)
   pset.addPrimitive(math.cos, 1)
   pset.addPrimitive(math.sin, 1)
   pset.addEphemeralConstant("rand101", lambda: random.randint(-1,1))
   pset.renameArguments(ARG0 = 'x')
   creator.create("FitnessMin", base.Fitness, weights = (-1.0,))
   creator.create("Individual",gp.PrimitiveTree,fitness=creator.FitnessMin)
   toolbox = base.Toolbox()
   toolbox.register("expr", gp.genHalfAndHalf, pset=pset, min_=1, max_=2)
   toolbox.expr)
   toolbox.register("population",tools.initRepeat,list, toolbox.individual)
   toolbox.register("compile", gp.compile, pset = pset)
   toolbox.register("evaluate", eval_func, points = [x/10. for x in range(-10,10)])
   toolbox.register("select", tools.selTournament, tournsize = 3)
   toolbox.register("mate", gp.cxOnePoint)
   toolbox.register("expr_mut", gp.genFull, min_=0, max_=2)
   toolbox.register("mutate", gp.mutUniform, expr = toolbox.expr_mut, pset = pset)
   toolbox.decorate("mate", gp.staticLimit(key = operator.attrgetter("height"), max_value = 17))
   toolbox.decorate("mutate", gp.staticLimit(key = operator.attrgetter("height"), max_value = 17))
   return toolbox
if __name__ == "__main__":
   random.seed(7)
   toolbox = create_toolbox()
   population = toolbox.population(n = 450)
   hall_of_fame = tools.HallOfFame(1)
   stats_fit = tools.Statistics(lambda x: x.fitness.values)
   stats_size = tools.Statistics(len)
   mstats = tools.MultiStatistics(fitness=stats_fit, size = stats_size)
   mstats.register("avg", np.mean)
   mstats.register("std", np.std)
   mstats.register("min", np.min)
   mstats.register("max", np.max)
   probab_crossover = 0.4
   probab_mutate = 0.2
   number_gen = 10
   population, log = algorithms.eaSimple(population, toolbox,
      probab_crossover, probab_mutate, number_gen,
      stats = mstats, halloffame = hall_of_fame, verbose = True)

Notez que toutes les étapes de base sont les mêmes que celles utilisées lors de la génération de modèles de bits. Ce programme nous donnera la sortie sous forme de min, max, std (écart type) après 10 générations.

La vision par ordinateur concerne la modélisation et la reproduction de la vision humaine à l'aide de logiciels et de matériel informatique. Dans ce chapitre, vous en apprendrez plus à ce sujet.

Vision par ordinateur

La vision par ordinateur est une discipline qui étudie comment reconstruire, interrompre et comprendre une scène 3D à partir de ses images 2D, en fonction des propriétés de la structure présente dans la scène.

Hiérarchie de la vision par ordinateur

La vision par ordinateur est divisée en trois catégories de base comme suit -

  • Low-level vision - Il comprend une image de processus pour l'extraction des caractéristiques.

  • Intermediate-level vision - Il comprend la reconnaissance d'objets et l'interprétation de scènes 3D

  • High-level vision - Il comprend une description conceptuelle d'une scène comme l'activité, l'intention et le comportement.

Vision par ordinateur vs traitement d'image

Le traitement d'image étudie la transformation d'image en image. L'entrée et la sortie du traitement d'image sont toutes deux des images.

La vision par ordinateur est la construction de descriptions explicites et significatives d'objets physiques à partir de leur image. Le résultat de la vision par ordinateur est une description ou une interprétation de structures dans une scène 3D.

Applications

La vision par ordinateur trouve des applications dans les domaines suivants -

Robotics

  • Localisation: déterminez automatiquement l'emplacement du robot

  • Navigation

  • Évitement des obstacles

  • Assemblage (peg-in-hole, soudure, peinture)

  • Manipulation (par exemple, manipulateur de robot PUMA)

  • Human Robot Interaction (HRI): la robotique intelligente pour interagir et servir les gens

Medicine

  • Classification et détection (par exemple, classification des lésions ou des cellules et détection des tumeurs)

  • Segmentation 2D / 3D

  • Reconstruction d'organes humains en 3D (IRM ou échographie)

  • Chirurgie robotique guidée par la vision

Security

  • Biométrie (iris, empreinte digitale, reconnaissance faciale)
  • Surveillance-détection de certaines activités ou comportements suspects

Transportation

  • Véhicule autonome
  • Sécurité, p. Ex. Surveillance de la vigilance du conducteur

Industrial Automation Application

  • Inspection industrielle (détection de défauts)
  • Assembly
  • Lecture de codes-barres et d'étiquettes d'emballage
  • Tri d'objets
  • Compréhension des documents (par exemple OCR)

Installer des packages utiles

Pour la vision par ordinateur avec Python, vous pouvez utiliser une bibliothèque populaire appelée OpenCV(Open Source Computer Vision). Il s'agit d'une bibliothèque de fonctions de programmation principalement destinées à la vision par ordinateur en temps réel. Il est écrit en C ++ et son interface principale est en C ++. Vous pouvez installer ce package à l'aide de la commande suivante -

pip install opencv_python-X.X-cp36-cp36m-winX.whl

Ici, X représente la version de Python installée sur votre machine ainsi que le win32 ou 64 bits que vous avez.

Si vous utilisez le anaconda environnement, puis utilisez la commande suivante pour installer OpenCV -

conda install -c conda-forge opencv

Lire, écrire et afficher une image

La plupart des applications CV ont besoin d'obtenir les images en entrée et de produire les images en sortie. Dans cette section, vous apprendrez à lire et à écrire un fichier image à l'aide des fonctions fournies par OpenCV.

Fonctions OpenCV pour lire, afficher, écrire un fichier image

OpenCV fournit les fonctions suivantes à cet effet -

  • imread() function- C'est la fonction de lecture d'une image. OpenCV imread () prend en charge divers formats d'image tels que PNG, JPEG, JPG, TIFF, etc.

  • imshow() function- C'est la fonction pour afficher une image dans une fenêtre. La fenêtre s'adapte automatiquement à la taille de l'image. OpenCV imshow () prend en charge divers formats d'image tels que PNG, JPEG, JPG, TIFF, etc.

  • imwrite() function- C'est la fonction d'écriture d'une image. OpenCV imwrite () prend en charge divers formats d'image tels que PNG, JPEG, JPG, TIFF, etc.

Exemple

Cet exemple montre le code Python pour lire une image dans un format - l'afficher dans une fenêtre et écrire la même image dans un autre format. Considérez les étapes ci-dessous -

Importez le package OpenCV comme indiqué -

import cv2

Maintenant, pour lire une image particulière, utilisez la fonction imread () -

image = cv2.imread('image_flower.jpg')

Pour afficher l'image, utilisez le imshow()fonction. Le nom de la fenêtre dans laquelle vous pouvez voir l'image seraitimage_flower.

cv2.imshow('image_flower',image)
cv2.destroyAllwindows()

Maintenant, nous pouvons écrire la même image dans l'autre format, disons .png en utilisant la fonction imwrite () -

cv2.imwrite('image_flower.png',image)

La sortie True signifie que l'image a été écrite avec succès en tant que fichier .png également dans le même dossier.

True

Remarque - La fonction destroyallWindows () détruit simplement toutes les fenêtres que nous avons créées.

Conversion d'espace colorimétrique

Dans OpenCV, les images ne sont pas stockées en utilisant la couleur RVB conventionnelle, mais elles sont stockées dans l'ordre inverse, c'est-à-dire dans l'ordre BGR. Par conséquent, le code couleur par défaut lors de la lecture d'une image est BGR. lecvtColor() fonction de conversion des couleurs pour convertir l'image d'un code couleur à un autre.

Exemple

Considérez cet exemple pour convertir une image de BGR en niveaux de gris.

Importez le OpenCV paquet comme indiqué -

import cv2

Maintenant, pour lire une image particulière, utilisez la fonction imread () -

image = cv2.imread('image_flower.jpg')

Maintenant, si nous voyons cette image en utilisant imshow() fonction, alors nous pouvons voir que cette image est en BGR.

cv2.imshow('BGR_Penguins',image)

Maintenant, utilisez cvtColor() fonction pour convertir cette image en niveaux de gris.

image = cv2.cvtColor(image,cv2.COLOR_BGR2GRAY)
cv2.imshow('gray_penguins',image)

Détection des bords

Les humains, après avoir vu un croquis approximatif, peuvent facilement reconnaître de nombreux types d'objets et leurs poses. C'est pourquoi les arêtes jouent un rôle important dans la vie des humains ainsi que dans les applications de la vision par ordinateur. OpenCV fournit une fonction très simple et utile appeléeCanny()pour détecter les bords.

Exemple

L'exemple suivant montre une identification claire des arêtes.

Importez le package OpenCV comme indiqué -

import cv2
import numpy as np

Maintenant, pour lire une image particulière, utilisez le imread() fonction.

image = cv2.imread('Penguins.jpg')

Maintenant, utilisez le Canny () fonction de détection des bords de l'image déjà lue.

cv2.imwrite(‘edges_Penguins.jpg’,cv2.Canny(image,200,300))

Maintenant, pour afficher l'image avec des bords, utilisez la fonction imshow ().

cv2.imshow(‘edges’, cv2.imread(‘‘edges_Penguins.jpg’))

Ce programme Python créera une image nommée edges_penguins.jpg avec détection des bords.

Détection facial

La détection des visages est l'une des applications fascinantes de la vision par ordinateur qui la rend plus réaliste et futuriste. OpenCV dispose d'une fonction intégrée pour effectuer la détection des visages. Nous allons utiliser leHaar classificateur en cascade pour la détection de visage.

Données Haar Cascade

Nous avons besoin de données pour utiliser le classificateur en cascade Haar. Vous pouvez trouver ces données dans notre package OpenCV. Après avoir installé OpenCv, vous pouvez voir le nom du dossierhaarcascades. Il y aurait des fichiers .xml pour différentes applications. Maintenant, copiez-les tous pour une utilisation différente et collez-les ensuite dans un nouveau dossier sous le projet actuel.

Example

Ce qui suit est le code Python utilisant Haar Cascade pour détecter le visage d'Amitabh Bachan montré dans l'image suivante -

Importez le OpenCV paquet comme indiqué -

import cv2
import numpy as np

Maintenant, utilisez le HaarCascadeClassifier pour détecter le visage -

face_detection=
cv2.CascadeClassifier('D:/ProgramData/cascadeclassifier/
haarcascade_frontalface_default.xml')

Maintenant, pour lire une image particulière, utilisez le imread() fonction -

img = cv2.imread('AB.jpg')

Maintenant, convertissez-le en niveaux de gris car il accepterait les images grises -

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

Maintenant, en utilisant face_detection.detectMultiScale, effectuer une détection de visage réelle

faces = face_detection.detectMultiScale(gray, 1.3, 5)

Maintenant, dessinez un rectangle autour de tout le visage -

for (x,y,w,h) in faces:
   img = cv2.rectangle(img,(x,y),(x+w, y+h),(255,0,0),3)
cv2.imwrite('Face_AB.jpg',img)

Ce programme Python créera une image nommée Face_AB.jpg avec détection de visage comme indiqué

Détection des yeux

La détection oculaire est une autre application fascinante de la vision par ordinateur qui la rend plus réaliste et futuriste. OpenCV dispose d'une fonction intégrée pour effectuer la détection des yeux. Nous allons utiliser leHaar cascade classificateur pour la détection des yeux.

Exemple

L'exemple suivant donne le code Python utilisant Haar Cascade pour détecter le visage d'Amitabh Bachan donné dans l'image suivante -

Importez le package OpenCV comme indiqué -

import cv2
import numpy as np

Maintenant, utilisez le HaarCascadeClassifier pour détecter le visage -

eye_cascade = cv2.CascadeClassifier('D:/ProgramData/cascadeclassifier/haarcascade_eye.xml')

Maintenant, pour lire une image particulière, utilisez le imread() fonction

img = cv2.imread('AB_Eye.jpg')

Maintenant, convertissez-le en niveaux de gris car il accepterait les images grises -

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

Maintenant avec l'aide de eye_cascade.detectMultiScale, effectuer une détection de visage réelle

eyes = eye_cascade.detectMultiScale(gray, 1.03, 5)

Maintenant, dessinez un rectangle autour de tout le visage -

for (ex,ey,ew,eh) in eyes:
   img = cv2.rectangle(img,(ex,ey),(ex+ew, ey+eh),(0,255,0),2)
cv2.imwrite('Eye_AB.jpg',img)

Ce programme Python créera une image nommée Eye_AB.jpg avec détection des yeux comme indiqué -

Artificial Neural Network (ANN) c'est un système informatique efficace, dont le thème central est emprunté à l'analogie des réseaux de neurones biologiques. Les réseaux de neurones sont un type de modèle pour l'apprentissage automatique. Au milieu des années 80 et au début des années 90, des avancées architecturales importantes ont été réalisées dans les réseaux de neurones. Dans ce chapitre, vous en apprendrez plus sur le Deep Learning, une approche de l'IA.

L'apprentissage en profondeur est né de la croissance informatique explosive d'une décennie en tant que candidat sérieux dans le domaine. Ainsi, l'apprentissage en profondeur est un type particulier d'apprentissage automatique dont les algorithmes sont inspirés de la structure et du fonctionnement du cerveau humain.

Machine Learning v / s Deep Learning

L'apprentissage en profondeur est la technique d'apprentissage automatique la plus puissante de nos jours. Il est si puissant parce qu'ils apprennent la meilleure façon de représenter le problème tout en apprenant à le résoudre. Une comparaison entre l'apprentissage profond et l'apprentissage automatique est donnée ci-dessous -

Dépendance des données

Le premier point de différence est basé sur les performances de DL et ML lorsque l'échelle des données augmente. Lorsque les données sont volumineuses, les algorithmes d'apprentissage en profondeur fonctionnent très bien.

Dépendance de la machine

Les algorithmes d'apprentissage profond ont besoin de machines haut de gamme pour fonctionner parfaitement. D'un autre côté, les algorithmes d'apprentissage automatique peuvent également fonctionner sur des machines bas de gamme.

Extraction de caractéristiques

Les algorithmes d'apprentissage en profondeur peuvent extraire des fonctionnalités de haut niveau et essayer d'en tirer également des leçons. D'autre part, un expert est tenu d'identifier la plupart des fonctionnalités extraites par l'apprentissage automatique.

Temps d'exécution

Le temps d'exécution dépend des nombreux paramètres utilisés dans un algorithme. L'apprentissage en profondeur a plus de paramètres que les algorithmes d'apprentissage automatique. Par conséquent, le temps d'exécution des algorithmes DL, en particulier le temps d'apprentissage, est bien plus que les algorithmes ML. Mais le temps de test des algorithmes DL est inférieur à celui des algorithmes ML.

Approche de la résolution de problèmes

L'apprentissage profond résout le problème de bout en bout tandis que l'apprentissage automatique utilise la méthode traditionnelle de résolution du problème, c'est-à-dire en le décomposant en plusieurs parties.

Réseau neuronal convolutif (CNN)

Les réseaux de neurones convolutifs sont les mêmes que les réseaux de neurones ordinaires car ils sont également constitués de neurones qui ont des poids et des biais apprenables. Les réseaux de neurones ordinaires ignorent la structure des données d'entrée et toutes les données sont converties en tableau 1-D avant de les alimenter dans le réseau. Ce processus convient aux données normales, mais si les données contiennent des images, le processus peut être fastidieux.

CNN résout ce problème facilement. Il prend en compte la structure 2D des images lors de leur traitement, ce qui leur permet d'extraire les propriétés propres aux images. De cette manière, l'objectif principal des CNN est de passer des données d'image brutes dans la couche d'entrée à la classe correcte dans la couche de sortie. La seule différence entre un NN ordinaire et un CNN réside dans le traitement des données d'entrée et dans le type de couches.

Vue d'ensemble de l'architecture des CNN

Sur le plan architectural, les réseaux de neurones ordinaires reçoivent une entrée et la transforment à travers une série de couches cachées. Chaque couche est connectée à l'autre couche à l'aide de neurones. Le principal inconvénient des réseaux de neurones ordinaires est qu'ils ne s'adaptent pas bien aux images complètes.

L'architecture des CNN a des neurones disposés en 3 dimensions appelées largeur, hauteur et profondeur. Chaque neurone de la couche actuelle est connecté à un petit patch de la sortie de la couche précédente. C'est similaire à la superposition d'un×filtre sur l'image d'entrée. Il utiliseMfiltres pour être sûr d'obtenir tous les détails. Celles-ciM Les filtres sont des extracteurs de caractéristiques qui extraient des caractéristiques telles que les bords, les coins, etc.

Couches utilisées pour construire des CNN

Les couches suivantes sont utilisées pour construire des CNN -

  • Input Layer - Il prend les données d'image brutes telles quelles.

  • Convolutional Layer- Cette couche est le bloc de construction de base des CNN qui effectue la plupart des calculs. Cette couche calcule les convolutions entre les neurones et les différents patchs en entrée.

  • Rectified Linear Unit Layer- Il applique une fonction d'activation à la sortie de la couche précédente. Il ajoute de la non-linéarité au réseau afin qu'il puisse bien se généraliser à tout type de fonction.

  • Pooling Layer- La mutualisation nous aide à ne conserver que les parties importantes au fur et à mesure que nous progressons dans le réseau. La couche de regroupement fonctionne indépendamment sur chaque tranche de profondeur de l'entrée et la redimensionne spatialement. Il utilise la fonction MAX.

  • Fully Connected layer/Output layer - Cette couche calcule les scores de sortie dans la dernière couche. La sortie résultante est de la taille×× , où L est le nombre de classes d'ensemble de données d'entraînement.

Installer des packages Python utiles

Vous pouvez utiliser Keras, qui est une API de réseaux de neurones de haut niveau, écrite en Python et capable de s'exécuter au-dessus de TensorFlow, CNTK ou Theno. Il est compatible avec Python 2.7-3.6. Vous pouvez en savoir plus surhttps://keras.io/.

Utilisez les commandes suivantes pour installer keras -

pip install keras

Sur conda environnement, vous pouvez utiliser la commande suivante -

conda install –c conda-forge keras

Création d'un régresseur linéaire à l'aide de ANN

Dans cette section, vous apprendrez à créer un régresseur linéaire à l'aide de réseaux de neurones artificiels. Vous pouvez utiliserKerasRegressorpour y parvenir. Dans cet exemple, nous utilisons l'ensemble de données sur les prix des logements de Boston avec 13 valeurs numériques pour les propriétés à Boston. Le code Python pour le même est montré ici -

Importez tous les packages requis comme indiqué -

import numpy
import pandas
from keras.models import Sequential
from keras.layers import Dense
from keras.wrappers.scikit_learn import KerasRegressor
from sklearn.model_selection import cross_val_score
from sklearn.model_selection import KFold

Maintenant, chargez notre jeu de données qui est enregistré dans le répertoire local.

dataframe = pandas.read_csv("/Usrrs/admin/data.csv", delim_whitespace = True, header = None)
dataset = dataframe.values

Maintenant, divisez les données en variables d'entrée et de sortie, c'est-à-dire X et Y -

X = dataset[:,0:13]
Y = dataset[:,13]

Puisque nous utilisons des réseaux de neurones de base, définissez le modèle -

def baseline_model():

Maintenant, créez le modèle comme suit -

model_regressor = Sequential()
model_regressor.add(Dense(13, input_dim = 13, kernel_initializer = 'normal', 
   activation = 'relu'))
model_regressor.add(Dense(1, kernel_initializer = 'normal'))

Ensuite, compilez le modèle -

model_regressor.compile(loss='mean_squared_error', optimizer='adam')
return model_regressor

Maintenant, corrigez la graine aléatoire pour la reproductibilité comme suit -

seed = 7
numpy.random.seed(seed)

Objet wrapper Keras à utiliser dans scikit-learn comme un estimateur de régression est appelé KerasRegressor. Dans cette section, nous évaluerons ce modèle avec un jeu de données normalisé.

estimator = KerasRegressor(build_fn = baseline_model, nb_epoch = 100, batch_size = 5, verbose = 0)
kfold = KFold(n_splits = 10, random_state = seed)
baseline_result = cross_val_score(estimator, X, Y, cv = kfold)
print("Baseline: %.2f (%.2f) MSE" % (Baseline_result.mean(),Baseline_result.std()))

La sortie du code ci-dessus serait l'estimation de la performance du modèle sur le problème pour les données invisibles. Ce sera l'erreur quadratique moyenne, y compris la moyenne et l'écart type sur les 10 plis de l'évaluation de validation croisée.

Classificateur d'images: une application d'apprentissage en profondeur

Les réseaux de neurones convolutifs (CNN) résolvent un problème de classification d'image, c'est-à-dire à quelle classe appartient l'image d'entrée. Vous pouvez utiliser la bibliothèque d'apprentissage en profondeur Keras. Notez que nous utilisons l'ensemble de données d'entraînement et de test d'images de chats et de chiens à partir du lien suivanthttps://www.kaggle.com/c/dogs-vs-cats/data.

Importez les bibliothèques et packages keras importants comme indiqué -

Le package suivant appelé séquentiel initialisera les réseaux neuronaux en tant que réseau séquentiel.

from keras.models import Sequential

Le package suivant appelé Conv2D est utilisé pour effectuer l'opération de convolution, la première étape de CNN.

from keras.layers import Conv2D

Le package suivant appelé MaxPoling2D est utilisé pour effectuer l'opération de mise en commun, la deuxième étape de CNN.

from keras.layers import MaxPooling2D

Le package suivant appelé Flatten est le processus de conversion de tous les tableaux 2D résultants en un seul vecteur linéaire long et continu.

from keras.layers import Flatten

Le package suivant appelé Dense est utilisé pour effectuer la connexion complète du réseau neuronal, la quatrième étape de CNN.

from keras.layers import Dense

Maintenant, créez un objet de la classe séquentielle.

S_classifier = Sequential()

Maintenant, l'étape suivante consiste à coder la partie convolution.

S_classifier.add(Conv2D(32, (3, 3), input_shape = (64, 64, 3), activation = 'relu'))

Ici relu est la fonction redresseur.

Maintenant, l'étape suivante de CNN est l'opération de mise en commun sur les cartes de caractéristiques résultantes après la partie convolution.

S-classifier.add(MaxPooling2D(pool_size = (2, 2)))

Maintenant, convertissez toutes les images regroupées en un vecteur continu en utilisant flatteur -

S_classifier.add(Flatten())

Ensuite, créez une couche entièrement connectée.

S_classifier.add(Dense(units = 128, activation = 'relu'))

Ici, 128 est le nombre d'unités cachées. Il est courant de définir le nombre d'unités cachées comme la puissance de 2.

Maintenant, initialisez la couche de sortie comme suit -

S_classifier.add(Dense(units = 1, activation = 'sigmoid'))

Maintenant, compilez le CNN, nous avons construit -

S_classifier.compile(optimizer = 'adam', loss = 'binary_crossentropy', metrics = ['accuracy'])

Ici, le paramètre d'optimisation consiste à choisir l'algorithme de descente de gradient stochastique, le paramètre de perte consiste à choisir la fonction de perte et le paramètre de métrique à choisir la métrique de performance.

Maintenant, effectuez des augmentations d'image, puis adaptez les images aux réseaux de neurones -

train_datagen = ImageDataGenerator(rescale = 1./255,shear_range = 0.2,
zoom_range = 0.2,
horizontal_flip = True)
test_datagen = ImageDataGenerator(rescale = 1./255)

training_set = 
   train_datagen.flow_from_directory(”/Users/admin/training_set”,target_size = 
      (64, 64),batch_size = 32,class_mode = 'binary')

test_set = 
   test_datagen.flow_from_directory('test_set',target_size = 
      (64, 64),batch_size = 32,class_mode = 'binary')

Maintenant, adaptez les données au modèle que nous avons créé -

classifier.fit_generator(training_set,steps_per_epoch = 8000,epochs = 
25,validation_data = test_set,validation_steps = 2000)

Ici, steps_per_epoch contient le nombre d'images d'entraînement.

Maintenant que le modèle a été formé, nous pouvons l'utiliser pour la prédiction comme suit -

from keras.preprocessing import image

test_image = image.load_img('dataset/single_prediction/cat_or_dog_1.jpg', 
target_size = (64, 64))

test_image = image.img_to_array(test_image)

test_image = np.expand_dims(test_image, axis = 0)

result = classifier.predict(test_image)

training_set.class_indices

if result[0][0] == 1:
prediction = 'dog'

else:
   prediction = 'cat'