AI - Agents et environnements

Un système d'IA est composé d'un agent et de son environnement. Les agents agissent dans leur environnement. L'environnement peut contenir d'autres agents.

Que sont l'agent et l'environnement?

Un agent est tout ce qui peut percevoir son environnement à travers sensors et agit sur cet environnement à travers effectors.

  • UNE human agent a des organes sensoriels tels que les yeux, les oreilles, le nez, la langue et la peau parallèles aux capteurs, et d'autres organes tels que les mains, les jambes, la bouche, pour les effecteurs.

  • UNE robotic agent remplace les caméras et les télémètres infrarouges pour les capteurs, et divers moteurs et actionneurs pour les effecteurs.

  • UNE software agent a codé des chaînes de bits comme programmes et actions.

Terminologie des agents

  • Performance Measure of Agent - Ce sont les critères qui déterminent le succès d'un agent.

  • Behavior of Agent - C'est l'action que l'agent effectue après une séquence donnée de percepts.

  • Percept - Ce sont les entrées perceptives de l'agent à une instance donnée.

  • Percept Sequence - C'est l'histoire de tout ce qu'un agent a perçu jusqu'à ce jour.

  • Agent Function - C'est une carte de la séquence précepte à une action.

Rationalité

La rationalité n'est rien d'autre que le statut d'être raisonnable, sensé et d'avoir un bon sens du jugement.

La rationalité concerne les actions et les résultats attendus en fonction de ce que l'agent a perçu. Réaliser des actions dans le but d'obtenir des informations utiles est un élément important de la rationalité.

Qu'est-ce que Ideal Rational Agent?

Un agent rationnel idéal est celui qui est capable de faire les actions attendues pour maximiser sa mesure de performance, sur la base de -

  • Sa séquence de perception
  • Sa base de connaissances intégrée

La rationalité d'un agent dépend de ce qui suit -

  • le performance measures, qui déterminent le degré de réussite.

  • Agents Percept Sequence jusqu'à maintenant.

  • L'agent prior knowledge about the environment.

  • le actions que l'agent peut réaliser.

Un agent rationnel effectue toujours la bonne action, où la bonne action signifie l'action qui fait que l'agent réussit le mieux dans la séquence de perception donnée. Le problème que l'agent résout est caractérisé par la mesure de performance, l'environnement, les actionneurs et les capteurs (PEAS).

La structure des agents intelligents

La structure de l'agent peut être considérée comme -

  • Agent = architecture + programme d'agent
  • Architecture = la machine sur laquelle un agent s'exécute.
  • Programme d'agent = une implémentation d'une fonction d'agent.

Agents réflexes simples

  • Ils choisissent des actions uniquement en fonction de la perception actuelle.
  • Ils ne sont rationnels que si une décision correcte est prise uniquement sur la base du précepte actuel.
  • Leur environnement est complètement observable.

Condition-Action Rule - C'est une règle qui mappe un état (condition) à une action.

Agents réflexes basés sur un modèle

Ils utilisent un modèle du monde pour choisir leurs actions. Ils maintiennent un état interne.

Model - connaissance de «comment les choses se passent dans le monde».

Internal State - C'est une représentation d'aspects non observés de l'état actuel en fonction de l'historique de perception.

Updating the state requires the information about −

  • Comment le monde évolue.
  • Comment les actions de l'agent affectent le monde.

Agents basés sur les objectifs

Ils choisissent leurs actions pour atteindre leurs objectifs. L'approche basée sur les objectifs est plus flexible que l'agent réflexe puisque les connaissances à l'appui d'une décision sont explicitement modélisées, permettant ainsi des modifications.

Goal - C'est la description des situations souhaitables.

Agents basés sur les utilitaires

Ils choisissent des actions en fonction d'une préférence (utilité) pour chaque état.

Les objectifs sont insuffisants lorsque -

  • Il existe des objectifs contradictoires, dont seuls quelques-uns peuvent être atteints.

  • Les objectifs ont une certaine incertitude quant à leur réalisation et vous devez évaluer les chances de succès par rapport à l'importance d'un objectif.

La nature des environnements

Certains programmes fonctionnent entièrement artificial environment limité à la saisie au clavier, à la base de données, aux systèmes de fichiers informatiques et à la sortie de caractères sur un écran.

En revanche, certains agents logiciels (robots logiciels ou softbots) existent dans des domaines de softbots riches et illimités. Le simulateur a unvery detailed, complex environment. L'agent logiciel doit choisir parmi un large éventail d'actions en temps réel. Un softbot conçu pour scanner les préférences en ligne du client et montrer les articles intéressants au client fonctionne dans lereal ainsi qu'un artificial environnement.

Le plus connu artificial environment est le Turing Test environment, dans lequel un agent réel et d'autres agents artificiels sont testés sur un pied d'égalité. Il s'agit d'un environnement très difficile car il est très difficile pour un agent logiciel de fonctionner aussi bien qu'un humain.

Test de Turing

Le succès d'un comportement intelligent d'un système peut être mesuré avec le test de Turing.

Deux personnes et une machine à évaluer participent au test. Sur les deux personnes, l'une joue le rôle du testeur. Chacun d'eux se trouve dans des pièces différentes. Le testeur ne sait pas qui est une machine et qui est un humain. Il interroge les questions en les tapant et en les envoyant aux deux intelligences, auxquelles il reçoit des réponses dactylographiées.

Ce test vise à tromper le testeur. Si le testeur ne parvient pas à déterminer la réponse de la machine à partir de la réponse humaine, alors la machine est dite intelligente.

Propriétés de l'environnement

L'environnement a de multiples propriétés -

  • Discrete / Continuous- S'il existe un nombre limité d'états distincts et clairement définis de l'environnement, l'environnement est discret (par exemple, les échecs); sinon, il est continu (par exemple, la conduite).

  • Observable / Partially Observable- s'il est possible de déterminer l'état complet de l'environnement à chaque instant à partir des percepts, il est observable; sinon, il n'est que partiellement observable.

  • Static / Dynamic- Si l'environnement ne change pas pendant qu'un agent agit, alors il est statique; sinon c'est dynamique.

  • Single agent / Multiple agents - L'environnement peut contenir d'autres agents qui peuvent être de nature identique ou différente de celle de l'agent.

  • Accessible / Inaccessible - Si l'appareil sensoriel de l'agent peut avoir accès à l'état complet de l'environnement, alors l'environnement est accessible à cet agent.

  • Deterministic / Non-deterministic- Si l'état suivant de l'environnement est complètement déterminé par l'état actuel et les actions de l'agent, alors l'environnement est déterministe; sinon, il est non déterministe.

  • Episodic / Non-episodic- Dans un environnement épisodique, chaque épisode consiste en ce que l'agent perçoit puis agit. La qualité de son action dépend uniquement de l'épisode lui-même. Les épisodes suivants ne dépendent pas des actions des épisodes précédents. Les environnements épisodiques sont beaucoup plus simples car l'agent n'a pas besoin de penser à l'avenir.