Mises à jour de l'IA : la fusée Auto-GPT, les enfants bon marché de LLaMA, et plus encore

May 09 2023
Cette vague d'IA est loin d'atteindre son sommet
Bonjour et bienvenue dans AI Updates, où nous couvrons les derniers développements dans l'espace le plus en vogue de la technologie. Cela fait plus d'un mois depuis le dernier épisode, et tant de choses se sont passées.
Les lamas ne seront pas arrêtés ! Réalisé avec DreamStudio.

Bonjour et bienvenue dans AI Updates, où nous couvrons les derniers développements dans l'espace le plus en vogue de la technologie. Cela fait plus d'un mois depuis le dernier épisode, et tant de choses se sont passées. Je lis tous les jours et je ne me sens toujours pas rattrapé ! Plongeons-nous, étreignons des lamas et découvrons ce que la communauté de l'IA nous réserve aujourd'hui.

Comme d'habitude, cet article mentionne Microsoft, mon employeur. J'ai écrit cet article pendant mon temps libre, et toutes les opinions sont les miennes.

Nouveau sur l'IA ? Je t'ai couvert ! Commencer ici:

Découvrons l'intelligence artificielle

Agents IA et Auto-GPT

ChatGPT lit vos messages et rédige des réponses sans aucun accès à Internet. Le nouveau Bing fait la même chose, mais cherche d'abord une réponse en ligne. Et si nous demandions à l'IA d'en faire plus ? Et si nous voulions quelque chose de complexe, quelque chose qui ne pouvait pas être fait en une seule invite ?

Entrez les agents d'intelligence artificielle : des produits d'intelligence artificielle qui permettent à des modèles tels que ChatGPT d'accéder à des outils tels que la recherche sur Internet, le stockage de documents et des moteurs de calcul tels que WolframAlpha . Lorsqu'ils y sont invités, les agents définissent un objectif et planifient une série de tâches pour atteindre cet objectif. Les agents « se parlent » au fur et à mesure, raisonnant à travers un processus complexe et utilisant leurs outils pour progresser. Une agence artificielle de ce type a été imaginée pendant des siècles , mais n'était pas réalisable avant ChatGPT.

Par exemple, un agent invité à « trouver la racine carrée de l'âge du fondateur d'IBM » pourrait d'abord utiliser une recherche pour identifier le fondateur d'IBM, effectuer une nouvelle recherche pour trouver sa date de naissance, utiliser un outil de date pour connaître la date actuelle. , utilisez un outil mathématique pour obtenir une réponse finale, puis synthétisez ces informations dans une réponse de type ChatGPT. Tout cela à partir d'une seule invite.

Le 30 mars, Toran Bruce Richards a publié Auto-GPT , un agent d'intelligence artificielle propulsé par GPT-4. N'importe qui peut l'utiliser sans envoyer de données à Richards, c'est-à-dire tant qu'il est prêt à payer à OpenAI quelques centimes par millier de mots envoyés vers et depuis GPT-4. Le projet a explosé pour devenir le 30e dépôt le plus étoilé sur GitHub .

De nombreux autres agents d'intelligence artificielle existent désormais, notamment BabyAGI , AgentGPT basé sur un navigateur et Khanmigo de la Khan Academy (qui brouille la frontière entre l'agence et la mise à la terre de l'IA ). Attendez-vous à ce que d'autres produits utilisant (discrètement ?) L'agence d'intelligence artificielle soient annoncés prochainement.

Historique des étoiles Auto-GPT par rapport aux 1er, 10e et 20e dépôts GitHub les plus étoilés au 6 mai.

IA + amitié = HuggingGPT, alias Microsoft JARVIS

Pour une étude de cas de niveau recherche sur la puissance et les diverses applications des agents d'IA, ne cherchez pas plus loin que l'article HuggingGPT , publié par Microsoft Research Asia et l'Université du Zhejiang le 30 mars. Ils y étudient un agent alimenté par ChatGPT avec accès à modèles d'apprentissage automatique spécialisés du registre populaire Hugging Face.

Hugging Face est la principale plate-forme de partage de modèles d'apprentissage automatique, notamment des étiqueteurs d'images, des générateurs de vidéos, des classificateurs de texte, des outils de compréhension audio, etc. De nombreux modèles, contrairement à ChatGPT, sont hautement spécialisés et ne fonctionnent que sur des données bien structurées (au lieu d'un anglais simple), ils sont donc moins chers à exécuter et donnent de meilleurs résultats. Étant donné que HuggingGPT (également connu sous le nom de JARVIS/Jarvis ) a accès à n'importe quel modèle sur Hugging Face, il peut fonctionner de manière transparente avec les images, l'audio, le texte, la vidéo et d'autres formats de fichiers.

Dans la figure ci-dessous de l'article, nous voyons l'explication de Jarvis sur la façon dont il a généré une vidéo doublée à partir d'une simple invite de texte.

Bippity boppity boo, Jarvis a une fausse vidéo pour vous ! Adapté de la figure 4 de l'article HuggingGPT. Voir également la transcription de l'image pour tous vos besoins de copier-coller et d'utilisabilité. ‍

HustleGPT

Jusqu'à présent, nous avons donné à l'IA un accès à Internet et à des amis de Hugging Face. Et si nous lui donnions la ressource la plus puissante de toutes ?

Le 15 mars, le designer Jackson Greenhouse Fall a donné à GPT-4 la modique somme de 100 $ et lui a demandé de créer sa propre entreprise. Il prétend avoir dépensé l'argent comme son patron GPT le lui a demandé, et il est devenu viral dans le processus. L'entreprise, un blog éco-vivant de niche appelé Green Gadget Guru , n'a pas fleuri, car Fall a depuis donné la priorité à Makeshift , la communauté Discord de 3 000 membres qu'il a créée quelques jours après avoir découvert la renommée sur Internet. Un groupe dérivé utilisant le nom HustleGPT sur Twitter et Discord a récemment dépassé 6 000 membres Discord. ( Ils ont également interdit l'automne .) Comme l'a dit Yogi Berra, "il est difficile de faire des prédictions, en particulier sur l'avenir", mais la barrière pour démarrer une entreprise a certainement été considérablement réduite par les nouveaux outils d'IA.

Les nombreux enfants de LLaMA

La dernière fois sur AI Updates , nous avons couvert l'annonce de Meta LLaMA , un modèle de langage mis à la disposition des chercheurs (et divulgué le 3 mars ). Depuis lors, les gens ont construit des modèles plus spécialisés basés sur LLaMA, atteignant des performances proches de ChatGPT dans les études sur les préférences des utilisateurs. Les enfants de LLaMA incluent GPT4All , un clone ChatGPT téléchargeable gratuitement qui fonctionne sans Internet, et Stanford's Alpaca , un modèle suivant les instructions dont la démo a été fermée quatre jours après son annonce du 13 mars en raison de problèmes de sécurité. Chaque modèle a été réalisé pour moins de 1 500 dollars et peut-être un mois-personne de travail (GPT4All a été réalisé par 5 auteurs qui ont travaillé « environ quatre jours”). L'inconvénient naturel ici est la qualité inférieure des réponses, mais nous n'avons pas besoin d'une Ferrari pour nous rendre à l'épicerie, n'est-ce pas ? (Merci à Patrice Pelland, mon gestionnaire de niveau triple saut, pour avoir partagé cette analogie.)

Il existe maintenant d'innombrables autres projets basés sur LLaMA, notamment ChatLLaMA (pour former votre propre modèle basé sur LLaMA), la Vicuna interactive (formée pour 300 $) et Berkeley's Koala (formée pour moins de 100 $ !). Alors que les coûts de formation des modèles continuent de baisser, attendez-vous à voir de plus en plus de petits LLaMA arriver sur un site Web près de chez vous !

Problèmes d'anthropomorphisme de l'IA

Faire semblant que tous ces programmes sont des animaux, c'est du plaisir et des jeux, n'est-ce pas ? Eh bien, certains chercheurs ne sont pas d'accord, et l'anthropomorphisme de l'IA (c'est-à-dire l'attribution de qualités humaines à l'IA) est une préoccupation importante dans certains cercles d'experts.

Vous trouverez ci-dessous une collection de conversations bien citées commencées par Ben Shneiderman et publiées par Chenhao Tan . Il s'agit d'un débat académique engageant sur les réactions à un produit d'IA qui se réfère de manière convaincante à lui-même en tant que "je", notre tendance à s'attacher aux objets non humains et l'impact potentiel de ces technologies devenant omniprésentes. C'est rafraîchissant de voir des discours honnêtes sur les dangers de ces nouveaux outils.

Sur l'anthropomorphisme de l'IA

Et c'est terminé pour cette édition ! La communauté de l'IA a occupé le devant de la scène ce mois-ci avec des milliards de nouveaux modèles, outils et produits à essayer ! Les chercheurs de Big Tech continuent d'explorer le potentiel des modèles qui existent déjà, et les barrières pour entrer dans le domaine ont été abaissées. Les inquiétudes demeurent, et le seront toujours, mais nous pouvons nous renseigner en écoutant les conversations d'experts et en partageant nos réflexions.

Merci pour la lecture. Qu'aimeriez-vous apprendre ensuite ? Comment puis-je aider? Faites-moi savoir dans les commentaires!

Au cas où vous l'auriez manqué, voici la première entrée AI Updates :

Mises à jour de l'IA : les 10 plus grosses annonces depuis ChatGPT