Créativité marginale maximale

May 04 2023
En 1998, Jaime Carbonell et Jade Goldstein ont proposé la pertinence marginale maximale (MMR) comme moyen d'équilibrer les préoccupations de pertinence et de diversité. Cette mesure est certainement utile dans le contexte de la diversité des résultats de recherche.

En 1998, Jaime Carbonell et Jade Goldstein ont proposé la pertinence marginale maximale (MMR) comme moyen d'équilibrer les préoccupations de pertinence et de diversité. Cette mesure est certainement utile dans le contexte de la diversité des résultats de recherche . Mais je pense que cela nous aide aussi à réfléchir à la créativité à l'ère de l'IA générative .

Les gens sont préoccupés par ChatGPT et d'autres outils d'IA générative pour diverses raisons. Ils craignent la désinformation sous la forme de textes, d'images, d'audio et de vidéo falsifiés de manière convaincante. Ils craignent que l'automatisation ne perturbe le marché mondial du travail, en mettant des personnes au chômage et en rendant leurs compétences obsolètes. Certaines personnes craignent même une apocalypse pilotée par Skynet .

La préoccupation la plus importante et la plus immédiate est peut-être que l'IA générative menace les moyens de subsistance des créateurs et même la créativité elle-même. Les écrivains et les artistes de divers médias craignent et s'opposent à ce que leur art ou leur style soit copié ou imité par des modèles d'IA génératifs formés à leur travail. Les créateurs dont les moyens de subsistance dépendent du paiement de leur travail ont de bonnes raisons de repousser la marchandisation. Certains créateurs intentent même une action en justice pour tenter d'empêcher l'IA générative d'utiliser leur travail comme données d'entraînement.

Je suis sympathique à ces créateurs, mais je suis également sceptique quant aux approches qui cherchent à interdire l'apprentissage à partir des créations, au lieu de les copier. Toute automatisation, remontant à la révolution industrielle, est une forme d'entraînement des machines basée sur les résultats de l'effort humain. L'automatisation a littéralement déprécié de nombreuses formes de travail humain, dont nous ne pensons plus au travail que les gens devraient effectuer. Peut-être que l'impact potentiel de l'IA générative est qualitativement différent, mais je suis prudent quant à la négation d'un principe qui a été la clé du progrès de l'humanité au cours des siècles.

Carbonell et Goldstein ont défini la pertinence marginale d'un résultat de recherche comme une combinaison de sa pertinence par rapport à la requête et de sa distinction par rapport aux autres résultats. Leur définition formalise l'intuition que les doublons et les quasi-doubles de résultats pertinents ne sont pas utiles pour les chercheurs.

Peut-on appliquer le même principe à la créativité ? Il est clair qu'une copie littérale d'une œuvre n'apporte aucune valeur supplémentaire, et n'apporte donc aucune créativité marginale. De même, une œuvre hautement dérivée n'apporte pas beaucoup de valeur et démontre donc peu de créativité marginale.

Certains créateurs pourraient célébrer une telle norme comme démontrant la valeur de la créativité humaine par rapport à ce que l'IA générative peut produire. Mais je ne serais pas si prompt à sauter à cette conclusion. Après tout, de nombreuses personnes ont recours à la copie ou à la production d'œuvres hautement dérivées. À l'inverse, l'IA générative s'est montrée capable de produire de nouveaux résultats qui ne sont pas, du moins de manière évidente, très dérivés des travaux existants.

Bien sûr, tout travail créatif est dérivé dans le sens où il s'appuie sur ce qui a été créé avant lui. Je soupçonne que même l'Ecclésiaste n'a pas été le premier à remarquer qu' « il n'y a rien de nouveau sous le soleil ». La question n'est pas de savoir si une nouvelle œuvre est dérivée, mais plutôt quelle quantité de nouveauté elle ajoute à la totalité de l'œuvre qui l'a précédée.

Considérez l'expérience de pensée suivante : si un modèle d'IA générative n'avait pas accès à une donnée de formation particulière, dans quelle mesure ce manque d'accès limiterait-il ou affecterait-il autrement sa sortie ? Et s'il n'avait pas accès à quoi que ce soit produit par un auteur ou un artiste particulier ? Ce type d'analyse de sensibilité pourrait nous aider à quantifier la différence entre copier des données et apprendre à partir de données, et arriver à une notion de créativité marginale. Après tout, si la sortie d'un modèle d'IA générative dépend de manière si critique de cette entrée ou de cet auteur, nous pouvons raisonnablement conclure que le modèle s'appuie si fortement sur cette entrée ou cet auteur qu'il ajoute un minimum de créativité.

Je reconnais qu'il est encore plus difficile de mesurer la créativité marginale que de mesurer la pertinence marginale - ce qui est déjà assez difficile ! — et je ne m'attends pas à ce que cette expérience de pensée soit facile à mettre en pratique. Pourtant, je soupçonne que nous devrons suivre cette voie pour parvenir à une définition de la créativité qui offre des conditions de concurrence équitables pour les humains et l'IA générative.

En attendant, j'espère que mes propres pensées dérivées continueront d'être suffisamment informatives, perspicaces et divertissantes pour ne pas être remplacées par une IA générative de sitôt !