Un bref guide des plus grandes entrées de NeurIPS 2022
La conférence et l'atelier sur les systèmes de traitement de l'information neuronale (NeurIPS) est l'une des conférences internationales les plus respectées sur l'apprentissage automatique (ML) et les neurosciences computationnelles. Pour NeurIPS'22 (28 novembre - 9 décembre), la Nouvelle-Orléans a été choisie pour accueillir l'événement, suivi d'un volet virtuel la deuxième semaine.
Depuis sa création en 1987, la conférence a vu une bonne part de soumissions révolutionnaires, notamment MURPHY (1988) et NeuroChess (1994), et plus récemment Word2Vec (2013) et GPT-3 (2020). Cette année, près de 3000 articles ont été acceptés. Avec tant de choses à l'ordre du jour de NeurIPS'22, voici de quoi vous aider — un petit guide sur des sujets particulièrement passionnants :
#1 Apprentissage fédéré
L'apprentissage fédéré est un sujet brûlant aujourd'hui - c'est un moyen de contourner le problème des ressources insuffisantes associées à la formation de grands modèles de langage comme GPT-3. Non seulement ces modèles sont très chers ( atteignant jusqu'à 100 millions de dollars ), mais la façon dont ils sont actuellement formés est également insoutenable.
L'apprentissage fédéré est une technique qui implique la formation de modèles ML sur des appareils périphériques sans échanges de données entre eux, ce qui rend l'ensemble du processus moins cher et moins exigeant en termes de calcul. Il y a 3 soumissions cette année qui traitent de cette question :
Les auteurs de cet article d'Alibaba proposent un benchmark des méthodes d'apprentissage fédéré personnalisé. Un autre article présente une approche théorique qui rend l'apprentissage fédéré et collaboratif plus efficace. Et enfin , cet article explique comment obtenir de meilleurs résultats avec l'apprentissage fédéré.
Une autre chose qui mérite d'être vérifiée pour quiconque s'intéresse à ce sujet est l' Atelier international sur l'apprentissage fédéré . Incidemment, tous les ateliers NeurIPS sont essentiellement des mini-conférences plus axées sur le sujet au sein de l'événement principal, de sorte que vous pouvez toujours trouver quelque chose qui correspond à vos intérêts.
#2 Fondation et modèles autorégressifs
Les modèles de base sont des modèles formés sur de grandes quantités de données non structurées qui sont ensuite affinées avec des données étiquetées pour répondre aux besoins d'un large éventail d'applications (par exemple, BERT). L'un des principaux problèmes est que pour affiner ces modèles, des paramètres supplémentaires doivent être introduits. Cela signifie une utilisation continue du GPU dans des clusters spécialisés, difficiles à acquérir et à financer.
Cet article propose une approche décentralisée et moins coûteuse pour former de grands modèles de fondation. Un autre article propose un nouveau modèle de base multimodal pour les tâches en langage image et en langage vidéo. Les auteurs de cet article basés chez Microsoft explorent comment des informations écrites peuvent être extraites d'images, ce qui implique de relier la vision par ordinateur (CV) et les modèles de langage, résultant en un nouveau système capable de produire des paragraphes descriptifs solides.
Il y a aussi cet atelier FMDM complet , dont le thème tourne autour de l'étude de la façon dont les modèles de base et la prise de décision peuvent se combiner pour résoudre des tâches complexes à grande échelle.
#3 Apprentissage par renforcement avec rétroaction humaine
L'apprentissage par renforcement est un leitmotiv chez NeurIPS depuis un certain temps. L'un des principaux problèmes auxquels nous sommes confrontés aujourd'hui est que, souvent, les grands modèles génèrent une sortie qui n'est pas alignée sur les besoins ou l'intention de l'utilisateur.
Les chercheurs auteurs de cet article présentent leur point de vue sur le réglage fin de grands modèles de langage à l'aide de l'approche de l'humain dans la boucle, à savoir comment les foules gérées peuvent être utilisées pour former un modèle de récompense pour l'apprentissage par renforcement. Cela se traduit par une augmentation spectaculaire de la qualité de la prédiction dans les applications en aval. Un autre avantage est des budgets plus petits - par rapport au modèle GPT-3 d'origine, moins de paramètres entraînables sont nécessaires.
Le même sujet alimente l' atelier sur l'évaluation humaine des modèles génératifs , c'est-à-dire comment mener à bien des évaluations humaines afin de prendre en charge les modèles génératifs pour la langue et le CV (par exemple GPT-3, DALL-E, CLIP et OPT).
#4 Plus d'ateliers, de tutoriels et de concours
En plus des ateliers que j'ai mentionnés, il y a celui-ci qui étudie comment construire des systèmes d'apprentissage par renforcement plus évolutifs. Il y a aussi celui-ci qui plonge dans la question de savoir comment construire de meilleurs systèmes human-in-the-loop. Consultez également cet atelier si vous souhaitez faire une pause dans les sujets techniques et vous pencher plutôt sur l'avenir des collaborations de recherche en ML.
NeurIPS'22 propose également 13 tutoriels qui offrent une formation pratique et des conseils pratiques. Je vous recommande de consulter ce tutoriel sur la construction de jeux de données, celui-ci sur la robustesse des modèles de fondation et celui-ci sur l'optimisation bayésienne . Il existe également des tutoriels utiles sur l'équité algorithmique et l'IA socialement responsable.
La conférence de cette année propose un certain nombre de défis et de compétitions intéressants . Parmi eux se trouve ce défi de jeu vidéo sur les stratégies les plus efficaces pour peupler les environnements virtuels. Il y a aussi le défi Natural Language for Optimization Modeling (NL4Opt), ainsi que OGB-LSC sur l'analyse comparative de graphes à grande échelle, qui sont tous deux aussi stimulants qu'amusants.
#5 Réseaux sociaux NeurIPS'22
Je recommande également fortement les activités sociales de cette année, qui sont un excellent moyen d'apprendre quelque chose de nouveau avec une opportunité de s'impliquer de première main. Contrairement à la plupart des ateliers, les activités sociales à NeuroIPS ont tendance à être plus informelles, chaque participant ayant la possibilité de s'engager et d'exprimer son point de vue. Chaque social est animé par un panel d'organisateurs qui dirigent la discussion, digèrent toutes les contributions, puis présentent des remarques finales.
NeuroIPS'22 regorge d'entrées intéressantes - du ML et du changement climatique aux amateurs de K-Pop chez NeurIPS (oui, vous avez bien entendu). Cette table ronde , par exemple, porte sur l'autonomisation des annotateurs et l'excellence des données, à savoir comment résoudre les désaccords entre les étiqueteurs de données, obtenir la diversité d'échantillonnage et construire des systèmes de ML à l'abri des biais.
Résumé
Comme vous pouvez le voir, NeurIPS'22 offre de nombreuses options intéressantes que j'ai incluses ici et certaines que je n'avais pas d'espace pour mentionner. J'espère que mes recommandations vous aideront à mieux organiser votre temps, afin de ne rien manquer d'important.