Rencontrez les scientifiques unicellulaires cartographiant les cellules du corps humain
Comment les chercheurs relèvent les défis et les promesses de la création de catalogues unicellulaires pour mieux comprendre la maladie
Lisa Dratva , doctorante au Wellcome Sanger Institute , étudie comment le système immunitaire des gens réagit au COVID-19. Elle veut savoir quelles cellules T activent et combattent le virus responsable de l'infection. Pour étudier cela, Dratva aurait généralement besoin de passer de nombreuses années et d'importantes ressources financières à créer un ensemble de données complet d'échantillons, à collecter des cellules d'individus malades et en bonne santé pour effectuer des comparaisons.
Mais Dratva dispose désormais d'un raccourci qui change la donne, une base de données de référence qui contient déjà des informations synthétisées sur des millions de cellules immunitaires recueillies auprès de plus de 2 000 personnes, dont certaines atteintes de COVID-19. Cet atlas de cellules individuelles , organisé par des scientifiques de l'Institut Sanger et d'autres chercheurs du monde entier, fait partie du consortium mondial Human Cell Atlas (HCA). Le HCA, qui est soutenu par l' Initiative Chan Zuckerberg (CZI) et d'autres bailleurs de fonds, est un effort révolutionnaire dirigé par des scientifiques pour cartographier chaque type de cellule du corps humain - quelque chose qui n'a jamais été fait auparavant.
"Il y a quelques années, des atlas cellulaires comme celui-ci n'existaient pas", a déclaré Dratva, spécialisée dans les techniques informatiques. "La disponibilité de données utilisables s'avère extrêmement puissante, d'autant plus que ces atlas deviennent plus grands et plus complets."
Partout dans le monde, des chercheurs cartographient des organes humains tels que les poumons et les reins . Un groupe répertorie les cellules du cœur . Une autre est centrée sur le cortex moteur . D'autres construisent des atlas multi-organes , qui peuvent conduire à de nouvelles perspectives et clarifier les questions inter-tissus. Malgré leurs domaines d'intervention différents, tous ces chercheurs partagent un objectif commun : fournir une image plus claire du corps humain à la résolution de cellules individuelles, ce qui pourrait transformer notre compréhension de la santé et de la maladie.
Plus tôt cette année, Dratva a rejoint des collègues d'efforts comme ceux-ci lors d'un atelier organisé par CZI . Les participants ont non seulement discuté de la création d'atlas unicellulaires, mais ont travaillé collectivement pour améliorer les méthodes de calcul nécessaires pour compiler et intégrer les données.
"Nous ajoutons des pièces au puzzle qu'est le corps humain", a déclaré Simone Webb , participante à l'atelier , chercheuse postdoctorale à l'Université de Newcastle et scientifique invitée au Sanger Institute, qui travaille sur le HCA. "Pour le moment, nous essayons toujours de déterminer où se trouvent les lacunes, mais, en fin de compte, nous voulons avoir de nombreux puzzles complets représentant les biologies d'un large éventail de personnes."
En collaborant à l'atelier, les chercheurs ont exploré les défis et les promesses de leur domaine en plein essor, de la taille des ensembles de données aux nuances de la distinction des différents types de cellules. Les participants ont partagé de nouvelles techniques d'intégration de données, dont beaucoup sont alimentées par les progrès de l'apprentissage automatique, tels que les outils issus de scverse , une collection de bibliothèques python pour l'analyse de cellule unique. Ils ont parlé de leurs expériences avec de nouveaux outils pour explorer et extraire des informations à partir de grands volumes de données, tels que Chan Zuckerberg CELL by GENE (CZ CELLxGENE), un outil open source conçu par CZI qui permet aux scientifiques d'explorer et d'annoter visuellement des ensembles de données unicellulaires de grande dimension. Ils ont également discuté de l'importance d'avoir une compréhension approfondie des techniques expérimentales, acquise en établissant des ponts entre les informaticiens et les biologistes informaticiens écrivant du code qui intègre les données et les biologistes sur le banc.
L'atelier a fait l'objet d'une préparation approfondie en partenariat avec l'équipe Lattice du Cherry Lab de Stanford, qui collabore avec CZI pour établir des normes et organiser les soumissions de données pour CZ CELLxGENE. Avant l'atelier, les participants ont aidé à identifier des ensembles de données spécifiques sur le sang et les reins. La majorité de ces ensembles de données étaient déjà dans CZ CELLxGENE, et l'équipe Lattice a travaillé avec les participants pour conserver et normaliser les ensembles de données restants. En conséquence, le temps et les efforts nécessaires pour rassembler les fichiers et les détails expérimentaux de chaque étude incluse ont été considérablement réduits. Cela a aidé à faciliter une analyse plus ciblée sur les types et les états des cellules dans les échantillons de sang et de rein lors de l'atelier.
Les personnes impliquées ont célébré la valeur de ces travaux et la promesse que représentent les cartes cellulaires non seulement pour accélérer la recherche biologique, mais aussi pour améliorer notre compréhension des maladies.
"Même si la cellule est l'unité fondamentale de la vie et que toutes les maladies ont des mécanismes cellulaires, le corps est encore très mal compris au niveau de la résolution des cellules", a déclaré Jonah Cool, responsable du programme scientifique, programme de biologie unicellulaire au CZI. "Les atlas cellulaires qui capturent la diversité et les caractéristiques uniques des cellules devraient donc nous mettre dans une bien meilleure position pour améliorer la santé humaine, nous aidant à développer des thérapies ciblées pour traiter ou gérer la maladie."
Considérez le travail de Lisa Sikkema, une étudiante diplômée à Helmholtz Munich qui contribue au plus grand effort pour cartographier chaque type de cellule dans les poumons. Pour ce faire, Sikkema compile les données d'une variété d'études antérieures sur les poumons produites par des dizaines de laboratoires à travers le monde. Ces ensembles de données complets ont aidé Sikkema à comparer les niveaux d'expression génique dans les cellules, révélant des catégories allant des types de cellules épithéliales, qui facilitent les échanges gazeux, aux types de cellules stromales, qui fournissent du tissu conjonctif. Grâce aux travaux de Sikkema, d'autres chercheurs peuvent désormais poser des questions sur les comportements et les interactions de ces cellules dans des états sains et malades.
"Tant de scientifiques génèrent des ensembles de données dans leurs propres bulles de recherche", a déclaré Sikkema. "J'ai vu l'énorme potentiel de réutilisation et d'intégration de tous les ensembles de données existants et de faire en sorte que tout le monde puisse accéder à ces informations."
Les ensembles de données de cellules pulmonaires humaines avec lesquelles Sikkema travaille ne sont pas conçus pour être regroupés. Elle se concentre donc sur l'identification et l'élimination des variations dans les données causées par les différences de méthodologies et de techniques, tout en laissant intacte la variation biologique qui distingue un type de cellule d'un autre.
"Le principal problème est d'essayer de séparer la variation biologique, qui nous aide à identifier différents types de cellules, des effets de lot causés par les différences techniques dans la façon dont les chercheurs collectent et traitent leurs données", a déclaré Karin Hrovatin, collègue de Sikkema à Helmholtz Munich, qui se concentre sur cellules bêta dans le pancréas.
Il existe de nouveaux outils qui aident le domaine à progresser vers un consensus, a déclaré Malte Lücken, chercheur principal à Helmholtz Munich et un autre collègue de Sikkema. Lors de l'intégration des données sur les poumons, il a découvert que les cellules avaient été soumises à des normes différentes par les différentes équipes qui avaient généré les données. Par exemple, des seuils incohérents avaient été fixés pour décider si les cellules de la muqueuse d'une voie respiratoire avaient la forme d'une massue ou d'un gobelet, une distinction importante pour distinguer deux types de cellules distinctes qui sécrètent des matériaux différents. Pour résoudre cette incohérence, son groupe s'est tourné vers CZ CELLxGENE .
Grâce à l'outil Annotate de CZ CELLxGENE , Lücken a créé une visualisation des données qui a servi de point de départ à une conversation entre les chercheurs pour harmoniser et normaliser les données.
"Nous avions rencontré beaucoup de désaccords dans les données", a déclaré Lücken. "Ce que nous avons généré dans CZ CELLxGENE Annotate nous a permis d'annoter la diversité cellulaire dans les poumons de manière consensuelle."
L'abondance et l'accessibilité croissantes des données ont à la fois accéléré le travail des biologistes unicellulaires et créé de nouveaux défis. Les informations sur des millions de cellules peuvent rapidement s'accumuler dans des ensembles de données surdimensionnés difficiles à rechercher, à manipuler et à modéliser. C'est pourquoi Dinithi Sumanaweera et d'autres travaillent sur des approches pour réduire les ensembles de données complexes en représentations justes plus petites, simples - mais toujours utiles - créées à partir des données complètes.
"Lorsque vous disposez d'un grand ensemble de données contenant des millions de cellules, vous devez le gérer efficacement", a déclaré Sumanaweera, boursier postdoctoral Marie Curie à l'Institut Sanger. "Parler avec les biologistes avec lesquels je travaille m'a aidé à réfléchir à ce qu'il est important d'inclure dans les réductions qui facilitent leur utilisation de ces ensembles de données."
Pour concevoir un atlas cellulaire pratique, a-t-elle dit, il faut d'abord bien réfléchir à son utilisation. Un chercheur pourrait s'intéresser aux caractéristiques universelles des cellules que nous avons tous en commun. Un autre pourrait vouloir comparer des cellules de personnes d'âges différents ou des cellules dans différentes parties d'un organe. Des compromis doivent être faits, a déclaré Sumanaweera, car aucun modèle ne peut capturer toutes ces informations.
Sumanaweera et d'autres participants à l'atelier ont souligné que leur domaine est encore jeune et en pleine croissance, essayant différentes choses et voyant ce qui fonctionne. Pour Adam Gayoso, un candidat au doctorat étudiant la biologie computationnelle à l'UC Berkeley, se connecter avec d'autres dans le domaine au sujet des mêmes problèmes auxquels il est confronté l'a aidé à découvrir de nouvelles façons de penser aux solutions. Il a également pu trouver de nouveaux collaborateurs, des personnes avec lesquelles il travaille actuellement et qui n'étaient auparavant que des noms sur des documents de recherche.
"Une chose qui est devenue claire dans l'atelier CZI était qu'il y avait des visions diversifiées de ce que signifie vraiment la construction d'atlas de tissus unicellulaires", a déclaré Gayoso. "Mais tout le monde pense aussi qu'il est important d'établir un consensus communautaire, et nous sommes ravis d'avancer ensemble."
Lui et d'autres conviennent que le fait d'être dans la même pièce que d'autres participants à l'atelier a catalysé cet effort.
"L'ampleur de ces ensembles de données et l'expertise requise pour générer des atlas unicellulaires ont historiquement abouti à un effort scientifique décentralisé et distribué", a déclaré Cool. "Lorsque vous réunissez des chercheurs, il y a de nouvelles leçons, de nouveaux apprentissages qui peuvent faire avancer nos efforts pour comprendre le mécanisme cellulaire des maladies ."