Познакомьтесь с учеными, изучающими одиночные клетки, картирующими клетки человеческого тела
Как исследователи справляются с проблемами и перспективами создания каталогов одиночных клеток, чтобы лучше понять болезни
Лиза Дратва , докторант Института Wellcome Sanger , изучает, как иммунная система людей реагирует на COVID-19. Она хочет знать, какие Т-клетки активируются и борются с вирусом, вызывающим инфекцию. Чтобы исследовать это, Дратве, как правило, нужно было бы потратить много лет и значительные финансовые ресурсы на создание всеобъемлющего набора данных образцов, сбор клеток как у больных, так и у здоровых людей для сравнения.
Но теперь у Дратвы есть способ изменить правила игры — справочная база данных, которая уже содержит синтезированную информацию о миллионах иммунных клеток, собранных у более чем 2000 человек, в том числе у некоторых из них с COVID-19. Этот атлас отдельных клеток , составленный учеными из Института Сенгера и другими исследователями со всего мира, является частью глобального консорциума Атласа клеток человека (HCA). HCA, который поддерживается Инициативой Чана Цукерберга (CZI) и другими спонсорами, представляет собой новаторскую, возглавляемую учеными попытку составить карту каждого типа клеток в человеческом теле — то, что никогда не делалось раньше.
«Несколько лет назад подобных клеточных атласов не существовало», — сказал Дратва, специализирующийся на вычислительных методах. «Доступность пригодных для использования данных оказывается сверхмощной, особенно по мере того, как эти атласы становятся больше и полнее».
По всему миру исследователи картируют органы человека, такие как легкие и почки . Одна группа занимается каталогизацией клеток сердца . Другой сосредоточен на моторной коре . Другие создают мультиорганные атласы , которые могут привести к новому пониманию и прояснить межтканные вопросы. Несмотря на разные направления деятельности, все эти исследователи имеют общую цель: получить более четкое представление о человеческом теле с разрешением отдельных клеток, что может изменить наше понимание здоровья и болезней.
Ранее в этом году Дратва присоединился к коллегам из подобных усилий на семинаре, организованном CZI . Участники не только обсудили создание атласов отдельных клеток, но и совместно работали над улучшением вычислительных методов, необходимых для сбора и интеграции данных.
«Мы добавляем кусочки головоломки, которая представляет собой человеческое тело», — сказала участница семинара Симона Уэбб , научный сотрудник Университета Ньюкасла и приглашенный научный сотрудник Института Сангера, которая работает над HCA. «Прямо сейчас мы все еще пытаемся выяснить, где есть пробелы, но, в конечном счете, мы хотим иметь много завершенных головоломок, представляющих биологию самых разных людей».
Сотрудничая на семинаре, исследователи изучили проблемы и перспективы своей растущей области, от размеров наборов данных до нюансов различения различных типов клеток. Участники поделились новыми методами интеграции данных, многие из которых основаны на достижениях в области машинного обучения, таких как инструменты, появившиеся из scverse , набора библиотек Python для анализа отдельных клеток. Они рассказали о своем опыте работы с новыми инструментами для изучения и извлечения информации из больших объемов данных, таких как CELL Чана Цукерберга от GENE (CZ CELLxGENE)., инструмент с открытым исходным кодом, созданный CZI, который позволяет ученым визуально исследовать и аннотировать многомерные наборы данных с одной ячейкой. Они также обсудили важность глубокого понимания экспериментальных методов, полученного путем наведения мостов между учеными-компьютерщиками и биологами-вычислителями, пишущими код, объединяющий данные, и биологами на стенде.
Семинар был тщательно подготовлен в партнерстве с командой Lattice из Стэнфордской лаборатории Cherry, которая сотрудничает с CZI в установлении стандартов и курировании представления данных для CZ CELLxGENE. Перед семинаром участники помогли определить конкретные ценные наборы данных крови и почек. Большинство этих наборов данных уже были в CZ CELLxGENE, и команда Lattice работала с участниками над отбором и стандартизацией оставшихся наборов данных. В результате время и усилия, которые обычно требуются для сбора файлов и экспериментальных данных из каждого включенного исследования, были значительно сокращены. Это помогло провести на семинаре более целенаправленный анализ типов и состояний клеток в образцах крови и почек.
Те, кто участвовал, отметили ценность такой работы и перспективность клеточных карт не только для ускорения биологических исследований, но и для улучшения нашего понимания болезней.
«Несмотря на то, что клетка является фундаментальной единицей жизни, и все болезни имеют клеточные механизмы, тело все еще очень плохо изучено при разрешении клеток», — сказал Джона Кул, руководитель научной программы программы биологии одиночных клеток в CZI. «Атласы клеток, которые охватывают разнообразие и уникальные особенности клеток, должны, таким образом, дать нам гораздо больше возможностей для улучшения здоровья человека, помогая нам разрабатывать целевые методы лечения или контроля заболеваний».
Рассмотрим работу Лизы Сиккема, аспиранта Мюнхенского института им. Гельмгольца, которая вносит свой вклад в крупнейшую работу по картированию каждого типа клеток в легких. Для этого Сиккема собирает данные различных предыдущих исследований легких, проведенных десятками лабораторий по всему миру. Эти исчерпывающие наборы данных помогли Сиккеме сравнить уровни экспрессии генов в клетках, выявив категории, варьирующиеся от типов эпителиальных клеток, которые облегчают газообмен, до типов стромальных клеток, которые обеспечивают соединительную ткань. Благодаря работе Сиккемы другие исследователи теперь могут задавать вопросы о поведении и взаимодействии этих клеток в здоровом и больном состоянии.
«Очень многие ученые генерируют наборы данных в своих собственных исследовательских пузырях», — сказал Сиккема. «Я увидел огромный потенциал повторного использования и интеграции всех существующих наборов данных и обеспечения того, чтобы любой мог получить доступ к этой информации».
Наборы данных о клетках легких человека, с которыми работает Сиккема, не предназначены для объединения. Итак, она сосредоточилась на выявлении и отсеивании вариаций в данных, вызванных различиями в методологиях и техниках, оставляя нетронутыми биологические вариации, которые отличают один тип клеток от другого.
«Основная проблема заключается в попытке отделить биологическую изменчивость, которая помогает нам идентифицировать различные типы клеток, от пакетных эффектов, вызванных техническими различиями в том, как исследователи собирают и обрабатывают свои данные», — сказала Карин Хроватин, коллега Сиккемы из Helmholtz Munich, которая занимается бета-клетки в поджелудочной железе.
По словам Мальте Люкен, главного исследователя Helmholtz Munich и еще одного коллеги Сиккемы, существуют новые инструменты, которые помогают двигаться в этой области к консенсусу. Интегрируя данные о легком, он обнаружил, что разные команды, сгенерировавшие данные, придерживались разных стандартов для клеток. Например, были установлены непоследовательные пороги для принятия решения о том, имеют ли клетки слизистой оболочки дыхательных путей форму булавы или кубка, что важно для различения двух отдельных типов клеток, секретирующих разные материалы. Чтобы устранить это несоответствие, его группа обратилась к CZ CELLxGENE .
С помощью инструмента Annotate от CZ CELLxGENE Люкен создал визуализацию данных, которая послужила отправной точкой для обсуждения между исследователями с целью согласования и стандартизации данных.
«Мы столкнулись с большим количеством разногласий в данных», — сказал Люкен. «То, что мы создали в CZ CELLxGENE Annotate, позволило нам аннотировать клеточное разнообразие в легком на основе консенсуса».
Растущее изобилие и доступность данных ускорили работу биологов, изучающих одноклеточные, и создали новые проблемы. Информация о миллионах ячеек может быстро превратиться в огромные наборы данных, которые трудно найти, манипулировать и моделировать. Вот почему Динити Суманавира и другие работают над подходами к сокращению сложных наборов данных до более мелких, простых, но все же полезных, достоверных представлений, созданных из полных данных.
«Когда у вас есть большой набор данных, содержащий миллионы клеток, вам нужно эффективно с ним обращаться», — сказал Суманавира, научный сотрудник Института Сенгера, докторант Марии Кюри. «Беседы с биологами, с которыми я работаю, помогли мне задуматься о том, что важно включать в сокращения, которые облегчают им использование таких наборов данных».
По ее словам, чтобы разработать практический атлас клеток, нужно сначала тщательно продумать, для чего он будет использоваться. Одного исследователя могли бы заинтересовать универсальные свойства клеток, общие для всех нас. Другой может захотеть сравнить клетки людей разного возраста или клетки в разных частях органа. По словам Суманавиры, необходимо идти на компромиссы, потому что ни одна модель не может охватить всю эту информацию.
Суманавира и другие участники семинара подчеркнули, что их область все еще молода и развивается, они пробуют разные вещи и видят, что работает. Для Адама Гайосо, кандидата наук, изучающего вычислительную биологию в Калифорнийском университете в Беркли, общение с другими специалистами в этой области по поводу тех же проблем, с которыми он сталкивается, помогло ему найти новые способы думать о решениях. Он также смог найти новых сотрудников, людей, с которыми он сейчас работает, которые раньше были только именами в исследовательских работах.
«Одна вещь, которая стала ясной на семинаре CZI, заключалась в том, что существовали разные взгляды на то, что на самом деле означает создание атласов одноклеточных тканей», — сказал Гайосо. «Но все также считают, что достижение консенсуса в сообществе важно, и мы рады двигаться вперед вместе».
Он и другие согласны с тем, что нахождение в одной комнате с другими участниками семинара стало катализатором этих усилий.
«Масштаб этих наборов данных и опыт, необходимый для создания атласов отдельных ячеек, исторически приводили к децентрализованным, распределенным научным усилиям», — сказал Кул. «Когда вы объединяете исследователей, вы получаете новые уроки, новые знания, которые могут способствовать нашим усилиям по пониманию клеточного механизма болезней ».