Ученые наконец заполнили 8-процентный пробел в геноме человека

Apr 01 2022
Объявление 2003 года о том, что ученые создали первый геном человека, содержало 8-процентный пробел. Теперь этот пробел заполнен, и опубликован первый сквозной геном человека.
Более половины генома человека содержит повторяющиеся последовательности ДНК, функции которых до сих пор полностью не изучены. Адам Голт / Getty Images

Когда в 2003 году в рамках проекта «Геном человека» было объявлено, что они завершили создание первого человеческого генома, это стало знаменательным достижением — впервые была раскрыта схема ДНК человеческой жизни. Но тут была одна загвоздка — они не смогли собрать воедино всю генетическую информацию в геноме. Были пробелы: незаполненные, часто повторяющиеся области, которые были слишком запутанными, чтобы собрать их воедино.

Благодаря достижениям в области технологий, которые могли обрабатывать эти повторяющиеся последовательности, ученые, наконец, заполнили эти пробелы в мае 2021 года, и 31 марта 2022 года был официально опубликован первый сквозной геном человека .

Я геномный биолог , изучающий повторяющиеся последовательности ДНК и то, как они формируют геномы на протяжении всей истории эволюции. Я был частью команды, которая помогала охарактеризовать повторяющиеся последовательности, отсутствующие в геноме. И теперь, с действительно полным геномом человека, эти непокрытые повторяющиеся области, наконец, впервые полностью исследованы.

Недостающие кусочки головоломки

Немецкий ботаник Ганс Винклер придумал слово « геном » в 1920 году, соединив слово «ген» с суффиксом «-ome», означающим «полный набор», для описания полной последовательности ДНК, содержащейся в каждой клетке. Спустя столетие исследователи до сих пор используют это слово для обозначения генетического материала, из которого состоит организм.

Один из способов описать, как выглядит геном, — сравнить его со справочником. В этой аналогии геном представляет собой антологию, содержащую инструкции ДНК для жизни. Он состоит из огромного количества нуклеотидов (букв), упакованных в хромосомы (главы). Каждая хромосома содержит гены (параграфы), представляющие собой участки ДНК, кодирующие определенные белки, обеспечивающие жизнедеятельность организма.

Хотя у каждого живого организма есть геном, размер этого генома варьируется от вида к виду. Слон использует ту же форму генетической информации, что и трава, которую он ест, и бактерии в его кишечнике. Но нет двух одинаковых геномов. Некоторые из них короткие, как геном обитающих в насекомых бактерий Nasuia deltocephalinicola, в котором всего 137 генов на 112 000 нуклеотидов. Некоторые, например 149 миллиардов нуклеотидов цветкового растения Paris japonica , настолько длинные, что трудно понять, сколько генов содержится в них.

Но гены в их традиционном понимании — участки ДНК, кодирующие белки, — это всего лишь небольшая часть генома организма. Фактически, они составляют менее 2 процентов ДНК человека .

Геном человека содержит примерно 3 миллиарда нуклеотидов и чуть менее 20 000 генов, кодирующих белок, — примерно 1 процент от общей длины генома. Остальные 99 процентов — это некодирующие последовательности ДНК, которые не производят белки. Некоторые из них являются регуляторными компонентами, которые работают как распределительный щит, контролирующий работу других генов. Другие представляют собой псевдогены или геномные реликвии, утратившие способность функционировать.

И более половины генома человека повторяется с множеством копий почти идентичных последовательностей.

Что такое повторяющаяся ДНК?

Простейшей формой повторяющейся ДНК являются блоки ДНК, повторяющиеся снова и снова в тандеме, называемые сателлитами . Хотя количество сателлитной ДНК в данном геноме варьируется от человека к человеку, они часто группируются ближе к концам хромосом в областях, называемых теломерами . Эти области защищают хромосомы от деградации во время репликации ДНК. Они также находятся в центромерах хромосом, области, которая помогает сохранить генетическую информацию нетронутой при делении клеток.

Исследователям до сих пор не хватает четкого понимания всех функций сателлитной ДНК. Но поскольку сателлитная ДНК образует уникальные образцы в каждом человеке, судебные биологи и специалисты по генеалогии используют этот геномный «отпечаток пальца» , чтобы сопоставить образцы с места преступления и отследить родословную. Более 50 генетических нарушений связаны с вариациями сателлитной ДНК, включая болезнь Гентингтона .

Сателлитная ДНК имеет тенденцию группироваться ближе к концам хромосом в их теломерах. Здесь 46 хромосом человека окрашены в синий цвет с белыми теломерами.

Еще одним распространенным типом повторяющейся ДНК являются мобильные элементы или последовательности, которые могут перемещаться по геному.

Некоторые ученые описывают их как эгоистичные ДНК, потому что они могут внедряться в любом месте генома, независимо от последствий. По мере развития генома человека многие мобильные последовательности накапливали мутации, подавляющие их способность двигаться, чтобы избежать вредных прерываний. Но некоторые, вероятно, все еще могут двигаться. Например, вставки мобильных элементов связаны с рядом случаев гемофилии А , генетического нарушения свертываемости крови.

Но мобильные элементы не просто разрушительны. Они могут иметь регуляторные функции , которые помогают контролировать экспрессию других последовательностей ДНК. Когда они концентрируются в центромерах , они также могут способствовать поддержанию целостности генов, необходимых для выживания клеток.

Они также могут способствовать эволюции. Недавно исследователи обнаружили, что вставка мобильного элемента в ген, важный для развития, может быть причиной того, что у некоторых приматов, включая людей, больше нет хвостов . Хромосомные перестройки из-за мобильных элементов даже связаны с генезисом новых видов, таких как гиббоны Юго-Восточной Азии и валлаби Австралии .

Завершение геномной головоломки

До недавнего времени многие из этих сложных регионов можно было сравнить с обратной стороной Луны: известно, что они существуют, но невидимы.

Когда в 1990 году впервые был запущен проект «Геном человека» , технологические ограничения сделали невозможным полное раскрытие повторяющихся участков генома. Доступная технология секвенирования могла считывать только около 500 нуклеотидов за раз, и эти короткие фрагменты должны были перекрывать друг друга, чтобы воссоздать полную последовательность. Исследователи использовали эти перекрывающиеся сегменты для идентификации следующих нуклеотидов в последовательности, постепенно расширяя сборку генома по одному фрагменту за раз.

Эти повторяющиеся промежутки были похожи на сборку пазла из 1000 частей пасмурного неба: когда все части выглядят одинаково, как узнать, где начинается одно облако и заканчивается другое? Из-за почти идентичных перекрывающихся участков во многих местах полное секвенирование генома по частям стало невозможным. Миллионы нуклеотидов оставались скрытыми в первой итерации человеческого генома.

С тех пор патчи последовательностей постепенно заполняли пробелы в геноме человека. А в 2021 году Консорциум Telomere-to-Telomere (T2T) , международный консорциум ученых, работающих над завершением сборки генома человека от начала до конца, объявил, что все оставшиеся пробелы наконец-то заполнены .

Это стало возможным благодаря усовершенствованной технологии секвенирования, способной считывать более длинные последовательности длиной в тысячи нуклеотидов. Имея больше информации для размещения повторяющихся последовательностей в более широкой картине, стало легче определить их правильное место в геноме. Подобно упрощению головоломки из 1000 частей до головоломки из 100 частей, длинные последовательности впервые позволили собрать большие повторяющиеся области.

С ростом мощности технологии секвенирования ДНК с длительным считыванием генетики могут исследовать новую эру геномики, впервые распутывая сложные повторяющиеся последовательности в популяциях и видах. А полный геном человека без пробелов предоставляет исследователям бесценный ресурс для изучения повторяющихся областей, которые формируют генетическую структуру и вариации, эволюцию видов и здоровье человека.

Но один полный геном не отражает всего этого. Продолжаются усилия по созданию разнообразных геномных ссылок, которые полностью представляют человеческую популяцию и жизнь на Земле . С более полными ссылками на геном «теломер-теломер» понимание учеными повторяющейся темной материи ДНК станет более ясным.

Габриэль Хартли - доктор философии. кандидат молекулярной и клеточной биологии в Университете Коннектикута. Она получает финансирование от Национального научного фонда.

Эта статья переиздана из The Conversation под лицензией Creative Commons. Оригинал статьи можно найти здесь.