Naukowcy w końcu wypełnili 8-procentową lukę w ludzkim genomie

Apr 01 2022

Ogłoszenie z 2003 r., że naukowcy ukończyli pierwszy ludzki genom, zawierało 8-procentową lukę. Teraz ta luka została wypełniona i opublikowano pierwszy kompletny ludzki genom.

Ponad połowa ludzkiego genomu zawiera powtarzające się sekwencje DNA, których funkcje wciąż nie są w pełni poznane. Adam Gault/Getty Images

Kiedy Human Genome Project ogłosił, że ukończyli pierwszy ludzki genom w 2003 roku, było to doniosłe osiągnięcie — po raz pierwszy odblokowano schemat DNA ludzkiego życia. Ale przyszło z haczykiem — tak naprawdę nie byli w stanie zebrać wszystkich informacji genetycznych w genomie. Istniały luki: niewypełnione, często powtarzające się regiony, które były zbyt zagmatwane, by je połączyć.

Dzięki postępowi w technologii, która może obsługiwać te powtarzalne sekwencje, naukowcy ostatecznie uzupełnili te luki w maju 2021 r. , a pierwszy kompletny ludzki genom został oficjalnie opublikowany 31 marca 2022 r .

Jestem biologiem genomu , który bada powtarzające się sekwencje DNA i to, jak kształtują one genomy w historii ewolucji. Byłem częścią zespołu, który pomógł scharakteryzować brakujące sekwencje powtórzeń w genomie. A teraz, z naprawdę kompletnym ludzkim genomem, te odkryte powtarzające się regiony są wreszcie po raz pierwszy w pełni badane.

Brakujące elementy układanki

Niemiecki botanik Hans Winkler ukuł słowo „ genom ” w 1920 roku, łącząc słowo „gen” z przyrostkiem „-ome”, co oznacza „kompletny zestaw”, aby opisać pełną sekwencję DNA zawartą w każdej komórce. Naukowcy wciąż używają tego słowa sto lat później w odniesieniu do materiału genetycznego, z którego składa się organizm.

Jednym ze sposobów na opisanie, jak wygląda genom, jest porównanie go z książką referencyjną. W tej analogii genom jest antologią zawierającą instrukcje DNA dotyczące życia. Składa się z szerokiej gamy nukleotydów (liter) umieszczonych w chromosomach (rozdziały). Każdy chromosom zawiera geny (paragrafy), które są regionami DNA, które kodują określone białka umożliwiające funkcjonowanie organizmu.

Chociaż każdy żywy organizm ma genom, jego wielkość różni się w zależności od gatunku. Słoń wykorzystuje tę samą formę informacji genetycznej, co trawa, którą zjada, i bakterie w jego jelitach. Ale żadne dwa genomy nie wyglądają dokładnie tak samo. Niektóre są krótkie, jak genom bakterii Nasuia deltocephalinicola, która bytuje na owadach, z zaledwie 137 genami na 112 000 nukleotydów. Niektóre, jak 149 miliardów nukleotydów kwitnącej rośliny Paris japonica , są tak długie, że trudno jest określić, ile genów jest w nich zawartych.

Ale geny w tradycyjnym rozumieniu — jako fragmenty DNA, które kodują białka — to tylko niewielka część genomu organizmu. W rzeczywistości stanowią mniej niż 2 procent ludzkiego DNA .

Genom ludzki zawiera około 3 miliardy nukleotydów i prawie 20 000 genów kodujących białka — około 1 procent całkowitej długości genomu. Pozostałe 99 procent to niekodujące sekwencje DNA, które nie wytwarzają białek. Niektóre z nich to elementy regulacyjne, które działają jak tablica rozdzielcza kontrolująca działanie innych genów. Inne to pseudogeny lub relikty genomowe, które utraciły zdolność do funkcjonowania.

Ponad połowa ludzkiego genomu jest powtarzalna, z wieloma kopiami niemal identycznych sekwencji.

Co to jest powtarzalne DNA?

Najprostszą formą powtarzalnego DNA są bloki DNA powtarzające się w kółko w tandemie zwane satelitami . Chociaż ilość satelitarnego DNA w danym genomie różni się w zależności od osoby, często skupiają się one w kierunku końców chromosomów w regionach zwanych telomerami . Regiony te chronią chromosomy przed degradacją podczas replikacji DNA. Można je również znaleźć w centromerach chromosomów, regionie, który pomaga zachować nienaruszoną informację genetyczną podczas podziału komórek.

Naukowcom wciąż brakuje jasnego zrozumienia wszystkich funkcji satelitarnego DNA. Ale ponieważ satelitarny DNA tworzy unikalne wzorce u każdej osoby, biolodzy sądowi i genealodzy używają tego genomowego „odcisku palca” , aby dopasować próbki z miejsca zbrodni i śledzić pochodzenie. Ponad 50 zaburzeń genetycznych jest powiązanych ze zmianami w satelitarnym DNA, w tym z chorobą Huntingtona .

Satelitarne DNA ma tendencję do skupiania się w kierunku końców chromosomów w ich telomerach. Tutaj 46 ludzkich chromosomów ma kolor niebieski, z białymi telomerami.

Innym obfitym typem powtarzalnego DNA są elementy transpozycyjne lub sekwencje, które mogą poruszać się po genomie.

Niektórzy naukowcy opisali je jako samolubne DNA, ponieważ mogą wstawiać się w dowolne miejsce genomu, bez względu na konsekwencje. W miarę ewolucji genomu ludzkiego wiele sekwencji transpozycyjnych gromadziło mutacje hamujące ich zdolność do poruszania się w celu uniknięcia szkodliwych przerw. Ale niektórzy prawdopodobnie nadal mogą się poruszać. Na przykład insercje elementów transpozycyjnych są powiązane z wieloma przypadkami hemofilii A , genetycznego zaburzenia krzepnięcia.

Ale elementy, które można przenieść, nie tylko przeszkadzają. Mogą pełnić funkcje regulacyjne, które pomagają kontrolować ekspresję innych sekwencji DNA. Gdy są skoncentrowane w centromerach , mogą również pomóc w utrzymaniu integralności genów fundamentalnych dla przetrwania komórki.

Mogą również przyczynić się do ewolucji. Naukowcy niedawno odkryli, że wprowadzenie elementu transpozycyjnego do genu ważnego dla rozwoju może być powodem, dla którego niektóre naczelne, w tym ludzie, nie mają już ogonów . Rearanżacje chromosomów spowodowane elementami transpozycyjnymi są nawet powiązane z genezą nowych gatunków, takich jak gibony południowo-wschodniej Azji i wallabies z Australii .

Ukończenie zagadki genomowej

Do niedawna wiele z tych skomplikowanych regionów można było porównać do odległej strony Księżyca: znanej, ale niewidocznej.

Kiedy Human Genome Project został uruchomiony po raz pierwszy w 1990 roku, ograniczenia technologiczne uniemożliwiły pełne odkrycie powtarzających się regionów w genomie. Dostępna technologia sekwencjonowania mogła odczytać tylko około 500 nukleotydów na raz, a te krótkie fragmenty musiały na siebie nachodzić, aby odtworzyć pełną sekwencję. Badacze wykorzystali te nakładające się segmenty do zidentyfikowania kolejnych nukleotydów w sekwencji, stopniowo rozszerzając zespół genomu o fragment po fragmencie.

Te powtarzające się obszary szczelin przypominały układanie puzzli z tysiąca elementów zachmurzonego nieba: Kiedy każdy element wygląda tak samo, skąd wiesz, gdzie zaczyna się jedna chmura, a kończy się druga? Przy niemal identycznych nakładających się odcinkach w wielu miejscach, pełne sekwencjonowanie genomu po kawałkach stało się niemożliwe. Miliony nukleotydów pozostały ukryte w pierwszej iteracji ludzkiego genomu.

Od tego czasu łatki sekwencji stopniowo wypełniały luki w ludzkim genomie. A w 2021 r. Konsorcjum Telomere-to-Telomer (T2T) , międzynarodowe konsorcjum naukowców pracujących nad kompletowaniem ludzkiego genomu od początku do końca, ogłosiło, że wszystkie pozostałe luki zostały ostatecznie wypełnione .

Było to możliwe dzięki ulepszonej technologii sekwencjonowania zdolnej do odczytywania dłuższych sekwencji o długości tysięcy nukleotydów. Dzięki większej ilości informacji umożliwiających umiejscowienie sekwencji powtarzalnych w szerszym obrazie łatwiej było zidentyfikować ich właściwe miejsce w genomie. Podobnie jak uproszczenie układanki składającej się z 1000 elementów w układankę ze 100 elementów, długo czytane sekwencje umożliwiły po raz pierwszy połączenie dużych, powtarzalnych regionów.

Wraz z rosnącą mocą technologii sekwencjonowania DNA z długim odczytem, genetycy mogą po raz pierwszy zbadać nową erę genomiki, rozplątując złożone, powtarzalne sekwencje w populacjach i gatunkach. A kompletny, pozbawiony luk ludzki genom stanowi nieocenione źródło wiedzy dla naukowców do badania powtarzających się regionów, które kształtują strukturę i zmienność genetyczną, ewolucję gatunków i zdrowie człowieka.

Ale jeden kompletny genom nie obejmuje wszystkiego. Nieustannie podejmowane są wysiłki w celu stworzenia różnorodnych odniesień genomicznych, które w pełni reprezentują populację ludzką i życie na Ziemi . Dzięki bardziej kompletnym odniesieniom do genomu „telomer-telomer” zrozumienie przez naukowców powtarzającej się ciemnej materii DNA stanie się jaśniejsze.

Gabrielle Hartley jest doktorem. kandydat z biologii molekularnej i komórkowej na Uniwersytecie Connecticut. Otrzymuje finansowanie z Narodowej Fundacji Nauki.