Wissenschaftler haben endlich die 8-Prozent-Lücke im menschlichen Genom geschlossen

Apr 01 2022
Die Ankündigung von 2003, dass Wissenschaftler das erste menschliche Genom fertiggestellt hatten, kam mit einer Lücke von 8 Prozent. Jetzt wurde diese Lücke geschlossen und das erste End-to-End-Humangenom veröffentlicht.
Über die Hälfte des menschlichen Genoms enthält sich wiederholende DNA-Sequenzen, deren Funktionen noch nicht vollständig verstanden sind. Adam Gault/Getty Images

Als das Human Genome Project im Jahr 2003 bekannt gab, dass es das erste menschliche Genom fertiggestellt hatte, war dies eine bedeutsame Leistung – zum ersten Mal wurde der DNA - Bauplan des menschlichen Lebens entschlüsselt. Aber es hatte einen Haken – sie waren nicht wirklich in der Lage, alle genetischen Informationen im Genom zusammenzusetzen. Es gab Lücken: ungefüllte, sich oft wiederholende Regionen, die zu verwirrend waren, um sie zusammenzufügen.

Mit technologischen Fortschritten, die mit diesen sich wiederholenden Sequenzen umgehen konnten, füllten Wissenschaftler diese Lücken schließlich im Mai 2021 , und das erste End-to-End-Humangenom wurde offiziell am 31. März 2022 veröffentlicht .

Ich bin ein Genombiologe , der sich wiederholende DNA-Sequenzen untersucht und wie sie Genome im Laufe der Evolutionsgeschichte formen. Ich war Teil des Teams, das dabei half , die Wiederholungssequenzen zu charakterisieren, die im Genom fehlen. Und jetzt, mit einem wirklich vollständigen menschlichen Genom, werden diese aufgedeckten repetitiven Regionen endlich zum ersten Mal vollständig erforscht.

Die fehlenden Puzzleteile

Der deutsche Botaniker Hans Winkler prägte 1920 das Wort „ Genom “ und kombinierte das Wort „Gen“ mit dem Suffix „-ome“, was „vollständiger Satz“ bedeutet, um die vollständige DNA-Sequenz zu beschreiben, die in jeder Zelle enthalten ist. Forscher verwenden dieses Wort noch ein Jahrhundert später, um sich auf das genetische Material zu beziehen, aus dem ein Organismus besteht.

Eine Möglichkeit, das Aussehen eines Genoms zu beschreiben, besteht darin, es mit einem Nachschlagewerk zu vergleichen. In dieser Analogie ist ein Genom eine Anthologie, die die DNA-Anweisungen für das Leben enthält. Es besteht aus einer Vielzahl von Nukleotiden (Buchstaben), die in Chromosomen (Kapitel) verpackt sind. Jedes Chromosom enthält Gene (Absätze), bei denen es sich um DNA-Regionen handelt, die für die spezifischen Proteine ​​kodieren, die einem Organismus das Funktionieren ermöglichen.

Während jeder lebende Organismus ein Genom hat, variiert die Größe dieses Genoms von Art zu Art. Ein Elefant verwendet die gleiche Form genetischer Informationen wie das Gras, das er frisst, und die Bakterien in seinem Darm. Aber keine zwei Genome sehen genau gleich aus. Einige sind kurz, wie das Genom des insektenbewohnenden Bakteriums Nasuia deltocephalinicola mit nur 137 Genen auf 112.000 Nukleotiden. Einige, wie die 149 Milliarden Nukleotide der blühenden Pflanze Paris japonica , sind so lang, dass es schwierig ist, ein Gefühl dafür zu bekommen, wie viele Gene darin enthalten sind.

Aber Gene, wie sie traditionell verstanden werden – als DNA-Abschnitte, die Proteine ​​kodieren – sind nur ein kleiner Teil des Genoms eines Organismus. Tatsächlich machen sie weniger als 2 Prozent der menschlichen DNA aus .

Das menschliche Genom enthält ungefähr 3 Milliarden Nukleotide und knapp 20.000 proteinkodierende Gene – schätzungsweise 1 Prozent der Gesamtlänge des Genoms. Die restlichen 99 Prozent sind nichtkodierende DNA-Sequenzen, die keine Proteine ​​produzieren. Einige sind regulatorische Komponenten, die als Schalttafel fungieren, um zu kontrollieren, wie andere Gene funktionieren. Andere sind Pseudogene oder genomische Relikte, die ihre Funktionsfähigkeit verloren haben.

Und über die Hälfte des menschlichen Genoms ist repetitiv, mit mehreren Kopien nahezu identischer Sequenzen.

Was ist repetitive DNA?

Die einfachste Form repetitiver DNA sind DNA-Blöcke, die sich immer wieder im Tandem wiederholen, die Satelliten genannt werden . Wie viel Satelliten-DNA ein bestimmtes Genom hat, ist zwar von Person zu Person unterschiedlich, aber sie häufen sich oft an den Enden der Chromosomen in Regionen an, die als Telomere bezeichnet werden . Diese Regionen schützen Chromosomen vor dem Abbau während der DNA-Replikation. Sie kommen auch in den Zentromeren von Chromosomen vor, einer Region, die dazu beiträgt, die genetische Information bei der Zellteilung intakt zu halten.

Den Forschern fehlt noch ein klares Verständnis aller Funktionen der Satelliten-DNA. Aber weil Satelliten-DNA einzigartige Muster in jeder Person bildet, verwenden forensische Biologen und Genealogen diesen genomischen „Fingerabdruck“ , um Tatortproben abzugleichen und Vorfahren zu verfolgen. Über 50 genetische Störungen sind mit Variationen in der Satelliten-DNA verbunden, einschließlich der Huntington-Krankheit .

Satelliten-DNA tendiert dazu, sich an den Enden der Chromosomen in ihren Telomeren anzuhäufen. Hier sind 46 menschliche Chromosomen blau gefärbt, mit weißen Telomeren.

Eine weitere häufig vorkommende Art repetitiver DNA sind transponierbare Elemente oder Sequenzen, die sich im Genom bewegen können.

Einige Wissenschaftler haben sie als egoistische DNA bezeichnet, weil sie sich unabhängig von den Folgen überall in das Genom einfügen kann. Als sich das menschliche Genom weiterentwickelte, sammelten viele transponierbare Sequenzen Mutationen, die ihre Fähigkeit zur Bewegung unterdrückten , um schädliche Unterbrechungen zu vermeiden. Aber einige können sich wahrscheinlich noch bewegen. Beispielsweise werden transponierbare Elemente mit einer Reihe von Fällen von Hämophilie A , einer genetisch bedingten Blutgerinnungsstörung, in Verbindung gebracht.

Aber transponierbare Elemente sind nicht nur störend. Sie können regulatorische Funktionen haben , die helfen, die Expression anderer DNA-Sequenzen zu kontrollieren. Wenn sie in Zentromeren konzentriert sind, können sie auch dazu beitragen, die Integrität der Gene aufrechtzuerhalten, die für das Überleben der Zelle von grundlegender Bedeutung sind.

Sie können auch zur Evolution beitragen. Forscher haben kürzlich herausgefunden, dass das Einfügen eines transponierbaren Elements in ein für die Entwicklung wichtiges Gen möglicherweise der Grund dafür ist, dass manche Primaten, darunter auch Menschen, keinen Schwanz mehr haben . Chromosomenumlagerungen aufgrund transponierbarer Elemente werden sogar mit der Entstehung neuer Arten wie der Gibbons in Südostasien und der Wallabys in Australien in Verbindung gebracht .

Vervollständigung des genomischen Puzzles

Bis vor kurzem konnten viele dieser komplexen Regionen mit der anderen Seite des Mondes verglichen werden: von ihrer Existenz bekannt, aber unsichtbar.

Als das Human Genome Project 1990 zum ersten Mal gestartet wurde, machten es technologische Einschränkungen unmöglich, sich wiederholende Regionen im Genom vollständig aufzudecken. Die verfügbare Sequenzierungstechnologie konnte jeweils nur etwa 500 Nukleotide lesen, und diese kurzen Fragmente mussten einander überlappen, um die vollständige Sequenz wiederherzustellen. Die Forscher verwendeten diese überlappenden Segmente, um die nächsten Nukleotide in der Sequenz zu identifizieren, und erweiterten die Genomanordnung schrittweise um jeweils ein Fragment.

Diese sich wiederholenden Lückenregionen waren wie das Zusammensetzen eines 1.000-teiligen Puzzles eines bedeckten Himmels: Wenn jedes Teil gleich aussieht, woher wissen Sie, wo eine Wolke beginnt und eine andere endet? Mit nahezu identischen überlappenden Abschnitten an vielen Stellen wurde eine vollständige stückweise Sequenzierung des Genoms unmöglich. Millionen von Nukleotiden blieben in der ersten Iteration des menschlichen Genoms verborgen.

Seitdem füllen Sequenzpatches Stück für Stück Lücken im menschlichen Genom. Und im Jahr 2021 gab das Telomere-to-Telomere (T2T) Consortium , ein internationales Konsortium von Wissenschaftlern, die daran arbeiten, die Assemblierung des menschlichen Genoms von Anfang bis Ende abzuschließen, bekannt, dass alle verbleibenden Lücken endlich geschlossen wurden .

Dies wurde durch eine verbesserte Sequenzierungstechnologie ermöglicht, die in der Lage ist , längere Sequenzen mit einer Länge von Tausenden von Nukleotiden zu lesen. Mit mehr Informationen, um sich wiederholende Sequenzen in einem größeren Bild zu positionieren, wurde es einfacher, ihren richtigen Platz im Genom zu identifizieren. Ähnlich wie bei der Vereinfachung eines 1.000-Teile-Puzzles zu einem 100-Teile-Puzzle ermöglichten Long-Read-Sequenzen zum ersten Mal, große sich wiederholende Regionen zusammenzusetzen.

Mit der zunehmenden Leistungsfähigkeit der Long-Read-DNA-Sequenzierungstechnologie sind Genetiker in der Lage, eine neue Ära der Genomik zu erforschen und zum ersten Mal komplexe sich wiederholende Sequenzen über Populationen und Arten hinweg zu entwirren. Und ein vollständiges, lückenloses menschliches Genom stellt eine unschätzbare Ressource für Forscher dar, um sich wiederholende Regionen zu untersuchen, die die genetische Struktur und Variation, die Evolution von Arten und die menschliche Gesundheit prägen.

Aber ein vollständiges Genom erfasst nicht alles. Es werden weiterhin Anstrengungen unternommen , um verschiedene genomische Referenzen zu schaffen , die die menschliche Bevölkerung und das Leben auf der Erde vollständig repräsentieren . Mit vollständigeren „Telomer-zu-Telomer“-Genomreferenzen wird das Verständnis der Wissenschaftler von der sich wiederholenden dunklen Materie der DNA klarer.

Gabrielle Hartley ist Ph.D. Kandidat in Molekular- und Zellbiologie an der University of Connecticut. Sie erhält Fördermittel von der National Science Foundation.

Dieser Artikel wurde von The Conversation unter einer Creative Commons-Lizenz neu veröffentlicht. Den Originalartikel finden Sie hier.