นักวิทยาศาสตร์ได้เติมเต็มช่องว่าง 8 เปอร์เซ็นต์ในจีโนมมนุษย์ในที่สุด

Apr 01 2022
การประกาศในปี 2546 ที่นักวิทยาศาสตร์ได้ทำจีโนมมนุษย์ตัวแรกเสร็จสมบูรณ์นั้น มีช่องว่าง 8 เปอร์เซ็นต์ ตอนนี้ช่องว่างนั้นถูกเติมเต็มและจีโนมมนุษย์แบบ end-to-end ตัวแรกได้รับการเผยแพร่แล้ว
มากกว่าครึ่งของจีโนมมนุษย์มีลำดับดีเอ็นเอซ้ำๆ ซึ่งหน้าที่ยังไม่เป็นที่เข้าใจอย่างถ่องแท้ รูปภาพ Adam Gault / Getty

เมื่อโครงการจีโนมมนุษย์ประกาศว่าพวกเขาได้สร้างจีโนมมนุษย์ตัวแรกเสร็จสิ้นในปี 2546 นับเป็นความสำเร็จครั้งสำคัญ ซึ่งเป็นครั้งแรกที่ พิมพ์เขียว ดีเอ็นเอของชีวิตมนุษย์ถูกปลดล็อก แต่สิ่งที่จับได้ก็คือ พวกเขาไม่สามารถรวบรวม ข้อมูล ทางพันธุกรรมทั้งหมดในจีโนมได้ มีช่องว่างอยู่ คือ ส่วนที่ไม่ถูกเติมเต็ม มักจะซ้ำซาก ซึ่งทำให้สับสนเกินกว่าจะประกอบเข้าด้วยกัน

ด้วยความก้าวหน้าทางเทคโนโลยีที่สามารถจัดการกับลำดับที่ซ้ำซากเหล่านี้ ในที่สุดนักวิทยาศาสตร์ก็เติมเต็มช่องว่างเหล่านั้นในเดือนพฤษภาคม พ.ศ. 2564และจีโนมมนุษย์แบบ end-to-end ตัวแรกได้รับการเผยแพร่อย่างเป็นทางการในวันที่ 31 มีนาคม พ.ศ. 2565

ฉันเป็นนักชีววิทยาด้านจีโนมที่ศึกษาลำดับดีเอ็นเอซ้ำๆ และวิธีที่พวกมันสร้างจีโนมตลอดประวัติศาสตร์วิวัฒนาการ ฉันเป็นส่วนหนึ่งของทีมที่ช่วยอธิบายลักษณะลำดับการทำซ้ำที่ขาดหายไปจากจีโนม และตอนนี้ ด้วยจีโนมมนุษย์ที่สมบูรณ์อย่างแท้จริง ในที่สุดบริเวณที่เกิดซ้ำๆ เหล่านี้ก็ถูกสำรวจอย่างเต็มรูปแบบเป็นครั้งแรก

ชิ้นส่วนปริศนาที่หายไป

Hans Winkler นักพฤกษศาสตร์ชาวเยอรมันเป็นผู้ประดิษฐ์คำว่า " genome " ในปี 1920 โดยรวมคำว่า "gene" เข้ากับคำต่อท้าย "-ome" ซึ่งหมายถึง "ชุดที่สมบูรณ์" เพื่ออธิบายลำดับดีเอ็นเอทั้งหมดที่มีอยู่ภายในแต่ละเซลล์ นักวิจัยยังคงใช้คำนี้ในอีกหนึ่งศตวรรษต่อมาเพื่ออ้างถึงสารพันธุกรรมที่ประกอบขึ้นเป็นสิ่งมีชีวิต

วิธีหนึ่งในการอธิบายลักษณะของจีโนมคือการเปรียบเทียบกับหนังสืออ้างอิง ในการเปรียบเทียบนี้ จีโนมเป็นกวีนิพนธ์ที่มีคำสั่งดีเอ็นเอสำหรับชีวิต ประกอบด้วยนิวคลีโอไทด์ (ตัวอักษร) จำนวนมากที่บรรจุอยู่ในโครโมโซม (บท) โครโมโซมแต่ละโครโมโซมประกอบด้วยยีน (ย่อหน้า) ซึ่งเป็นบริเวณของ DNA ซึ่งกำหนดรหัสสำหรับโปรตีนจำเพาะที่ช่วยให้สิ่งมีชีวิตทำงานได้

ในขณะที่สิ่งมีชีวิตทุกชนิดมีจีโนม ขนาดของจีโนมนั้นแตกต่างกันไปในแต่ละสายพันธุ์ ช้างใช้ข้อมูลทางพันธุกรรมรูปแบบเดียวกับหญ้าที่กินและแบคทีเรียในลำไส้ แต่ไม่มีจีโนมสองชนิดที่เหมือนกันทุกประการ บางตัวสั้น เช่น จีโนมของแบคทีเรียNasuia deltocephalinicola ที่อาศัยแมลงซึ่ง มียีนเพียง 137 ยีนใน 112, 000 นิวคลีโอไทด์ บางชนิด เช่น นิวคลีโอไทด์จำนวน 149 พันล้านชนิดของพืชดอกParis japonicaนั้นยาวมากจนยากที่จะเข้าใจว่ามียีนจำนวนเท่าใดอยู่ภายใน

แต่ยีนดังที่พวกมันเข้าใจกันตามธรรมเนียมแล้ว เหมือนกับดีเอ็นเอที่ขยายออกไปซึ่งเข้ารหัสโปรตีน เป็นเพียงส่วนเล็กๆ ของจีโนมของสิ่งมีชีวิต อันที่จริงพวกมันประกอบเป็น DNA ของมนุษย์น้อยกว่า 2 เปอร์เซ็นต์

จีโน มมนุษย์ประกอบด้วยนิวคลีโอไทด์ประมาณ 3 พันล้านตัว และมียีนเข้ารหัสโปรตีนเพียง 20,000 ยีน ซึ่งคิดเป็นประมาณ 1 เปอร์เซ็นต์ของความยาวทั้งหมดของจีโนม ส่วนที่เหลืออีก 99 เปอร์เซ็นต์เป็นลำดับดีเอ็นเอที่ไม่เข้ารหัสซึ่งไม่ได้ผลิตโปรตีน บางส่วนเป็นองค์ประกอบด้านกฎระเบียบที่ทำงานเป็นสวิตช์บอร์ดเพื่อควบคุมการทำงานของยีนอื่นๆ อื่น ๆ คือpseudogenesหรือ genomic relics ที่สูญเสียความสามารถในการทำงาน

และมากกว่าครึ่งของจีโนมมนุษย์มีการทำซ้ำ โดยมีลำดับที่ใกล้เคียงกันหลายชุด

DNA ซ้ำซ้อนคืออะไร?

รูปแบบที่เรียบง่ายที่สุดของ DNA ที่ทำซ้ำคือกลุ่มของ DNA ที่ทำซ้ำซ้ำแล้วซ้ำอีกในลำดับที่เรียกว่าดาวเทียม แม้ว่า จีโนมที่กำหนด ของ DNA ดาวเทียมจะแตกต่างกันมากน้อยเพียงใดในแต่ละคน พวกมันมักจะกระจุกที่ปลายโครโมโซมในบริเวณที่เรียกว่าเทโลเมียร์ บริเวณเหล่านี้ปกป้องโครโมโซมจากการเสื่อมโทรมระหว่างการจำลองดีเอ็นเอ นอกจากนี้ยังพบในเซนโทรเมียร์ของโครโมโซม ซึ่งเป็นบริเวณที่ช่วยให้ข้อมูลทางพันธุกรรมไม่เสียหายเมื่อเซลล์แบ่งตัว

นักวิจัยยังขาดความเข้าใจที่ชัดเจนเกี่ยวกับหน้าที่ทั้งหมดของ DNA ดาวเทียม แต่เนื่องจากดีเอ็นเอของดาวเทียมก่อให้เกิดรูปแบบที่แตกต่างกันไปในแต่ละคน นักชีววิทยาด้านนิติเวชและนักลำดับวงศ์ตระกูลจึงใช้"ลายนิ้วมือ" ของจีโนม นี้ เพื่อจับคู่ตัวอย่างที่เกิดเหตุและติดตามบรรพบุรุษ ความผิดปกติทางพันธุกรรมมากกว่า 50 อย่างเชื่อมโยงกับการแปรผันของ DNA ดาวเทียม รวมถึงโรคฮันติงตัน

DNA ของดาวเทียมมีแนวโน้มที่จะกระจุกอยู่ที่ปลายโครโมโซมในเทโลเมียร์ ในที่นี้ โครโมโซมของมนุษย์ 46 โครโมโซมเป็นสีน้ำเงิน โดยมีเทโลเมียร์สีขาว

DNA ซ้ำๆ อีกประเภทหนึ่งคือองค์ประกอบที่สามารถเคลื่อนย้ายได้ หรือลำดับที่สามารถเคลื่อนที่ไปรอบๆ จีโนมได้

นักวิทยาศาสตร์บางคนอธิบายว่าพวกมันเป็น DNA ที่เห็นแก่ตัว เพราะพวกมันสามารถแทรกตัวเองไปที่ใดก็ได้ในจีโนม โดยไม่คำนึงถึงผลที่ตามมา เมื่อจีโนมมนุษย์พัฒนาขึ้น ลำดับ transposable จำนวนมากได้รวบรวมการกลายพันธุ์ที่ยับยั้งความสามารถในการเคลื่อนไหวเพื่อหลีกเลี่ยงการหยุดชะงักที่เป็นอันตราย แต่บางคนก็ยังสามารถเคลื่อนไหวได้ ตัวอย่างเช่น การแทรกองค์ประกอบที่เคลื่อนย้ายได้นั้นเชื่อมโยงกับกรณีต่างๆ ของฮีโมฟีเลีย เอซึ่งเป็นโรคเลือดออกจากพันธุกรรม

แต่องค์ประกอบที่เคลื่อนย้ายได้ไม่ได้เป็นเพียงการก่อกวนเท่านั้น พวกเขาสามารถมีหน้าที่ควบคุมที่ช่วยควบคุมการแสดงออกของลำดับดีเอ็นเออื่น ๆ เมื่อพวกมันมีความเข้มข้นในเซนโทรเมียร์ พวกมันอาจช่วยรักษาความสมบูรณ์ของยีนที่เป็นพื้นฐานสำหรับการอยู่รอดของเซลล์

พวกเขายังสามารถนำไปสู่วิวัฒนาการ เมื่อเร็ว ๆ นี้นักวิจัยพบว่าการแทรกองค์ประกอบที่สามารถเคลื่อนย้ายเข้าไปในยีนที่สำคัญต่อการพัฒนาอาจเป็นสาเหตุที่ไพรเมตบางตัว รวมทั้งมนุษย์ไม่มีหางอีกต่อไป การจัดเรียงโครโมโซมใหม่เนื่องจากองค์ประกอบที่เคลื่อนย้ายได้นั้นเชื่อมโยงกับการกำเนิดของสปีชีส์ใหม่ เช่นชะนีแห่งเอเชียตะวันออกเฉียงใต้และ วอลลาบี ของออสเตรเลีย

ไขปริศนาจีโนมให้เสร็จ

จนกระทั่งเมื่อไม่นานมานี้ บริเวณที่ซับซ้อนเหล่านี้หลายแห่งสามารถเทียบได้กับด้านไกลของดวงจันทร์ ซึ่งทราบกันว่ามีอยู่จริงแต่มองไม่เห็น

เมื่อโครงการจีโนมมนุษย์เปิดตัวครั้งแรกในปี 1990 ข้อจำกัดทางเทคโนโลยีทำให้ไม่สามารถเปิดเผยบริเวณที่ซ้ำซากในจีโนมได้อย่างเต็มที่ เทคโนโลยีการจัดลำดับที่มีอยู่สามารถอ่านนิวคลีโอไทด์ได้ครั้งละประมาณ 500 นิวคลีโอไทด์ และชิ้นส่วนสั้นๆ เหล่านี้ต้องทับซ้อนกันเพื่อสร้างลำดับใหม่ทั้งหมด นักวิจัยใช้ส่วนที่ทับซ้อนกันเหล่านี้เพื่อระบุนิวคลีโอไทด์ถัดไปในลำดับ โดยขยายการประกอบจีโนมทีละส่วนทีละส่วน

บริเวณช่องว่างซ้ำๆ เหล่านี้เปรียบเสมือนการไขปริศนา 1,000 ชิ้นของท้องฟ้าที่มืดครึ้ม: เมื่อทุกชิ้นดูเหมือนกัน คุณจะรู้ได้อย่างไรว่าก้อนเมฆหนึ่งเริ่มต้นและอีกก้อนสิ้นสุดที่ใด ด้วยการซ้อนทับกันที่ใกล้เคียงกันในหลายจุด การจัดลำดับจีโนมอย่างเต็มที่ทีละน้อยจึงเป็นไปไม่ได้ นิวคลีโอไทด์นับล้านยังคงซ่อนเร้นในการทำซ้ำครั้งแรกของจีโนมมนุษย์

ตั้งแต่นั้นมา ลำดับแพตช์ก็ค่อยๆ เติมเต็มช่องว่างของจีโนมมนุษย์ทีละน้อย และในปี พ.ศ. 2564 กลุ่มTelomere-to-Telomere (T2T)ซึ่งเป็นกลุ่มนักวิทยาศาสตร์ระดับนานาชาติที่ทำงานเพื่อรวบรวมจีโนมมนุษย์ให้เสร็จสมบูรณ์ ได้ประกาศว่าในที่สุดช่องว่างที่เหลือทั้งหมดก็ถูกเติมเต็ม

สิ่งนี้เกิดขึ้นได้ด้วยเทคโนโลยีการหาลำดับที่ปรับปรุงแล้วซึ่งสามารถอ่านลำดับที่ยาวขึ้นได้หลายพันนิวคลีโอไทด์ ด้วยข้อมูลเพิ่มเติมเพื่อระบุลำดับที่ซ้ำซ้อนในภาพที่ใหญ่ขึ้น การระบุตำแหน่งที่เหมาะสมในจีโนมจึงง่ายขึ้น เช่นเดียวกับการลดความซับซ้อนของตัวต่อ 1,000 ชิ้นเป็นจิ๊กซอว์ 100 ชิ้น ลำดับการอ่านที่ยาวนานทำให้สามารถประกอบพื้นที่ที่ซ้ำกันขนาดใหญ่ได้เป็นครั้งแรก

ด้วยพลังที่เพิ่มขึ้นของเทคโนโลยีการจัดลำดับดีเอ็นเอที่อ่านมายาวนาน นักพันธุศาสตร์จึงอยู่ในตำแหน่งที่จะสำรวจยุคใหม่ของจีโนม โดยแก้ลำดับที่ซ้ำซ้อนที่ซับซ้อนในประชากรและสปีชีส์เป็นครั้งแรก และจีโนมมนุษย์ที่สมบูรณ์และปราศจากช่องว่างเป็นทรัพยากรอันล้ำค่าสำหรับนักวิจัยในการตรวจสอบบริเวณที่เกิดซ้ำๆ ซึ่งกำหนดโครงสร้างและการแปรผันทางพันธุกรรม วิวัฒนาการของสปีชีส์ และสุขภาพของมนุษย์

แต่จีโนมที่สมบูรณ์ตัวเดียวไม่สามารถจับได้ทั้งหมด ความพยายามอย่างต่อเนื่องในการสร้างการอ้างอิงจีโนมที่หลากหลายซึ่งเป็นตัวแทนของประชากรมนุษย์และชีวิตบนโลกอย่างสมบูรณ์ ด้วยการอ้างอิงจีโนม "เทโลเมียร์ถึงเทโลเมียร์" ที่สมบูรณ์ยิ่งขึ้น ความเข้าใจของนักวิทยาศาสตร์เกี่ยวกับสสารมืดที่ซ้ำซากของ DNA จะมีความชัดเจนมากขึ้น

Gabrielle Hartleyเป็นปริญญาเอก ผู้สมัครในสาขาชีววิทยาระดับโมเลกุลและเซลล์ที่มหาวิทยาลัยคอนเนตทิคัต เธอได้รับทุนจากมูลนิธิวิทยาศาสตร์แห่งชาติ

บทความนี้เผยแพร่ซ้ำจากThe Conversationภายใต้สัญญาอนุญาตครีเอทีฟคอมมอนส์ คุณสามารถค้นหาบทความต้นฉบับได้ที่นี่