28/11/2025
จีโนมมนุษย์ 65 คนที่สมบูรณ์ที่สุดและหลากหลายสำเร็จแล้ว: ยกระดับการแพทย์แม่นยำและการตรวจคัดกรอง สปสช. สู่ระดับโครงสร้างและการปิด เปิด สวิทซ์ การทำงานของยีน
งานวิจัยความร่วมมือครั้งใหม่ระหว่าง UConn Health และ The Jackson Laboratory เปิดดวงจันทร์ด้านมืดของจีโนม—ส่วนที่เคยเข้าไม่ถึงมานาน—และเผยรายละเอียดเชิงโครงสร้าง (SVs) และสวิตช์ปิด-เปิดของยีนที่กำกับการทำงานของร่างกายในทุกช่วงชีวิต
สิ่งที่เกิดขึ้นไม่ใช่เพียงความก้าวหน้าทางวิทยาศาสตร์ แต่คือ บทเรียนพื้นฐานของ Genomics 101 เวอร์ชันโลกจริง ที่ทำให้ทุกคน—ตั้งแต่นักวิทยาศาสตร์ แพทย์ ผู้กำหนดนโยบาย จนถึงประชาชน—มองเห็นว่าการมี “แผนที่ที่ครบถ้วนของมนุษย์จริงๆ” หมายถึงอะไรต่อการยืด health span, การป้องกันโรคก่อนเกิด, การดูแลรายบุคคล (precision care) และการสร้างอาชีพใหม่ทั้งสายคลินิกและสายเทคโนโลยีที่จะเป็นรากฐานเศรษฐกิจสุขภาพแห่งอนาคต
ในประเทศไทย ข้อมูลระดับโครงสร้างเช่นนี้สอดรับกับการคัดกรองของ สปสช. ที่กำลังก้าวสู่ยุคการแพทย์แม่นยำเต็มรูปแบบ—จากระดับโครโมโซม สู่ระดับยีน และกำลังมุ่งไปถึงระดับ switch การปิด-เปิดยีน ที่กำหนดความเสี่ยงโรค การตอบสนองต่อยา และศักยภาพในการป้องกันล่วงหน้าตั้งแต่ก่อนป่วย
แผนที่จีโนมที่ละเอียดขึ้น คือแผนที่อนาคตของระบบสุขภาพไทย
แผนที่อนาคตของการยืดช่วงชีวิตที่แข็งแรง
และเป็นแผนที่อาชีพใหม่อีกหลายสิบสาขาในเศรษฐกิจการแพทย์แม่นยำแห่งศตวรรษนี้
__________________________
พลิกโฉมพิมพ์เขียวมนุษย์
__________________________
มนุษยชาติได้เห็น "ดวงจันทร์ด้านมืด" ของจีโนมแล้ว
นานกว่าสองทศวรรษ โครงการจีโนมมนุษย์ได้ทิ้งปริศนาที่ซับซ้อนที่สุดไว้ในบริเวณที่เต็มไปด้วยลำดับซ้ำซ้อน (Dark Regions) แต่ความก้าวหน้าครั้งใหญ่ที่ตีพิมพ์ใน Nature ได้เปลี่ยนทุกอย่าง ทีมนักวิทยาศาสตร์นานาชาติสามารถสร้างจีโนมอ้างอิงที่หลากหลายและสมบูรณ์ที่สุดเท่าที่เคยมีมา เปิดเผยทั้ง Structural Variants (SVs) และกลไกควบคุมยีน (Epigenomics) ในระดับที่ไม่เคยเข้าถึงได้มาก่อน
__________________________
เมื่อวิทยาศาสตร์เปิดพื้นที่ใหม่ เด็กไทยรุ่นใหม่จึงมีโอกาสเข้าสู่วงการอาชีพที่เติบโตเร็วและมั่นคง ซึ่งครอบคลุมตั้งแต่ “ต้นน้ำของการสร้างข้อมูล” ไปจนถึง “ปลายน้ำของการดูแลคนไข้แบบจำเพาะบุคคล” โดยเรียงลำดับวิชาชีพตามลำดับเหตุการณ์จริงของการทำงานด้านจีโนมดังนี้:
__________________________
ต้นน้ำ: การสร้างข้อมูลและควบคุมคุณภาพ
__________________________
1) นักวิทยาศาสตร์ห้องปฏิบัติการโมเลกุล (Molecular Genetic Technologist)
เริ่มตั้งแต่การแยก DNA, จัดลำดับยีน (Sequencing), ตรวจคุณภาพตัวอย่าง และควบคุมกระบวนการในแล็บทั้งหมด อาชีพนี้คือ “ฐานราก” ของการแพทย์แม่นยำ เพราะข้อมูลทุกอย่างต้องเริ่มต้นจากงานแล็บที่ถูกต้องและมาตรฐานสูงสุด
__________________________
กลางน้ำ: การประมวลผล วิเคราะห์ และตีความข้อมูล
__________________________
2) นักชีวสารสนเทศ (Bioinformatician)
รับข้อมูลดิบจากแล็บ แล้วใช้คอมพิวเตอร์ขั้นสูง เขียนอัลกอริทึม และใช้ AI เพื่อจัดรูปแบบข้อมูลระดับมหาศาลให้พร้อมสำหรับการวิเคราะห์เชิงลึก
3) นักวิเคราะห์ความแปรผัน (Variant Analyst)
ใช้ฐานข้อมูลทางพันธุกรรม กรองตัวแปรนับหมื่นเหลือเพียง “ตัวผู้ต้องสงสัย” ที่อาจเป็นสาเหตุของโรค อาชีพนี้คือสะพานเชื่อมระหว่างข้อมูลจากคอมพิวเตอร์ → การใช้ประโยชน์ในทางคลินิก
__________________________
ปลายน้ำ: การดูแลผู้ป่วยแบบจำเพาะบุคคล
__________________________
4) แพทย์เฉพาะทางพันธุศาสตร์คลินิก (Clinical Geneticist)
นำผลการวิเคราะห์ที่ผ่านการกรองแล้วไปใช้ในการวินิจฉัย ตีความผล และวางแผนการรักษาที่ตรงจุดที่สุด
5) Genetic Counselor
ผู้ทำหน้าที่เหมือน “เภสัชกรด้านยีน” อธิบายความหมายของผลตรวจ ให้คำแนะนำผู้ป่วย คู่สมรส และครอบครัว รวมถึงสนับสนุนแพทย์ในการเลือกแนวทางรักษาที่สอดคล้องกับพันธุกรรมของผู้ป่วยรายบุคคล
การทำงานทั้ง 5 วิชาชีพนี้ประสานกันตั้งแต่ต้นน้ำถึงปลายน้ำ และกำลังเติบโตไปพร้อมกับ AI ที่ช่วยจัดการข้อมูลยีนระดับมหาศาล ทำให้งานด้านจีโนมเป็นหนึ่งในเส้นทางอาชีพที่มั่นคงที่สุดของทศวรรษหน้า เด็กไทยที่ก้าวเข้าสู่สายนี้จึงไม่เพียงเข้าสู่ “งานอนาคต” แต่จะเป็นแรงผลักดันสำคัญของระบบสุขภาพแม่นยำในประเทศไทย
อ่านรายละเอียดเพิ่มเติม: https://www.facebook.com/CMGrama/posts/1916929868853399:1916929868853399
__________________________
5 ประเด็นหลักที่คุณต้องรู้เกี่ยวกับมาตรฐานใหม่นี้:
__________________________
1. ความสมบูรณ์ระดับ 100% และความหลากหลาย SVs 95%: ยืนยันการถอดรหัสจีโนมมนุษย์ที่สมบูรณ์แบบ (T2T) พร้อมกับการระบุความแปรผันเชิงโครงสร้างที่ซับซ้อนใน 65 จีโนมได้อย่างมีประสิทธิภาพสูง
T2T (Telomere-to-Telomere Genome Assembly)
คือการถอดรหัสจีโนมมนุษย์ให้ “เต็มทั้งเส้นโครโมโซม” ตั้งแต่ปลายเทโลเมียร์ด้านหนึ่งถึงอีกด้านหนึ่ง โดยไม่เหลือช่องว่างเหมือนจีโนมฉบับเดิมที่ยังมีส่วนซ้ำซ้อนและอ่านยากค้างอยู่หลายล้านตำแหน่ง
จีโนมมนุษย์เวอร์ชันแรก (2001–2013) ยังเว้นช่องว่างในบริเวณยาก เช่น centromere, telomere, และบริเวณที่มีลำดับซ้ำซ้อนยาว (repetitive regions)
T2T Consortium ใช้เทคโนโลยีอ่านสายยาว (Long-Read Sequencing) เช่น PacBio HiFi และ Oxford Nanopore ทำให้สามารถอ่านผ่านบริเวณที่เคยเป็น “จุดบอด” ได้
ผลลัพธ์คือ จีโนมมนุษย์ที่สมบูรณ์ 100% ครั้งแรก ปิดช่องว่างกว่า 200 ล้านเบส เพิ่มข้อมูลเกี่ยวกับ โครงสร้างซับซ้อน (SV) และความแปรผันที่มีผลต่อโรค
เปิดทางสู่ การแพทย์แม่นยำขั้นลึก เช่น การตีความการกลายพันธุ์ใน centromere หรือยีนที่อยู่ในบริเวณซ้ำซ้อนที่ตรวจไม่เคยถึงมาก่อน
T2T จึงเปรียบเหมือนการเปิด “ดวงจันทร์ด้านมืดของจีโนม” ที่ซ่อนเร้นมานาน ทำให้เรามีแผนที่พันธุกรรมมนุษย์ฉบับที่สมบูรณ์ที่สุดเท่าที่เคยมี
2. การเอาชนะจุดบอดทางเทคนิค: เทคโนโลยี Long-Read Sequencing (LRS) ช่วยให้ "พาดผ่าน" และถอดรหัสบริเวณที่ยากที่สุดในโครโมโซม เช่น Centromeres และ Telomeres
3. การเปิดเผยกลไกการทำงานของยีน: การค้นพบรูปแบบ Epigenomics ใหม่ เช่น Di-kinetochires และการเมทิลเลชันของ CpG ซึ่งอธิบายว่าปัจจัยแวดล้อมส่งผลต่อการปิด/เปิดสวิตช์ยีนอย่างไร
4. การลดความลำเอียงทางเชื้อชาติ: สร้างฐานข้อมูลที่เน้นกลุ่มแอฟริกัน เพื่อความเป็นธรรมในการวินิจฉัยโรคทางพันธุกรรมทั่วโลก
5. การประยุกต์ใช้ทางคลินิกจริง: ยกระดับความแม่นยำของการตรวจคัดกรองโรคสำคัญที่เกี่ยวข้องกับ สปสช. (เช่น BRCA1/2, เภสัชพันธุศาสตร์, และ NIPT) โดยใช้ข้อมูลอ้างอิง SVs ที่ละเอียดที่สุด
__________________________
รายละเอียดเชิงลึกของความสำเร็จทางวิทยาศาสตร์ที่กำลังจะยกระดับการแพทย์แม่นยำไปอีกขั้น:
__________________________
ผลการศึกษาครั้งล่าสุดที่เผยแพร่ในวารสาร Nature ได้พลิกโฉมความรู้ของเราเกี่ยวกับชีววิทยามนุษย์และกำหนดมาตรฐานใหม่สำหรับการแพทย์แม่นยำ (Precision Medicine) ทีมนักวิทยาศาสตร์นานาชาติประสบความสำเร็จในการถอดรหัสส่วนของจีโนมมนุษย์ที่ถูกละเลยและถอดรหัสได้ยากที่สุด จากการวิเคราะห์
__________________________
ลำดับจีโนมที่สมบูรณ์ของบุคคล 65 คนจากหลากหลายเชื้อชาติทั่วโลก
__________________________
การเลือกตัวอย่างบุคคล 65 คนนี้มีวัตถุประสงค์เพื่อเพิ่มความหลากหลายทางพันธุกรรมให้ครอบคลุมที่สุด โดยมาจาก 5 กลุ่มทวีปหลักและ 28 กลุ่มประชากรตามโครงการ 1000 Genomes Project (1kGP) ซึ่งรวมถึงกลุ่มเชื้อสายหลักดังนี้:
• แอฟริกา (AFR): จำนวน 30 คน
• อเมริกา (AMR): จำนวน 9 คน
• ยุโรป (EUR): จำนวน 8 คน
• เอเชียตะวันออก (EAS): จำนวน 10 คน
• เอเชียใต้ (SAS): จำนวน 8 คน
เหตุผลที่กลุ่มเชื้อสายแอฟริกัน (AFR) มีจำนวนมากที่สุด (30 คน): การเลือกกลุ่ม AFR ในสัดส่วนที่สูงนี้เป็นกลยุทธ์สำคัญทาง พันธุศาสตร์ประชากร (Population Genetics) และเป้าหมายของโครงการในการสร้าง "พิมพ์เขียวความหลากหลาย" (Diversity Reference) ที่สมบูรณ์ เนื่องจากทวีปแอฟริกาคือจุดกำเนิดของมนุษย์สมัยใหม่ (Homo sapiens) ทำให้กลุ่มประชากรแอฟริกันมีประวัติศาสตร์วิวัฒนาการที่ยาวนานที่สุด ส่งผลให้มีความหลากหลายทางพันธุกรรม (Genetic Diversity) สะสมอยู่มากที่สุด เมื่อเทียบกับกลุ่มประชากรที่อพยพออกไป ดังนั้น การศึกษาจีโนมแอฟริกันจึงมีความจำเป็นอย่างยิ่งในการระบุและทำความเข้าใจความแปรผันทางพันธุกรรมที่ซับซ้อน (SVs) ที่หายาก ซึ่งเป็นฐานข้อมูลสำคัญที่ส่งผลกระทบและเป็นต้นกำเนิดของความหลากหลายในกลุ่มประชากรอื่น ๆ ทั่วโลก นอกจากนี้ยังเป็นการลด "ความลำเอียงของฐานข้อมูลอ้างอิง" (Reference Bias) ซึ่งงานวิจัยจีโนมในอดีตมักเน้นกลุ่มเชื้อสายยุโรปเป็นหลัก
__________________________
คำศัพท์พื้นฐานทางพันธุกรรมเพื่อความเข้าใจ (Brief Glossary)
__________________________
เพื่อให้เข้าใจถึงขอบเขตของงานวิจัยนี้ การทำความเข้าใจคำศัพท์หลักจึงเป็นสิ่งจำเป็น:
• DNA (Deoxyribonucleic Acid):
คือโมเลกุลที่เก็บข้อมูลทางพันธุกรรมทั้งหมดของสิ่งมีชีวิต มีลักษณะเป็นเกลียวคู่ (Double Helix) ที่ประกอบด้วยลำดับของคู่เบส ได้แก่ อะดีนีน (A), ไทมีน (T), ไซโตซีน (C), และกัวนีน (G)
• ยีน (Gene): คือส่วนของ DNA ที่ทำหน้าที่เป็นพิมพ์เขียวสำหรับสร้างโปรตีน หรือชี้นำการทำงานของเซลล์ ซึ่งเป็นหน่วยพื้นฐานที่กำหนดลักษณะทางพันธุกรรม โดยประมาณการว่า จีโนมมนุษย์มีจำนวนยีนที่สร้างโปรตีน (Protein-coding Genes) อยู่ที่ประมาณ 20,000 ถึง 25,000 ตำแหน่ง
• จีโนม (Genome): คือชุดข้อมูลทางพันธุกรรมทั้งหมดของสิ่งมีชีวิต ซึ่งรวมถึง DNA ทั้งหมดที่อยู่ในเซลล์ โดยประกอบด้วยลำดับเบสประมาณ 3.2 พันล้านคู่เบส (Base Pairs) (เปรียบเสมือน "ห้องสมุด" ของรหัสพันธุกรรมทั้งหมด)
• Epigenomics:
คือการศึกษาการเปลี่ยนแปลงกลไกการทำงานของยีนที่ไม่ได้เกิดจากการเปลี่ยนแปลงลำดับเบสของ DNA โดยตรง แต่เป็นการควบคุมว่ายีนจะถูกเปิดหรือปิด (Gene Expression) กลไกสำคัญหนึ่งคือ การเติมหมู่เมทิลบน DNA (CpG methylation) ซึ่งเป็นการเติมหมู่เมทิลลงบนเบสไซโตซีน (Cytosine) เมื่ออยู่ถัดจากเบสกัวนีน (Guanine) หรือที่เรียกว่า CpG site หมายเหตุ: ตำแหน่ง CpG site ในจีโนมมีอยู่ประมาณ 28–30 ล้านตำแหน่ง และเป็นตำแหน่งที่ถาวรตามรหัสพันธุกรรม อย่างไรก็ตาม สถานะการเติมหมู่เมทิล ณ ตำแหน่งเหล่านี้มีความยืดหยุ่นสูง (Epigenetic Change) สามารถเพิ่มขึ้นหรือลดลงได้ตลอดช่วงชีวิต เพื่อตอบสนองต่อปัจจัยด้านสิ่งแวดล้อม (เช่น อาหาร ความเครียด) และการพัฒนาการของร่างกาย โดยการเติมหมู่เมทิลนี้มีผลโดยตรงต่อการแสดงออกของยีน (Gene Expression) กล่าวคือ หากมีการเติมหมู่เมทิลมาก มักจะส่งผลให้เกิดการปิดสวิตช์การทำงานของยีน (Gene Silencing) ทำให้ยีนนั้นไม่สามารถสร้างโปรตีนออกมาได้
__________________________
ยุคใหม่แห่งการถอดรหัสพันธุกรรม: การเปิดเผย Structural Variants (SVs) ที่ซ่อนอยู่
__________________________
การทำความเข้าใจความซับซ้อนของจีโนมมนุษย์เริ่มต้นจากการคลี่คลายส่วนของ DNA ที่เคยคิดว่าซับซ้อนหรือแปรผันเกินกว่าจะวิเคราะห์ได้ แม้ว่าความแปรผันแบบ SNPs จะเป็นที่รู้จักและถูกถอดรหัสมาตั้งแต่เริ่มโครงการจีโนมมนุษย์แล้ว แต่ Structural Variants (SVs) เป็นรูปแบบที่ซับซ้อนและถูกซ่อนอยู่ จนกระทั่งงานวิจัยฉบับสมบูรณ์ที่เผยแพร่ใน พ.ศ. 2568 (2025) จากการวิเคราะห์จีโนม 65 คนนี้ ทำให้เราสามารถถอดรหัส SVs ได้อย่างถูกต้องและครบถ้วน ส่วนเหล่านี้เรียกว่า "Structural Variants" (SV) หรือความแปรผันเชิงโครงสร้าง ซึ่งเป็นการเปลี่ยนแปลงขนาดใหญ่ (กำหนดที่ 50 คู่เบสขึ้นไป) ที่มีลำดับซ้ำกันสูงและซับซ้อน ความแปรผันนี้เป็นการจัดเรียงโครงสร้างดีเอ็นเอใหม่ ครอบคลุมการลบ, การเพิ่มซ้ำ, การแทรก, การกลับลำดับ, และการจัดเรียงส่วนของจีโนมใหม่ ซึ่งสามารถส่งผลต่อทุกอย่างตั้งแต่การย่อยอาหารไปจนถึงระบบภูมิคุ้มกัน
SVs แตกต่างจากความแปรผันแบบ Single Nucleotide Polymorphisms (SNPs) หรือการแทนที่นิวคลีโอไทด์เพียง 1 ตำแหน่งอย่างชัดเจน เนื่องจาก SVs เป็นการเปลี่ยนแปลงโครงสร้างโครโมโซมขนาดใหญ่ ซึ่งมักมีผลกระทบที่รุนแรงต่อการทำงานของยีนมากกว่า SNPs ด้วยเหตุนี้ การถอดรหัส SVs ให้สมบูรณ์จึงมีความสำคัญต่อการวินิจฉัยโรคอย่างแม่นยำ
ศาสตราจารย์ ชาร์ลส์ ลี (Charles Lee) นักพันธุศาสตร์ของ JAX และผู้ร่วมวิจัย กล่าวว่า ปัจจุบัน เทคโนโลยีพัฒนาจนถึงจุดที่เราสามารถถอดรหัสจีโนมที่สมบูรณ์ได้ และงานวิจัยนี้สามารถเก็บรายละเอียดความแปรผันเชิงโครงสร้างเหล่านี้ได้มากกว่า 95% จากจีโนมที่ถอดรหัสและวิเคราะห์ทั้งหมด 65 จีโนม ซึ่งนับเป็นความสำเร็จที่น่าทึ่ง
__________________________
เทคโนโลยี Long-Read Sequencing: กุญแจสู่การก้าวข้าม "จุดบอด" ทางพันธุกรรม
__________________________
ความสำเร็จในการเปิดเผย SVs ที่ซับซ้อนเหล่านี้เป็นผลมาจากการพัฒนาเทคโนโลยีการถอดรหัสพันธุกรรม DNA ขั้นสูง โดยเฉพาะ Long-Read Sequencing (LRS)
• ข้อจำกัดของ Short-Read Sequencing และ Dark Regions: โครงการ Human Genome Project (HGP) ในยุคแรก (สิ้นสุดปี 2003) ซึ่งส่วนใหญ่ใช้เทคโนโลยี Short-read Sequencing สามารถถอดรหัสจีโนมได้ประมาณ 92% โดยประมาณ 8% ที่เหลือ ถือเป็น "จุดบอดทางพันธุกรรม" (Dark Regions) ซึ่งประกอบด้วยส่วนที่มีลำดับซ้ำกันสูงมาก (เช่น Centromeres คือบริเวณกลางโครโมโซมที่จำเป็นต่อการแบ่งเซลล์ และ Telomeres คือบริเวณปลายสุดของโครโมโซมที่ทำหน้าที่ปกป้องโครโมโซม) ที่เครื่องมือ Short-read ไม่สามารถประกอบกลับเข้าด้วยกันได้อย่างถูกต้อง ส่วนที่หายไปนี้คิดเป็นปริมาณเบสเกือบ 200 ล้านคู่ (Mb) ที่มีบทบาทสำคัญต่อโรคและวิวัฒนาการฐานอ้างอิงของ HGP ดั้งเดิม: ลำดับจีโนมของ HGP ส่วนใหญ่มาจากการรวม DNA จากบุคคลประมาณ 10-20 คน แต่ประมาณ 70% ของลำดับที่เผยแพร่ออกมานั้นมาจากบุคคลเพียงคนเดียวเท่านั้น (ที่เรียกว่า HG13) ซึ่งเป็นเหตุผลที่ฐานข้อมูลนี้มีความลำเอียงทางเชื้อชาติสูงมาก
• ความสามารถของ Long-Read Sequencing: LRS ให้ 'Reads' ที่มีความยาวมากพอ (เป็นพันถึงหลายหมื่นเบส) ที่จะสามารถ "พาดผ่าน" (Span) และจัดเรียงความแปรผันเชิงโครงสร้าง (SVs) ที่ซับซ้อนและมีขนาดใหญ่ได้อย่างสมบูรณ์ ความเหนือกว่าของ LRS ต่อ SRS ในการ "พาดผ่าน" คือการที่ชิ้นส่วน DNA ที่อ่านได้มีความยาวครอบคลุมลำดับซ้ำซ้อนขนาดใหญ่ (เช่น ในบริเวณ Centromeres หรือยีนที่เพิ่มซ้ำ) ซึ่งทำให้โปรแกรมคอมพิวเตอร์สามารถประกอบลำดับดีเอ็นเอเหล่านั้นกลับเข้าที่ได้อย่างถูกต้อง โดยไม่สับสนว่าชิ้นส่วนใดมาจากบริเวณใด การใช้ LRS จึงเป็นกุญแจสำคัญในการ "ฉายไฟ" มายังบริเวณที่เคยถูกซ่อนอยู่ เสมือนการเผยให้เห็นดวงจันทร์ด้านมืดที่เราไม่เคยพบเห็นมาก่อน ใน DNA ของเรามานานหลายทศวรรษ อย่างไรก็ตาม ตัวเลขความสมบูรณ์ 100% และ 95% มีความหมายและบริบทที่ใช้ในการวัดผลที่แตกต่างกัน ดังนี้:
o 100% (ความสมบูรณ์ของพิมพ์เขียว): โครงการ T2T (Telomere-to-Telomere) ในปี 2022 มีเป้าหมายเพื่อบรรลุการถอดรหัสลำดับดีเอ็นเอของโครโมโซมมนุษย์ให้ สมบูรณ์แบบ 100% โดยไม่มีช่องว่างเหลืออยู่เลย (ในจีโนมตัวอย่างเดียว)
o 95% (ความสามารถในการจับความหลากหลาย): โครงการ Human Pangenome Reference Consortium (HPRC) มีเป้าหมายในการสร้าง "จีโนมอ้างอิงแบบรวม" ที่รวบรวมลำดับดีเอ็นเอของคนหลายสิบคน เพื่อสะท้อนความหลากหลายทางพันธุกรรมให้ครบถ้วนที่สุด และงานวิจัยล่าสุด (65 จีโนม) นี้ได้ต่อยอดความพยายามของ HPRC ในการเก็บรายละเอียดความแปรผันเชิงโครงสร้าง (SVs) ที่ซับซ้อนในกลุ่มประชากรที่หลากหลาย โดยนักวิจัยเคลมว่าสามารถระบุ SVs เหล่านี้ได้อย่างมีประสิทธิภาพมากกว่า 95% เมื่อเทียบกับเทคนิคการถอดรหัสในอดีต
ความสำเร็จ 95% นี้ถือเป็นค่าประมาณการความแม่นยำสูง (High-confidence estimate) ในการตรวจจับความแปรผันเชิงโครงสร้างที่ซับซ้อนในจีโนมของบุคคล 65 คน ส่วน 5% ที่เหลือ คือ Structural Variants ที่ยากที่สุดและหายากที่สุด ซึ่งมักอยู่ในบริเวณที่มีลำดับซ้ำซ้อนสูงและมีความแปรผันสูงมากจนเกินความสามารถของเครื่องมือวิเคราะห์และซอฟต์แวร์ปัจจุบัน ส่วนที่เหลือนี้อาจเป็นความแปรผันเฉพาะบุคคลที่เพิ่งเกิดขึ้นใหม่ (Novel Variants) หรือเป็นความแปรผันที่ซับซ้อนจนไม่สามารถระบุได้อย่างมั่นใจ (Ambiguous SVs) หนทางสู่ 100% จะต้องอาศัย: 1) การเพิ่มจำนวนและความหลากหลายของตัวอย่างจีโนม (เพื่อเพิ่มโอกาสในการค้นพบความแปรผันที่หายาก) และ 2) การพัฒนาเทคโนโลยี LRS และอัลกอริทึมการประกอบจีโนม (Assembly Algorithms) ให้มีความแม่นยำและละเอียดอ่อนยิ่งขึ้น เพื่อคลี่คลายโครงสร้างที่ซับซ้อนที่สุดเหล่านั้น
__________________________
ความสำเร็จในการสร้างพิมพ์เขียวจีโนมที่หลากหลายและสมบูรณ์
__________________________
ด้วยความสามารถของ LRS ดังกล่าว ทีมวิจัยจึงสามารถต่อยอดความสำเร็จจากโครงการ T2T และแพนจีโนมฉบับร่างได้สำเร็จ การวิจัยครั้งนี้เป็นก้าวที่ยิ่งใหญ่ โดยสามารถ ปิดช่องว่างข้อมูลที่เหลืออยู่ได้ถึง 92% ซึ่งตัวเลขนี้ไม่ใช่ช่องว่างที่เหลือจาก HGP แต่เป็นการวัดความก้าวหน้าทางเทคนิคในการปิดช่องว่างที่เคยถูกรายงานไว้ในชุดจีโนมที่เคยประกอบลำดับเสร็จแล้วในอดีต (Previous HiFi-only assemblies) ซึ่งยังมี "ช่องว่าง" (Gaps) หรือบริเวณที่ลำดับดีเอ็นเอไม่สมบูรณ์เหลืออยู่ โดยนักวิจัยได้ใช้ชุดจีโนม 32 ตัวอย่างจากความพยายามครั้งก่อนของ Human Genome Structural Variation Consortium (HGSVC) เป็นฐานอ้างอิง และพบว่าเทคนิค Long-Read ขั้นสูงล่าสุดสามารถ "ปิด" ช่องว่างที่เคยถูกรายงานไว้ในจีโนมชุดเดิมได้ถึง 92% ซึ่งหมายถึงความก้าวหน้าอย่างยิ่งในการเอาชนะความซับซ้อนของลำดับซ้ำซ้อน
ศาสตราจารย์ ดร. คริสติน เบ็ค กล่าวว่า "เป็นเวลานานเกินไปแล้วที่ข้อมูลอ้างอิงทางพันธุกรรมของเราละเลยประชากรส่วนใหญ่ของโลก" งานวิจัยนี้สามารถจับความหลากหลายที่สำคัญซึ่งจะช่วยอธิบายได้ว่า เหตุใดความเสี่ยงของโรคจึงไม่เท่ากันในทุกคน
สามารถถอดรหัสจีโนมได้ประมาณ 92% โดยประมาณ 8% ที่เหลือ ถือเป็น "จุดบอดทางพันธุกรรม" (Dark Regions)
__________________________
แสงสว่างใหม่: การค้นพบในระดับจีโนมและการปิด เปิด สวิทซ์ การทำงานของยีน (Epigenomics)
__________________________
ข้อมูลจีโนมและแพนจีโนมที่ละเอียดในระดับนี้ ได้นำมาซึ่งการค้นพบที่สำคัญยิ่งในหลายมิติ โดยเฉพาะในบริเวณที่เกี่ยวข้องกับโรคที่ซับซ้อน
1. การถอดรหัสโครโมโซม Y และ Centromeres: ทีมงานสามารถถอดรหัสโครโมโซม Y ได้อย่างสมบูรณ์จากจีโนมเพศชาย 30 ราย ซึ่งมีความท้าทายอย่างยิ่งเนื่องจากลำดับซ้ำสูง
นอกจากนี้ ยังสามารถประกอบและตรวจสอบ Centromeres (บริเวณที่จำเป็นสำหรับการแบ่งเซลล์) ได้อย่างแม่นยำถึง 1,246 แห่ง ซึ่งเผยให้เห็นความแปรผันอย่างมากที่แกนกลางของโครโมโซม
2. มิติใหม่ของ Epigenomics: การวิเคราะห์ Epigenetic ได้เปิดเผยข้อมูลสำคัญเกี่ยวกับการควบคุมการแสดงออกของยีน:
o การระบุ Centromere Dip Region (CDR): การวิเคราะห์เมทิลเลชันช่วยให้สามารถระบุบริเวณที่มีการเมทิลเลชันต่ำ (Hypomethylation) หรือที่เรียกว่า CDR ซึ่งเป็นจุดที่คาดว่าจะเป็นจุดยึดเกาะของไคนีโทคอร์ (Kinetochore) ซึ่งคือโครงสร้างโปรตีนเชิงซ้อนที่ทำหน้าที่ดึงโครโมโซมให้แยกออกจากกันอย่างเท่าเทียมกันระหว่างการแบ่งเซลล์ การค้นพบนี้ให้ภาพความเข้าใจที่สมบูรณ์ทั้งในระดับพันธุกรรมและการควบคุมการทำงานของยีน
3. ยีนและภูมิคุ้มกันที่สำคัญ: ภูมิภาคของจีโนมที่เกี่ยวข้องกับระบบภูมิคุ้มกันอย่าง Major Histocompatibility Complex (MHC) ซึ่งเชื่อมโยงกับโรคมะเร็ง, กลุ่มอาการภูมิต้านตนเอง, และโรคอื่น ๆ อีกกว่า 100 ชนิด ถูกถอดรหัสได้อย่างสมบูรณ์ นอกจากนี้ยังรวมถึงยีน SMN1 และ SMN2 ที่เป็นเป้าหมายของการบำบัดโรคกล้ามเนื้อไขสันหลังฝ่อ (SMA) และกลุ่มยีน Amylase ซึ่งช่วยมนุษย์ย่อยอาหารประเภทแป้ง
__________________________
ความจำเป็นของโครงการจีโนมิกส์ไทยแลนด์: สะพานเชื่อมความรู้ระดับโลกสู่คนไทย
__________________________
การสำเร็จของโครงการวิเคราะห์จีโนม 65 คนทั่วโลกนี้ ไม่ได้ทำให้โครงการจีโนมิกส์ประเทศไทย (Genomics Thailand) ด้อยค่าลงหรือหมดความจำเป็น ตรงกันข้าม ความสำเร็จระดับโลกนี้ยิ่ง เสริมสร้าง (Enhance) ความสำคัญและความแม่นยำของโครงการจีโนมิกส์ไทยแลนด์อย่างมาก
เหตุผลหลักในการยืนยันความจำเป็นของโครงการจีโนมิกส์ไทยแลนด์ มีดังนี้:
1. ความจำเพาะของเชื้อชาติ (Local Specificity):
o ความแปรผันที่ไม่ถูกบันทึก: แม้ว่างานวิจัย 65 คนจะมีความหลากหลายทางเชื้อชาติในระดับโลกสูง (โดยเน้นกลุ่มแอฟริกัน) แต่ก็ไม่สามารถครอบคลุม ความแปรผันทางพันธุกรรม (Genetic Variants) ที่มีลักษณะเฉพาะและมีความถี่สูงในประชากรไทยได้
o ความแตกต่างในเอเชียตะวันออกเฉียงใต้: ประชากรไทยมีประวัติศาสตร์การอพยพและผสมผสานทางพันธุกรรมที่ซับซ้อน (โดยเป็นส่วนหนึ่งของกลุ่มเอเชียตะวันออกเฉียงใต้ ไม่ใช่เพียงแค่กลุ่ม East Asia/EAS ทั่วไป) ส่งผลให้ยีนบางตำแหน่งที่มีความเสี่ยงต่อโรคในไทย (เช่น โรคธาลัสซีเมีย, ความไวต่อยาเฉพาะกลุ่ม) อาจเป็น Rare Variants ในฐานข้อมูลโลก แต่เป็น Common Variants ในไทย โดยเฉพาะอย่างยิ่งในด้านความไวต่อยา (Pharmacogenomics) การค้นพบ SVs ในยีนที่เกี่ยวข้องกับเมตาบอลิซึมของยาในคนไทย มีความสำคัญอย่างยิ่งในการลดความเสี่ยงของอาการไม่พึงประสงค์จากยาในระบบบริการสุขภาพของ สปสช. โดยตรง
o ฐานข้อมูลเพื่อการปฏิบัติงานจริง: โครงการจีโนมิกส์ไทยแลนด์ (ซึ่งมักตั้งเป้าหมายไว้ที่ 50,000–100,000 จีโนม) มีเป้าหมายเพื่อสร้าง "ฐานข้อมูลอ้างอิงของคนไทย" โดยเฉพาะ เพื่อให้ระบบการแพทย์ของไทย (รวมถึงการตรวจคัดกรองของ สปสช.) สามารถอ้างอิงกับข้อมูลของคนในประเทศได้อย่างแม่นยำที่สุด
2. การยกระดับมาตรฐานการวิเคราะห์ SVs และ Epigenomics:
o การนำมาตรฐานมาประยุกต์ใช้: โครงการจีโนมิกส์ไทยแลนด์จะได้รับประโยชน์โดยตรงจากมาตรฐาน T2T 100% นี้ กล่าวคือ นักวิจัยไทยสามารถใช้เทคนิคและซอฟต์แวร์ที่ได้รับการพิสูจน์แล้ว (จากงานวิจัย 65 คน) เพื่อนำมาประยุกต์ใช้ในการค้นหาและทำแผนที่ Structural Variants และ Epigenetic changes ที่มีความสำคัญทางคลินิก ที่เกิดขึ้นในประชากรไทย ด้วยความแม่นยำที่สูงกว่าเดิมมาก
สรุป: โครงการจีโนมิกส์ไทยแลนด์ยังคงมีความจำเป็นอย่างยิ่งในการสร้าง "สะพานเชื่อม" ระหว่างความรู้จีโนมิกส์ระดับโลก (ที่ได้จากงานวิจัย 65 คน) กับความเฉพาะเจาะจงทางพันธุกรรมและสุขภาพของคนไทย ซึ่งเป็นขั้นตอนสำคัญที่ขาดไม่ได้ในการนำ "การแพทย์แม่นยำ" มาสู่การปฏิบัติในระบบสาธารณสุขของประเทศอย่างมีประสิทธิภาพและเท่าเทียม
__________________________
การประยุกต์ใช้ในการแพทย์แม่นยำ: จากฐานข้อมูลสู่การวินิจฉัยทางคลินิก
__________________________
รายละเอียดในระดับ Structural Variants และ Epigenomics ที่ค้นพบนี้จะขับเคลื่อนการวินิจฉัยและรักษาโรคไปสู่ความเป็นส่วนตัวที่แม่นยำยิ่งขึ้น รวมถึงการยกระดับการตรวจคัดกรองที่เกี่ยวข้องกับ สปสช. ให้มีความน่าเชื่อถือและครอบคลุม:
__________________________
ฐานข้อมูลความหลากหลาย SVs/Centromere: ชุดอ้างอิงเพื่อความแม่นยำและเป็นธรรม
__________________________
"ฐานข้อมูลความหลากหลายของ SVs/โครงสร้าง Centromere จากประชากรหลากหลายเชื้อชาติ" เป็นชุดอ้างอิงที่สมบูรณ์ ซึ่งช่วยให้เทคโนโลยีการตรวจวินิจฉัยทางคลินิกที่ใช้เทคนิค Short-read สามารถ "อ่าน" และ "ทำแผนที่" ดีเอ็นเอที่ตรวจพบได้อย่างแม่นยำแม้ในบริเวณที่ซับซ้อนที่สุด โดยอ้างอิงกับพิมพ์เขียวจีโนม 100% ที่ไม่มีช่องว่าง ทำให้ลดอัตราการวินิจฉัยผิดพลาด (False Negative) และเพิ่มโอกาสในการรักษาที่ตรงจุดยิ่งขึ้นในทุกเชื้อชาติ
__________________________
กรณีศึกษา: การเปลี่ยนแนวทางการรักษาเฉพาะบุคคล
__________________________
• 1. การตรวจยีน BRCA1 และ BRCA2: การกลายพันธุ์ที่สำคัญในยีน BRCA มักอยู่ในรูปแบบของ Large Genomic Rearrangements (LGRs) ซึ่งเทคนิค Short-read มักจะตรวจพลาด การมีพิมพ์เขียวจีโนม 100% และฐานข้อมูล SVs ที่ละเอียด ทำให้การตรวจหา LGRs ในยีน BRCA1/2 ทำได้แม่นยำขึ้นมาก ลดผลลบลวงที่สำคัญในการคัดกรองความเสี่ยงมะเร็งในระดับประเทศ
• 2. การตรวจคัดกรองความผิดปกติของโครโมโซมทารกในครรภ์ (NIPT): ความรู้เรื่องโครงสร้างของ Centromeres และความหลากหลายของลำดับซ้ำ ช่วยให้การวิเคราะห์เศษดีเอ็นเอของทารก (Cell-Free DNA) สามารถทำได้อย่างแม่นยำในบริเวณที่เคยเป็นปัญหาของจีโนม ทำให้ความแม่นยำในการระบุความผิดปกติของโครโมโซมที่ซับซ้อนใน NIPT สูงขึ้น
• 3. SVs/CSVs และความหลากหลายของประชากร: การวินิจฉัยที่ยุติธรรม การใช้ข้อมูลอ้างอิงที่ครอบคลุมเชื้อชาติทั่วโลกช่วยลดความเหลื่อมล้ำในการวินิจฉัยโรคทางพันธุกรรม กรณีศึกษา: ผู้ป่วยเชื้อสายแอฟริกันเข้ารับการวินิจฉัยโรคภูมิต้านตนเอง การจัดลำดับแบบเก่าไม่พบความผิดปกติที่สำคัญ แต่การใช้ข้อมูลอ้างอิงใหม่สามารถระบุ Structural Variant (SV) ที่ซับซ้อน ในยีน MHC ได้สำเร็จ ทำให้แพทย์สามารถเลือกใช้ยาต้านภูมิคุ้มกันที่ออกฤทธิ์จำเพาะเจาะจงกับ SV นั้นได้ทันที
• 4. การถอดรหัสยีน SMN1/SMN2 ที่สมบูรณ์: การรักษาเฉพาะบุคคลสำหรับ SMA ความสามารถในการนับจำนวนสำเนา (Copy Number) ของยีน SMN1/SMN2 ได้อย่างแม่นยำ 100% คือกุญแจสำคัญในการรักษาโรคกล้ามเนื้อไขสันหลังฝ่อ (SMA) กรณีศึกษา: ทารกที่สงสัยว่าเป็นโรค SMA การนับสำเนา SMN2 ที่มีความแม่นยำสูงทันทีหลังคลอด ทำให้แพทย์สามารถกำหนดขนาดของยา (Dosage) สำหรับการรักษาด้วยยีนบำบัด (A*O Therapy) ได้อย่างแม่นยำที่สุด
• 5. การค้นพบ Di-kinetochires: การประเมินความเสี่ยงมะเร็งที่แม่นยำ การตรวจพบว่าผู้ป่วยอยู่ในกลุ่มที่มีโครงสร้าง Di-kinetochires (7% ของประชากร) จะช่วยให้แพทย์คาดการณ์ความเสี่ยงที่โครโมโซมจะแบ่งตัวผิดพลาด และปรับยาเคมีบำบัดบางชนิดที่ทำงานกับกลไกการแบ่งเซลล์ให้มีประสิทธิภาพและปลอดภัยสูงสุด
• 6. การถอดรหัสกลุ่มยีน Amylase: โภชนาการและสุขภาพเมตาบอลิซึมส่วนบุคคล การเชื่อมโยงความหลากหลายของยีน Amylase (ช่วยย่อยแป้ง) เข้ากับความเสี่ยงต่อโรคอ้วนและเบาหวานเป็นการเปิดทางสู่โภชนาการเฉพาะบุคคล กรณีศึกษา: ผู้ป่วยที่มีจำนวนสำเนาของยีน Amylase ต่ำ อาจได้รับการแนะนำให้ลดปริมาณการบริโภคคาร์โบไฮเดรต/แป้งลงอย่างมีนัยสำคัญ เมื่อเทียบกับผู้ที่มีสำเนา Amylase สูง เพื่อป้องกันความเสี่ยงต่อภาวะดื้ออินซูลินและโรคเบาหวานประเภท 2
__________________________
ข้อเสนอเชิงกลยุทธ์: บทบาทของ Long-Read ในบริการคลินิก
__________________________
แม้ว่าบริการตรวจทางคลินิกที่ได้รับเงินชดเชยจาก สปสช. จะต้องใช้เทคนิค Short-Read Sequencing (SRS) เป็นแพลตฟอร์มหลัก เพื่อให้สามารถรองรับปริมาณงานสูงภายใต้ข้อจำกัดด้านต้นทุน (Low Margin, High Volume) แต่ศูนย์จีโนมควรใช้ Long-Read Sequencing (LRS) ในฐานะ เครื่องมือยืนยันความแม่นยำสูงสุด (High Precision) เพื่อจัดการความเสี่ยงทางคลินิกที่สำคัญ
• บทบาทเครื่องมือยืนยัน (Confirmation/Tier 2): LRS ควรถูกวางไว้เป็นเครื่องมือวิเคราะห์เชิงลึกเฉพาะกรณีที่ผลการตรวจ SRS พบข้อสงสัยหรือไม่ชัดเจน เพื่อลดความเสี่ยงจากการวินิจฉัยผิดพลาด
• การประยุกต์ใช้ในการตรวจ BRCA1/2 และ Cancer Panel: เนื่องจากยีน BRCA1/2 มักมีการกลายพันธุ์แบบ Large Genomic Rearrangements (LGRs) ซึ่ง SRS ตรวจพลาดได้สูงมาก และ LRS มีค่าใช้จ่ายสูง จึงควรใช้ LRS ในการตรวจหา LGRs อย่างเจาะจง เฉพาะในผู้ป่วยที่มีความเสี่ยงสูง ที่ผล SRS เป็นลบที่น่าสงสัยเท่านั้น LRS สามารถ "พาดผ่าน" บริเวณซ้ำซ้อนของยีนได้อย่างสมบูรณ์
• การประยุกต์ใช้ในการตรวจ NIPT: เนื่องจาก Cell-Free Fetal DNA (cfDNA) ในการตรวจ NIPT มีขนาดสั้นมาก (มีจุดสูงสุดหลักอยู่ที่ประมาณ 162 คู่เบส) จึง ไม่เหมาะ กับการใช้เทคโนโลยี Long-Read โดยตรง แต่ LRS มีบทบาทสำคัญทางอ้อม โดยการใช้ LRS เพื่อสร้าง ฐานข้อมูล Centromere ที่สมบูรณ์ (รวมถึง Di-kinetochires) จากงานวิจัยล่าสุด ทำให้การทำแผนที่และการวิเคราะห์เศษดีเอ็นเอของทารกที่ซับซ้อนในบริเวณ "จุดบอด" ของโครโมโซมมีความแม่นยำสูงขึ้นมาก แม้จะใช้ SRS ก็ตาม
__________________________
การมุ่งสู่อนาคตของการแพทย์แม่นยำที่เป็นสากล
__________________________
ความสำเร็จจากการวิจัยนี้ตอกย้ำถึงความสำคัญของข้อมูลพันธุกรรมที่ครบถ้วน การค้นพบนี้ได้กำหนดมาตรฐานทองคำใหม่สำหรับการถอดรหัสจีโนม โดยแสดงให้เห็นว่า การรวมชุดข้อมูลที่สมบูรณ์จากการศึกษาครั้งนี้เข้ากับข้อมูลอ้างอิงแพนจีโนมฉบับร่าง สามารถเพิ่มความแม่นยำในการหาชนิดจีโนไทป์ (Genotyping) จากข้อมูล Short-read ได้อย่างมีนัยสำคัญ
การมีข้อมูลพันธุกรรมที่สมบูรณ์และหลากหลายทั่วโลกเป็นสิ่งสำคัญในการทำความเข้าใจความเสี่ยงต่อโรคทั้งหมด งานวิจัยนี้ช่วยให้มั่นใจได้ว่า การค้นพบทางการแพทย์ที่ก้าวหน้าในอนาคตจะสามารถมอบประโยชน์ให้กับประชากรทุกคน ไม่ใช่เพียงแค่กลุ่มที่ได้รับการวิจัยอย่างเข้มข้นในอดีตเท่านั้น
__________________________
งานวิจัยนี้เป็นผลจากความร่วมมือของสถาบันกว่า 20 แห่งภายใต้การกำกับดูแลของ Human Genome Structural Variation Consortium
Complex genetic variation in nearly complete human genomes
https://www.nature.com/articles/s41586-025-09140-6
Podcast: https://www.facebook.com/reel/736355912822545?locale=th_TH