10/09/2025
🌟Departmental Publication Highlight!
(คำแปลภาษาไทยด้านล่าง)
Whole-genome sequencing (WGS) is widely used to study human genomics; however, non-human nucleic acids can sometimes show up in human WGS data. When viruses, for example, are present in the sample, high throughput sequencing can capture traces of their nucleic acids alongside those of humans, and therefore they can sometimes be detected, “hidden” within human WGS datasets.
In a new study published in Microbiology Spectrum, researchers analysed 1,175 WGS datasets from Thai individuals using Entourage, a virus-mining pipeline, and uncovered hundreds of anellovirus sequences. With 434 partial genomes and the first 77 complete genome sequences of Thai anelloviruses, this study reports the largest and most well-curated collection of anellovirus sequences reported from Thailand to date.
Until now, only three anellovirus genera have been reported in Thai human individuals (Alphatorquevirus, Betatorquevirus, and Gammatorquevirus). This study expands the landscape of known Thai anelloviruses in humans to include four more genera (Hetorquevirus, Lamedtorquevirus, Samektorquevirus, and Yodtorquevirus). In addition, the researchers identified 33 potentially novel species within the genera Alphatorquevirus (six potentially novel species), Betatorquevirus (23 potentially novel species), and Gammatorquevirus (four potentially novel species). Their analyses also suggest frequent cross-border transmission of anelloviruses between Thailand and other countries. The authors hope that their results will help establish a foundation for future anellovirus studies in Thailand.
The study also examined the virus current species classification system, which relies entirely on pairwise similarity analysis of complete orf1 sequences—the largest gene encoding the virus capsid protein. While pairwise similarity analysis often gives results that are consistent with virus evolutionary relationships, the authors found that this was not always the case—particularly when sequence alignments contain many gaps. In such cases, relying solely on similarity measures could incorrectly group very distantly related viruses together. They recommend that similarity-based classification should be cross-checked with phylogenetic analysis to ensure consistency with evolutionary history, especially when the similarity values are calculated from alignments with high gap proportions.
While mining human WGS for viral sequences is not yet a routine practice, the study highlights its potential for virus discovery. With sequencing technologies and tools for sequence analysis becoming increasingly accessible worldwide, we can expect to see new anelloviruses reported from underexplored regions and populations, and this will undoubtedly reshape our understanding of anellovirus diversity and taxonomy.
Article title:
Discovery of diverse anellovirus sequences in Thai human sequencing data
Journal:
Microbiology Spectrum
Publication date:
4 September 2025
DOI:
https://doi.org/10.1128/spectrum.00866-25
---
การหาลำดับพันธุกรรมทั้งจีโนม (Whole-genome sequencing: WGS) ถูกนำมาใช้อย่างแพร่หลายในการศึกษาจีโนมของมนุษย์ อย่างไรก็ตาม บางครั้งอาจตรวจพบกรดนิวคลีอิกที่ไม่ใช่ของมนุษย์ในข้อมูล WGS ของมนุษย์ได้ ตัวอย่างเช่น เมื่อมีไวรัสอยู่ในตัวอย่าง เทคนิคการหาลำดับพันธุกรรมแบบ high throughput สามารถจับร่องรอยของกรดนิวคลีอิกของไวรัสเหล่านั้นไปพร้อมกับของมนุษย์ และด้วยเหตุนี้จึงสามารถตรวจพบไวรัสที่ “ซ่อนอยู่” ในชุดข้อมูล WGS ของมนุษย์ได้
ในการศึกษาล่าสุดที่ตีพิมพ์ในวารสาร Microbiology Spectrum นักวิจัยได้วิเคราะห์ข้อมูล WGS จำนวน 1,175 ชุดจากบุคคลชาวไทย โดยใช้เครื่องมือ Entourage ซึ่งเป็นระบบ pipeline สำหรับค้นหาไวรัส และค้นพบลำดับพันธุกรรมของ anellovirus หลายร้อยสายพันธุ์ โดยมีจีโนมบางส่วน 434 ลำดับ และจีโนมสมบูรณ์ 77 ลำดับแรกของ anellovirus จากคนไทย งานวิจัยนี้จึงรายงานชุดข้อมูลที่ใหญ่ที่สุดและมีการจัดการอย่างเป็นระบบของลำดับ anellovirus ที่ได้จากประเทศไทยจนถึงปัจจุบัน
ก่อนหน้านี้ มีรายงาน anellovirus เพียง 3 สกุลจากบุคคลชาวไทย ได้แก่ Alphatorquevirus, Betatorquevirus และ Gammatorquevirus แต่การศึกษานี้ได้ขยายขอบเขตของ anellovirus ที่พบในคนไทยออกไปอีก 4 สกุล ได้แก่ Hetorquevirus, Lamedtorquevirus, Samektorquevirus และ Yodtorquevirus นอกจากนี้ นักวิจัยยังค้นพบชนิดพันธุ์ที่อาจเป็นชนิดใหม่จำนวน 33 ชนิด ได้แก่ 6 ชนิดในสกุล Alphatorquevirus, 23 ชนิดในสกุล Betatorquevirus และ 4 ชนิดในสกุล Gammatorquevirus ผลการวิเคราะห์ยังบ่งชี้ว่าอาจมีการแพร่เชื้อข้ามพรมแดนของ anellovirus ระหว่างประเทศไทยและประเทศอื่นอยู่บ่อยครั้ง ผู้เขียนหวังว่าผลการวิจัยนี้จะเป็นรากฐานสำคัญสำหรับการศึกษาด้าน anellovirus ในประเทศไทยต่อไป
งานวิจัยยังได้ตรวจสอบระบบการจัดจำแนกชนิดของไวรัสที่ใช้อยู่ในปัจจุบัน ซึ่งอาศัยการวิเคราะห์ความคล้ายคลึงแบบคู่ต่อคู่ (pairwise similarity) ของลำดับยีน orf1 ทั้งหมด ซึ่งเป็นยีนที่มีขนาดใหญ่ที่สุดและเข้ารหัสโปรตีน capsid ของไวรัส แม้ว่าการวิเคราะห์แบบนี้มักให้ผลที่สอดคล้องกับวิวัฒนาการของไวรัส แต่ผู้วิจัยพบว่าไม่ใช่ทุกกรณี โดยเฉพาะเมื่อการจัดเรียงลำดับ (sequence alignment) มีช่องว่างจำนวนมาก ซึ่งอาจทำให้ไวรัสที่มีความสัมพันธ์ห่างไกลกันมากถูกจัดกลุ่มเข้าด้วยกันอย่างไม่ถูกต้องได้ ดังนั้นจึงแนะนำว่าการจัดจำแนกที่อิงความคล้ายคลึงเพียงอย่างเดียว ควรได้รับการตรวจสอบร่วมกับการวิเคราะห์สายวิวัฒนาการ (phylogenetic analysis) เพื่อให้มั่นใจว่าผลลัพธ์สอดคล้องกับประวัติวิวัฒนาการ โดยเฉพาะในกรณีที่ค่าความคล้ายคลึงคำนวณจากการจัดเรียงที่มีช่องว่างในสัดส่วนสูง
แม้ว่าการค้นหาลำดับพันธุกรรมไวรัสในข้อมูล WGS ของมนุษย์จะยังไม่ใช่กระบวนการมาตรฐาน แต่งานวิจัยนี้ได้แสดงให้เห็นถึงศักยภาพของแนวทางดังกล่าวในการค้นพบไวรัสใหม่ ๆ และด้วยความก้าวหน้าของเทคโนโลยีการหาลำดับพันธุกรรมและเครื่องมือวิเคราะห์ที่เข้าถึงได้ง่ายขึ้นทั่วโลก เราน่าจะได้เห็นการรายงาน anellovirus สายพันธุ์ใหม่จากพื้นที่และประชากรที่ยังไม่ถูกสำรวจมาก่อน ซึ่งจะช่วยเปลี่ยนแปลงความเข้าใจของเราต่อความหลากหลายและการจำแนกของ anellovirus อย่างแน่นอน
ชื่อบทความ: Discovery of diverse anellovirus sequences in Thai human sequencing data
วารสาร: Microbiology Spectrum
วันที่ตีพิมพ์: 4 กันยายน 2025
DOI: https://doi.org/10.1128/spectrum.00866-25