首 页 资讯 产业动态 发明·创新 探索·发现 科学麻辣烫 科技人物 专家讲坛 新基建 院士知播

首页>科技>资讯

我国开发出新算法解决重复序列组装难题

2025年08月19日 16:55  |  作者:高志民  |  来源:人民政协网 分享到: 

人民政协网8月19日电(记者 高志民)近日,中国农业科学院农业基因组研究所农业基因组学技术研发与应用创新团队开发出了一种新算法——TRFill,解决了现有工具无法完全填补基因组间隙的难题,显著提升了基因组质量。相关研究成果发表在《基因组生物学(Genome Biology)》上。

动植物基因组的许多区域存在大量高度重复的DNA片段(如人类着丝粒、番茄端粒附近区域),这些重复结构会干扰基因组的准确拼接,导致测序结果出现错误或缺失。由于重复区域的复杂性,现有的组装软件难以完全填补基因组间隙。

为此,研究团队开发了一种名为TRFill的新算法,该算法能有效解决动植物基因组测序中的重复序列难题。TRFill利用两种高精度测序数据(PacBio HiFi长读序列和Hi-C染色体空间信息),成功填补了基因组组装中的重复区域缺口。经测试,在人类着丝粒和番茄端粒这些传统测序难题区域,该算法能够成功修复近三分之二的重复序列结构。特别是在番茄中,完善的端粒重复序列图谱首次让研究人员能够从群体层面分析这些复杂结构的变异规律。该技术为绘制更完整的基因组图谱、研究重复序列功能提供了重要工具。

该研究得到国家自然科学基金、中国农业科学院科技创新工程等项目资助。

编辑:马嘉悦