学术动态
当前位置: 首页 > 学术动态 > 正文

Nature Communications | 朱山风研究员团队开展跨测序平台与分箱模式的宏基因组分箱基准研究

时间:2025-04-02    浏览次数:

微生物是推动地球生物地球化学循环的引擎。然而,大部分微生物多样性仍未被发现,并且许多微生物在实验室中尚无法培养。宏基因组分箱(Metagenomic binning)提供了一种无需培养的方法,通过对基因组片段进行分箱来促进宏基因组组装基因组(metagenome-assembled genomes,简称MAGs)的恢复。然而,目前仍缺乏一个全面的基准来评估不同数据类型与分箱模式组合下现有分箱工具的性能。


近日,实验室朱山风研究员团队在《Nature Communications》上发表了题为《Benchmarking metagenomic binning tools on real datasets across sequencing platforms and binning modes》的研究论文。

本研究提出了数据分箱组合(data-binning combination)策略,系统性地整合了多源测序数据(包括二代,三代和混合数据)与多种分箱模式(共组装、单样本和多样本分箱)。研究数据覆盖了四种生态环境(海洋、人类肠道、活性污泥和奶酪)以及三大主流测序平台(Illumina、PacBio HiFi 和 Oxford Nanopore)。

图1.本文整体框架

该研究基于五个真实数据集在七种数据分箱组合下对13个宏基因组分箱工具进行了全面的基准测试分析。结果表明,多样本分箱在二代、三代测序数据以及混合数据中均表现出最佳性能。例如,在海洋二代、三代测序数据以及混合数据中,多样本分箱策略相较于单样本分箱,所获得的中等及以上质量(moderate or higher quality, MQ),接近完整(near-complete, NC)以及高质量(high-quality, HQ)的MAGs数量分别平均提升了125%、54%和61%。进一步分析表明,多样本分箱策略不仅能在不同数据类型中显著提高恢复MAGs的数量和质量,还有助于不同数据类型中抗生素抗性基因宿主的检测,以及从更多接近完整的菌株中发现微生物次级代谢产物。

图2.七种data-binning combinations下分箱方法结果

图3.七种data-binning combinations下识别抗生素抗性基因宿主以及检测接近完整的菌株中微生物的次级代谢产物

实验室博士生韩海涛、南开大学数学科学学院副教授王子叶(原类脑研究院博士后)为本研究的共同第一作者,实验室朱山风研究员为本论文的通讯作者。

原文链接:https://www.nature.com/articles/s41467-025-57957-6