学术动态
当前位置: 首页 > 学术动态 > 正文

《自然》主刊!实验室生物医学人工智能团队构建全球微生物基因目录

时间:2021-12-17    浏览次数:

微生物在地球中无处不在,隐藏在人们的皮肤、肠道以及土壤、河流、海洋等环境,构成一个个复杂的微生物组(microbiome)群落。它们在不同环境下与不同宿主共生互动,成为影响人类健康、疾病发展、地球生态变化的重要因素。传统微生物组研究按照人类微生物、海洋微生物等不同栖息地分别进行研究,无法在全球视野下描述不同栖息环境中微生物群落的相互关联。

复旦大学计算神经科学与类脑智能教育部重点实验室青年研究员路易斯·佩德罗·科埃略(Luis Pedro Coelho)、教授赵兴明、名誉教授皮尔·伯克(Peer Bork)与来自德国、西班牙、美国、英国等多国科学家合作研究,基于全球微生物组(global microbiome)的概念,将地球上不同栖息地的微生物作为统一系统,运用人工智能技术对1.3万个公开宏基因组样本进行挖掘,构建了迄今为止最全面的全球微生物基因目录 (GMGC,Global Microbial Gene Catalog),为全球微生物组研究迈出了重要一步。该研究同时发现,大多数基因具有栖息地特异性,跨越多栖息地的基因主要富集在抗生素耐药性基因和移动遗传原件。

北京时间2021年12月16日凌晨,相关研究成果《原核生物基因的生物地理学研究》(“Towards the biogeography of prokaryotic genes”)以长文(Article)形式发表于《自然》(Nature)主刊。科埃略是论文的第一作者和共同通讯作者。该研究得到了欧盟“地平线2020”创新计划、国家重点研发计划、国家自然科学基金、上海市“脑与类脑智能基础转化应用研究”市级科技重大专项等项目的资助。


构建迄今为止最全面的全球微生物基因目录

基因目录对于描述微生物群落的物种组成和功能特性具有重要意义。自2010年欧洲分子生物学实验室(EMBL)和华大基因构建首个人类肠道微生物基因目录以来,新兴的微生物基因目录为研究人类生理学和疾病提供了重要线索。

全球微生物基因目录(GMGC,Global Microbial Gene Catalog)涵盖了肠道、口腔、皮肤、海洋、土壤等 14 个微生物的主要栖息地,收集了 13,174 个公开可用的高质量宏基因组和84,029个高质量的基因组,得到了包含3.03亿个物种级的基因(95%的核酸一致性聚类),构建了迄今为止最全面的全球微生物基因目录(图1),将为地球生态研究和人类健康研究提供重要贡献。

图1:从1.3万个宏基因组样本和近10万个细菌基因组中构建的包含3亿个原核生物基因的全球微生物基因目录。(a) 全球微生物基因目录构建流程;(b)不同栖息地之间的unigenes的共享;(c)unigene累计曲线;(d)unigenes 数量的分布

揭示微生物基因与栖息环境的重要关联

物种水平的单基因簇(unigene)可能代表着来自多种栖息地的基因(multi-habitat genes)。多栖息地基因可能来自在多种栖息环境中都生存的物种,或者来自基因组之间或者跨越栖息地边界水平转移的移动遗传原件(mobile elements)。研究发现,大多数基因都是栖息环境特异性的,这与微生物倾向于适应环境的特性是一致的;只有5.8%物种水平的单基因簇是多栖息环境基因,多栖息环境基因主要富集在抗生素耐药性基因和移动遗传原件。

图2:同栖息地共享的微生物物种。(a)不同栖息地共享的宏基因组物种;(b)不同栖息地物种间共享的unigene比例;(c)不同栖息地物种间蛋白功能集团共享情况;(d)不同栖息地物种间蛋白质家族的共享情况。

研究者们进一步研究了宏基因组中单基因簇的频率,发现大多数单基因簇是出现频率低于0.1%的罕见基因。单基因簇的频率服从中性(或接近中性)进化假设下的幂律分布(power law)。事实上,虽然观察到很多变异,但大多数变异并不是对环境的适应,而是由所谓的“中性进化”驱动:变异只是随机的结果,而不是达尔文选择。

这些发现对于理解抗生素抗性的产生,以及未来抗菌药物的研发具有重要的意义。

多学科交融的国际化研究团队

复旦大学计算神经科学与类脑智能教育部重点实验室生物医学人工智能团队聚焦于人工智能与生物医学交叉研究,自2018年以来引进一批国内外优秀学者。团队拥有计算机、数学、生物、物理等不同学科背景,交叉融合,国际化氛围浓厚。近年来,围绕生物医学大数据的特点,发展了一系列人工智能算法,已成功应用于脑-肠轴、脑发育和脑疾病等场景中,相关工作发表于《自然》(Nature)、《科学》(Science)、《细胞》(Cell)、《细胞·新陈代谢》(Cell Metabolism)、《电气与电子工程师协会·模式分析与机器智能》(IEEE TPAMI)和《自然·通讯》(Nature Communications)等期刊,2020年,团队获吴文俊人工智能自然科学一等奖。

图3:时任复旦大学副校长金力院士为皮尔·伯克教授颁发名誉教授证书,图中左三为金力校长、右四为冯建峰院长、左四为伯克教授、左二为赵兴明教授、右三为科埃略

论文第一作者科埃略于2018年全职加入复旦,此前专注于利用宏基因组及显微图像技术对微生物群体进行分析。进入计算神经科学与类脑智能教育部重点实验室工作以来,他发现,这是一个跨学科交融、国际化程度很高的大团队,同事中有三分之一来自不同国家,他与实验室生物大数据团队、计算生物学团队等多个研究组合作交流,参与实验室建设,作为课题骨干参与多个生物医学大数据、脑科学与类脑研究等重大研究计划,聚焦利用大数据的方法从事微生物组及精准医学等相关研究。

作为实验室生物医学人工智能团队的负责人,赵兴明教授介绍,前沿科学越来越突破学科界限,需要全域视野和全球视野。本研究构建了一个全球视域下的微生物基因目录,对于理解微生物与人类健康的关系具有重要的作用。下一步,团队还将基于所开发的基因目录,进一步与国内外科研院所和临床医疗开展合作,探究微生物包括人体肠道微生物与人类生命大健康、大脑认知和行为等方面的影响。

论文链接

https://www.nature.com/articles/s41586-021-04233-4