本报讯(记者姜澎)通过人工智能技术,复旦大学类脑智能科学与技术研究院团队构建了迄今为止最全面的全球微生物基因目录(GMGC),为全球微生物组研究迈出了重要一步。
该研究同时发现,大多数基因具有栖息地特异性,跨越多栖息地的基因主要富集在抗生素耐药性基因和移动遗传元件。这些发现对于理解抗生素抗性的产生,以及未来抗菌药物的研发具有重要的意义。北京时间2021年12月16日凌晨,相关研究成果《原核生物基因的生物地理学研究》以“长文”形式发表于《自然》(Nature)。
微生物在地球中无处不在,隐藏在人们的皮肤、肠道以及土壤、河流、海洋等环境,构成一个个复杂的微生物组群落。它们在不同环境下与不同宿主共生互动,成为影响人类健康、疾病发展、地球生态变化的重要因素。
传统微生物组研究按照人类微生物、海洋微生物等不同栖息地分别进行研究,无法在全球视野下描述不同栖息环境中微生物群落的相互关联。复旦大学类脑研究院青年研究员路易斯·佩德罗·科埃略、赵兴明教授、名誉教授皮尔·伯克与来自德国、西班牙、美国、英国等多国科学家合作研究,基于全球微生物组的概念,将地球上不同栖息地的微生物作为统一系统,运用人工智能技术对1.3万个公开宏基因组样本进行挖掘,构建了迄今为止最全面的全球微生物基因目录。
基因目录对于描述微生物群落的物种组成和功能特性具有重要意义。自2010年欧洲分子生物学实验室(EMBL)和华大基因构建首个人类肠道微生物基因目录以来,新兴的微生物基因目录为研究人类生理学和疾病提供了重要线索。
全球微生物基因目录(GMGC)涵盖了肠道、口腔、皮肤、海洋、土壤等14个微生物的主要栖息地,收集了13174个公开可用的高质量宏基因组和84029个高质量的基因组,得到了包含3.03亿个物种级的基因(95%的核酸一致性聚类)。
研究发现,大多数基因都是栖息环境特异性的,这与微生物倾向于适应环境的特性一致;只有5.8%物种水平的单基因簇是多栖息环境基因,这些基因主要富集在抗生素耐药性基因和移动遗传元件。
研究者进一步研究了宏基因组中单基因簇的频率,发现虽然可以观察到很多变异,但大多数变异并非对环境的适应,而是由所谓的“中性进化”驱动。这也意味着变异只是随机结果,而非“达尔文选择”。这些发现对于理解抗生素抗性的产生,以及抗菌药物的研发意义重大。
据类脑研究院生物医学人工智能团队的负责人赵兴明教授介绍,前沿科学越来越突破学科界限,需要全域视野和全球视野。本研究构建了全球视域下的微生物基因目录,对于理解微生物与人类健康的关系具有重要的作用。下一步,团队还将基于这一基因目录,进一步与国内外科研院所和临床医疗团队开展合作,探究微生物包括人体肠道微生物对人类生命大健康、大脑认知和行为等方面的影响。
科埃略是论文的第一作者和共同通讯作者。该研究得到了欧盟“地平线2020”创新计划、国家重点研发计划、国家自然科学基金、上海市“脑与类脑智能基础转化应用研究”市级科技重大专项等项目的资助。