作者:Neuroscience News
摘要:一项使用人工智能的新研究发现了161,979种新的RNA病毒,显著扩展了我们对地球病毒多样性的理解。这些发现是通过分析遗传数据,并利用机器学习模型识别出公共数据库中之前未被认识的病毒而获得的。
研究结果揭示了全球极端环境中存在大量病毒,展示了RNA病毒的顽强性和适应性。这项研究为进一步探索病毒和微生物多样性铺平了道路,可能会重塑科学家对地球生态系统的研究方式。
关键事实
源:悉尼大学
人工智能(AI)被用来揭示生活在我们脚下和地球每个角落的多样而基本的生命形式的细节。
研究人员利用一种机器学习工具发现了161,979种新的RNA病毒,这一发现被认为将极大地改进地球上生命的图谱,并有助于识别尚未被描述的数以百万计的更多病毒。
出版于细胞并由一个国际研究团队进行的研究, 该研究是迄今为止发表的最大规模的病毒物种发现论文。
悉尼大学医学与健康学院医学科学系的霍尔姆斯教授表示:“我们得以窥见地球生命中一个原本隐藏的部分,揭示了令人惊叹的生命多样性。”
“这是单次研究中发现的新病毒种类最多的一次,极大地扩展了我们对与我们共存的病毒的认识。”霍尔姆斯教授说。
一次性发现这么多新病毒令人震惊,这只是冰山一角,开启了探索的新世界。还有成千上万的待发现,我们还可以用同样的方法来识别细菌和寄生虫。
尽管RNA病毒通常与人类疾病相关联,但它们也存在于世界各地的极端环境中,并可能在全球生态系统中发挥关键作用。在这项研究中,研究人员发现在大气、温泉和热液喷口中有它们的存在。
“极端环境中存在如此多种类型的病毒,这只是它们惊人多样性和在最恶劣环境下生存能力的一个例子,这可能为我们提供线索,说明病毒和其他基本生命形式是如何产生的,”霍尔姆斯教授说。
AI工具的工作原理
研究人员建立了一个深度学习算法LucaProt,用于计算大量的基因序列数据,包括长达47,250个核苷酸的病毒基因组和复杂的基因信息,以发现超过160,000种病毒。
“这些病毒中的绝大多数已经完成了测序,并存储在公共数据库中,但由于它们的差异性太大,没有人知道它们是什么。”霍尔姆斯教授说。
它们构成了通常所说的序列“暗物质”。我们的AI方法能够组织和分类所有这些分散的信息,首次揭示了这种暗物质的意义。
该AI工具经过训练,能够计算暗物质并根据所有RNA病毒用于复制的蛋白质序列和二级结构来识别病毒。
它能够显著加快病毒发现的速度,如果使用传统方法,这一过程将非常耗时。
中山大学的合作作者、该研究的机构负责人石猛教授说:“我们过去依赖繁琐的生物信息学管道来发现病毒,这限制了我们可以探索的多样性。"
现在,我们有一个基于人工智能的更有效的模型,该模型提供了卓越的灵敏度和特异性,并且同时允许我们更深入地探索病毒多样性。我们计划将此模型应用于各种应用中。
阿里巴巴云智能Apsara实验室的合著者李昭荣博士表示:“LucaProt代表了尖端人工智能技术与病毒学的重要融合,证明了人工智能能够在生物探索中有效完成任务。”
此项整合为进一步解析生物序列和从新的视角拆解生物系统提供了宝贵见解和激励。我们也将继续在人工智能病毒学领域的研究。
霍姆斯教授说:“显然下一步是训练我们的方法来发现更多的这种惊人的多样性,谁知道还会有什么额外的惊喜等着我们。”
资金:研究人员声明没有利益冲突。研究得到了中国国家自然科学基金、深圳市科技计划、广东省自然科学基金、广东省“珠江人才计划”创新与创业团队项目、香港创新及技术基金(ITF)和医疗卫生研究基金的支持。霍尔姆斯教授由澳大利亚国家健康与医学研究理事会的资助者拨款以及由香港特别行政区创新和技术委员会管理的AIR@InnoHK项目资助。
作者:路易萨·洛娃
来源:悉尼大学
联系人:露西娅·洛 - 悉尼大学
图片:图片来自Neuroscience News
原创研究:开放访问。
“利用人工智能来记录隐藏的病毒圈爱德华兹·霍姆斯等人的文章结尾部分的内容没有给出,仅提供了作者信息:“爱德华兹·霍姆斯等人。” 如果这是全文,请确认是否需要翻译作者名字或其他额外信息。根据您的指示,我将提供原文:
"by Edwards Holmes et al."细胞
摘要
利用人工智能来记录隐藏的病毒圈
当前的元基因组工具可能无法识别高度分化的小RNA病毒。我们开发了一种深度学习算法,名为LucaProt,用于在来自全球不同生态系统的10,487个元转录组中发现高度分化的依赖 RNA 的 RNA 聚合酶(RdRP)序列。
LucaProt同时整合了序列信息和预测的结构信息,能够准确检测RdRP序列。
采用这种方法,我们识别出了161,979种潜在的RNA病毒物种和180个RNA病毒超群,包括许多之前研究较少的群体,以及具有异常长(长达47,250核苷酸)和基因组复杂性的RNA病毒基因组。其中一部分新型RNA病毒通过RT-PCR和RNA/DNA测序得到了确认。
新发现的RNA病毒存在于多种环境中,包括空气、热泉和海底热液喷口,不同生态系统中的病毒多样性和丰度差异显著。
本研究推动了病毒的发现,强调了病毒圈的规模,并提供了计算工具以更好地记录全球RNA病毒组。