病毒从哪里来?AlphaFold 和其他人工智能正在寻找答案 - Nature.com

2024-09-16 19:53:50 英文原文

人工智能 (AI) 正在帮助重新绘制病毒谱系。由 AlphaFold 和聊天机器人启发的蛋白质语言模型生成的预测蛋白质结构发现了病毒家族中的一些令人惊讶的联系,其中包括感染人类的​​病原体以及新出现的威胁。

Ex-元科学家首次推出巨型人工智能蛋白质设计模型

许多科学家对病毒进化的理解都是基于基因组比较。但病毒的快速进化,尤其是那些基因组以 RNA 形式编写的病毒,以及它们从其他生物体获取遗传物质的倾向,意味着基因序列可以隐藏病毒之间深层而遥远的关系,而这种关系也可能根据所检查的基因而变化。

在本月《自然》杂志上发表的一篇论文中,格罗夫和他的团队展示了基于结构的方法在黄病毒中的威力,黄病毒包括丙型肝炎病毒、登革热病毒和寨卡病毒,以及一些主要的动物病原体和病毒。可能对人类健康构成新威胁的物种。

病毒如何进入

许多研究人员对黄病毒进化的理解都是基于复制其遗传物质的缓慢进化的酶序列。然而,研究人员对黄病毒用来侵入细胞的病毒进入蛋白的起源知之甚少,这些蛋白决定了它们可以感染的宿主范围。格罗夫认为,这种差距减缓了有效丙型肝炎疫苗的开发,丙型肝炎每年导致数十万人死亡。

人工智能设计的蛋白质可以武器化吗?科学家制定了安全指南

在序列层面,事情差异如此之大,以至于我们无法判断它们是否相关,他说。蛋白质结构预测的出现解开了整个问题,我们可以非常清楚地看到事情。

研究人员使用 DeepMinds AlphaFold2 模型和 ESMFold(科技巨头 Meta 开发的结构预测工具)生成了超过预测了来自 458 种黄病毒物种的 33,000 个蛋白质结构。ESMFold 基于经过数千万个蛋白质序列训练的语言模型。与 AlphaFold 不同的是,它只需要单个输入序列,而不是依赖于相似蛋白质的多个序列,因此它对于审查最神秘的病毒可能特别有用。

预测的结构使作者能够识别病毒与已知黄病毒的序列非常不同的进入蛋白。他们发现了一些意想不到的链接。例如,包括丙型肝炎在内的病毒子集使用与他们在鼠疫病毒中发现的系统类似的系统感染细胞,鼠疫病毒包括经典猪瘟病毒和其他动物病原体,该病毒会导致猪出血热。

<基于人工智能的比较表明,该进入系统与​​许多其他黄病毒的进入系统不同。对于丙肝及其亲属,我们不知道它的进入系统从何而来。格罗夫说,它可能是这些病毒很久以前就发明的。

从细菌中窃取

预测的结构还表明,经过充分研究的寨卡病毒和登革热病毒的进入蛋白已经与格罗夫描述的具有巨大基因组的怪异而奇妙的黄病毒相同,其中包括可以引起人类发烧的长谷蜱病毒。另一个大惊喜是发现一些黄病毒具有一种似乎是从细菌中窃取的酶。

设置好后就忘记它:自动化实验室使用人工智能和机器人技术来改善蛋白质

澳大利亚悉尼大学的病毒学家玛丽·佩特龙 (Mary Petrone) 表示,如果不是她的团队今年在一种特别奇怪而奇妙的黄病毒物种中发现了类似的盗窃事件,这将是前所未有的。她补充道,基因盗版在塑造黄病毒的进化过程中发挥的作用可能比之前想象的更大。

瑞士洛桑大学的计算生物学家 David Moi 表示,黄病毒研究是这只是冰山一角,其他病毒甚至某些细胞生物的进化历史很可能会被人工智能改写。他说,我们将用新一代工具重述他们的故事。现在我们看得更远了,所有这些事情都必须有一点更新。

摘要

人工智能 (AI) 正在帮助重新绘制病毒谱系。由 AlphaFold 和聊天机器人启发的蛋白质语言模型生成的预测蛋白质结构揭示了病毒家族中的一些令人惊讶的联系,其中包括感染人类的​​病原体以及新出现的威胁。他说,科学家们制定了安全指南,在序列层面,事情差异很大,我们无法判断它们是否相关。对于丙肝及其亲属,我们不知道它的进入系统从何而来。瑞士洛桑大学计算生物学家大卫·莫伊表示,黄病毒研究只是冰山一角,其他病毒甚至一些细胞生物的进化史很可能会被人工智能改写。