本文已根据 Science X 的编辑流程和政策进行审阅。编辑在确保内容可信度的同时强调了以下属性:
事实核查
同行评审的出版物
可信来源
校对
德克萨斯大学奥斯汀分校的研究人员开发的一种新的人工智能模型为更有效、更少的方法铺平了道路医学中的毒性治疗和新的预防策略。人工智能模型通过利用自然进化过程的基本逻辑,为基于蛋白质的疗法和疫苗的设计提供信息。
名为 EvoRank 的人工智能进步提供了一个新的、切实的例子,说明人工智能如何帮助带来颠覆性的影响。更广泛地改变生物医学研究和生物技术。科学家们在国际学习表示会议 (ICLR 2024) 上描述了这项工作,并在《自然通讯》上发表了一篇相关论文,内容涉及利用更广泛的人工智能框架来识别蛋白质中的有用突变。
设计更好蛋白质的主要障碍基于生物技术的生物技术拥有足够的有关蛋白质的实验数据,可以充分训练人工智能模型,以了解特定蛋白质的工作原理,从而了解如何针对特定目的对其进行工程设计。
EvoRank 的关键见解是利用蛋白质的自然变化数以百万计的蛋白质通过长时间的进化而产生,并提取出应对生物技术挑战的可行解决方案所需的潜在动力。
“30亿年来,大自然一直在进化蛋白质,突变或替换氨基酸并保留那些原有的氨基酸。计算机科学研究科学家、Deep Proteins 小组(UT 的一个由计算机科学和化学专家组成的跨学科小组)的联合负责人 Daniel Diaz 说道。
“EvoRank 学习如何进行排名我们在我们周围观察到的进化,本质上提炼出决定蛋白质进化的原理,并使用这些原理,以便它们可以指导基于蛋白质的新应用的开发,包括药物开发和疫苗以及广泛的生物制造”
UT 是美国领先的人工智能研究项目之一的所在地,并设有由计算机科学教授 Adam Klivans 领导的机器学习基础研究所 (IFML),他也是该研究所的共同领导者Deep Proteins。
Deep Proteins 和疫苗制造商、德克萨斯大学分子生物科学教授 Jason McLellan 合作的一个项目,与拉霍亚免疫学研究所合作,将在蛋白质工程研究中应用人工智能来开发疫苗对抗疱疹病毒。
“工程蛋白质具有天然蛋白质所不具备的功能是生命科学中反复出现的巨大挑战,”Klivans 说。“这也恰好是生成式人工智能模型所针对的任务类型,因为它们可以合成已知生物化学的大型数据库,然后生成新的设计。”
与 Google DeepMind 的 AlphaFold 不同,后者将人工智能应用于根据每个氨基酸的序列预测蛋白质的形状和结构,深度蛋白质小组的人工智能系统建议如何最好地改变蛋白质的特定功能,例如提高蛋白质开发成新生物技术的容易程度。
麦克莱伦的实验室已经在基于人工智能生成的设计合成不同版本的病毒蛋白,然后测试它们的稳定性和其他特性。
“这些模型已经提出了我们永远不会的替代品已经想到了,”麦克莱伦说。“它们确实有效,但并不是我们预料到的,所以它们实际上是在寻找一些新的稳定空间。”
蛋白质疗法通常副作用更少,并且比传统疗法更安全、更有效。目前估计价值 4000 亿美元的全球工业预计将在未来十年内增长 50% 以上。尽管如此,开发基于蛋白质的药物是缓慢、昂贵且有风险的。
从药物设计到完成临床试验的十多年历程估计需要 10 亿美元或更多美元;即便如此,一家公司的新药获得美国食品和药物管理局批准的几率也只有十分之一左右。
此外,为了在治疗中有用,蛋白质通常需要经过基因工程改造,例如,为了确保它们的稳定性或让它们达到药物开发所需的水平,而实验室中繁琐的试错传统上决定了此类基因工程决策。
如果 EvoRankas 以及相关的 UT-创建了其构建的框架,Stability Oracleare 已进行商业化改造,行业将有机会削减药物开发的时间和费用,并制定路线图以更快地实现更好的设计。
使用自然发生的现有数据库蛋白质序列,创建 EvoRank 的研究人员基本上将出现在从海星到橡树到人类的不同生物体中的同一蛋白质的不同版本排列起来,并对它们进行比较。
在蛋白质的任何给定位置,都可能有一个进化发现有用的几种不同氨基酸,自然选择,例如,36%的时间是酪氨酸,29%的时间是组氨酸,14%的时间是赖氨酸,甚至更重要的是从不亮氨酸。p>
利用现有数据的金矿揭示了蛋白质进化的基本逻辑。研究人员可以剔除进化表明会导致破坏蛋白质功能的选项。
团队利用所有这些来训练新的机器学习算法。基于持续的反馈,该模型了解过去在进化蛋白质时大自然选择了哪些氨基酸,并且它的理解基于自然界中合理的和不合理的。
迪亚兹下一步计划开发一种““多列”版本的 EvoRank,可以评估多个突变如何同时影响蛋白质的结构和稳定性。他还希望构建新工具来预测蛋白质结构与其功能的关系。
更多信息:Daniel J. Diaz 等人,Stability Oracle:用于识别稳定突变的基于结构的图形转换器框架,自然通讯(2024)。DOI:10.1038/s41467-024-49780-2
期刊信息:Nature Communications
由德克萨斯大学奥斯汀分校提供