超越折叠:机器学习设计本质上无序的蛋白质

2025-10-08 19:17:42 英文原文

作者:Savannah Wiegel

几十年来,科学家一直依靠结构来了解蛋白质的功能。AlphaFold 等工具彻底改变了研究人员预测和设计折叠蛋白质的方式,允许对新的疗法和酶进行建模计算机模拟。但是当蛋白质根本不折叠时会发生什么?近 30% 的人类蛋白质组由变形的本质无序蛋白质 (IDP) 组成,这些蛋白质拒绝形成稳定的结构,并且仍然超出基于人工智能的预测工具的范围。

现在,哈佛大学约翰·A·保尔森工程与应用科学学院 (SEAS) 和西北大学的研究人员开发出了一种新方法,可以为这种生物混乱带来秩序。他们基于物理的机器学习框架可以设计具有自定义属性的 IDP,为更深入地了解其生物学作用和潜在的治疗用途铺平道路。该研究的标题为本质无序蛋白质的序列-整体-功能关系的广义设计, –发表于自然计算科学。

与依赖 3D 结构模板的传统蛋白质设计方法不同,这种新方法包含无序性。“我们要么需要提出更好的人工智能模型,要么,我们需要想出一种方法来实际应用这些物理模型,这样你不仅可以获得良好的预测,而且还可以免费获得物理知识,”西北大学化学与生物工程高级作者兼助理教授 Krishna Shrinivas 博士说。

该方法的核心是自动微分,这是一种借用深度学习的数学技术,允许计算机自动计算导数。应用于此处,该算法对分子动力学模拟执行基于梯度的优化,以识别表现出所需整体行为的氨基酸序列。

研究人员将该过程与强大的氨基酸序列搜索引擎进行了比较。通过迭代模拟和调整序列,该框架无需依赖大量实验数据集,就能了解单个氨基酸的变化如何影响蛋白质的整体行为。“我们不想通过获取大量数据并训练机器学习模型来设计蛋白质,”SEAS 研究生兼共同主要作者 Ryan Krueger 说道。“我们希望利用现有的、足够准确的模拟,以便能够在这些模拟的水平上设计蛋白质。”

利用这个框架,该团队成功设计了无序蛋白质,它们充当分子环、连接体和环境传感器,能够响应盐、温度或磷酸化变化。这些行为反映了 IDP 在细胞中的功能——充当调节信号传导和组装的灵活连接器或开关。

通过将机器学习与物理模拟相融合,该方法回避了纯粹数据驱动模型的局限性,为设计打破结构惯例的蛋白质提供了一个通用的框架。正如 Shrinivas 及其同事指出的那样,未来的工作可能会将这种方法扩展到其他复杂的生物分子,包括 RNA 和 DNA,其中灵活性驱动着生物功能。

关于《超越折叠:机器学习设计本质上无序的蛋白质》的评论


暂无评论

发表评论

摘要

哈佛大学和西北大学的科学家开发了一种基于物理的机器学习框架,用于设计具有自定义属性的本质无序蛋白质(IDP),克服了依赖结构模板的传统人工智能预测工具的局限性。这种新方法使用分子动力学模拟中的自动微分来识别表现出所需整体行为的氨基酸序列,而不需要大量的实验数据集。该方法成功地设计了具有各种功能的IDP,包括分子环和环境传感器,为更深入地了解它们的作用和潜在的治疗应用铺平了道路。