AlphaFold 的重大升级促进了药物发现
作者:Callaway, Ewen
AlphaFold3 终于打开了。谷歌 DeepMind 发布六个月后有争议地保留代码从一个描述蛋白质结构预测模型的论文,科学家们现在可以下载软件代码这家总部位于伦敦的公司于 11 月 11 日宣布,将人工智能 (AI) 工具用于非商业应用。
DeepMind AlphaFold 团队的领导者 John Jumper 和首席执行官 Demis Hassabis 上个月表示,“我们非常高兴看到人们用它来做什么”,分享2024年诺贝尔化学奖表彰他们在人工智能工具方面的工作。
AlphaFold 的重大升级促进了药物发现
AlphaFold3 与它的前辈不同,能够与其他分子一起模拟蛋白质。但不是像以前那样发布其底层代码阿尔法折叠2– DeepMind 通过网络服务器提供访问权限,限制了科学家可以做出的预测的数量和类型。
至关重要的是,AlphaFold3 服务器阻止科学家预测蛋白质在潜在药物存在下的行为。但现在,DeepMind 决定发布代码意味着学术科学家可以通过自己运行模型来预测此类相互作用。
该公司最初表示,仅通过网络服务器提供 AlphaFold3 在支持研究访问和保护商业野心之间取得了适当的平衡。Isomorphic Labs 是一家位于伦敦的 DeepMind 衍生公司,它正在将 AlphaFold3 应用到药物发现中。
但 AlphaFold3 的发表却没有其代码或模型权重——通过蛋白质结构和其他数据训练软件获得的参数——招致了科学家的批评,他说此举破坏了可重复性。DeepMind 迅速改变态度,表示将在半年内推出该工具的开源版本。
现在任何人都可以下载 AlphaFold3 软件代码并用于非商业用途。但目前,只有具有学术背景的科学家才能根据要求获取训练重量。
DeepMind 面临竞争:过去几个月,几家公司推出基于AlphaFold3的开源蛋白质结构预测工具,依赖于原始论文中描述的规范(称为伪代码)。
两家中国公司——科技巨头百度和 TikTok 开发商字节跳动——已经推出了自己的受 AlphaFold3 启发的模型,加利福尼亚州旧金山的一家名为 Chai Discovery 的初创公司也是如此。
AlphaFold3 – 为什么《Nature》杂志在没有代码的情况下发布了它?
纽约市哥伦比亚大学的计算生物学家 Mohammed AlQuraishi 表示,这些模型的一个关键限制是,与 AlphaFold3 一样,没有一个模型获得药物发现等商业应用的许可。然而,该公司联合创始人 Jack Dent 表示,Chai Discovery 的模型 Chai-1 可以通过网络服务器用于此类工作。
另一家公司,总部位于旧金山的 Ligo Biosciences,发布了 AlphaFold3 的无限制版本。但它还不具备全套功能,包括对药物和蛋白质以外的分子进行建模的能力。
其他团队正在开发没有此类限制的 AlphaFold3 版本:AlQuraishi 希望在今年年底前推出名为 OpenFold3 的完全开源模型。这将使制药公司能够使用专有数据(例如与不同药物结合的蛋白质结构)重新训练自己的模型版本,从而有可能提高性能。
去年,各公司以不同的开放方式发布了大量新的生物人工智能模型。威斯康星大学麦迪逊分校的计算生物学家安东尼·吉特(Anthony Gitter)对营利性公司加入他的领域没有任何意见——只要它们在期刊和预印本服务器上分享自己的工作时遵循与其他科学家相同的规则。
如果 DeepMind 在科学出版物中提出有关 AlphaFold3 的声明,“我和其他人希望他们也分享有关如何做出预测的信息,并以我们可以检查的方式提供人工智能模型和代码,”Gitter 补充道。“我的团队不会构建和使用我们无法检查的工具。”
并非所有“开源”人工智能模型实际上都是开放的:这是一个排名
DeepMind 科学人工智能主管 Pushmeet Kohli 表示,多个 AlphaFold3 复制品已经出现,这表明即使没有开源代码,该模型也是可复制的。他补充说,未来他希望在学术和企业研究人员日益增多的领域看到更多关于出版规范的讨论。
AlphaFold2 的开源性质引发了其他科学家的大量创新。例如,最近的蛋白质设计竞赛的获胜者使用人工智能工具来设计能够结合癌症靶点的新蛋白质。Jumper 最近最喜欢的 AlphaFold2 黑客攻击来自一个使用该工具的团队确定帮助精子附着到卵细胞的关键蛋白质。
分享 AlphaFold3 后,Jumper 迫不及待地等待着这样的惊喜出现,即使它们并不总能结出硕果。“人们会以奇怪的方式使用它,”他预测。“有时会失败,有时会成功。”