英语轻松读发新版了,欢迎下载、更新

OpenAI 创建了长寿科学的人工智能模型

2025-01-17 15:05:52 英文原文

作者:By Antonio Regaladoarchive page

该公司表示,它已经开发出一种语言模型,可以想象出能够将普通细胞转化为干细胞的蛋白质,并且它在这项任务上轻松击败了人类。

这项工作代表了 OpenAI 第一个专注于生物数据的模型,也是其首次公开宣称其模型可以带来意想不到的科学结果。因此,这是确定人工智能是否能够做出真正发现的一步,一些人认为这是对“通用人工智能”之路的一次重大考验。

上周,OpenAI 首席执行官 Sam Altman 表示,他“相信”他的公司知道如何构建通用人工智能,并补充说“超级智能工具可以极大地加速科学发现和创新,远远超出我们自己的能力”. – 

该蛋白质工程项目始于一年前,当时位于旧金山的长寿研究公司 Retro Biosciences 与 OpenAI 接洽合作。

这种联系并非偶然发生。OpenAI 首席执行官萨姆·奥尔特曼 (Sam Altman)个人资助Retro 1.8亿美元, 作为麻省理工科技评论首次报道于 2023 年。

Retro的目标是将人类正常寿命延长10年。为此,它研究了所谓的山中因素。这些是一组蛋白质,当添加到人类皮肤细胞中时,会导致其转变为看起来年轻的干细胞,这种类型可以产生体内任何其他组织。 

Retro 和资金雄厚的公司的研究人员喜欢这种现象阿尔托斯实验室,将其视为恢复动物活力、构建人体器官或提供替代细胞供应的可能起点。

但这种细胞“重编程”效率并不高。这需要几周的时间,在实验室培养皿中处理的细胞中只有不到 1% 能够完成再生之旅。

OpenAI 的新模型称为 GPT-4b micro,经过训练后可提出重新设计蛋白质因子以增强其功能的方法。据 OpenAI 称,研究人员利用该模型的建议将其中两个山中因子的效果提高了 50 倍以上——至少根据一些初步措施来看是这样。 

“总的来说,这些蛋白质似乎比科学家们自己生产的蛋白质更好,”OpenAI 研究员约翰·霍尔曼 (John Hallman) 说道。

Hallman 和 OpenAI 的 Aaron Jaech 以及来自 Retro 的 Rico Meinl 是该模型的首席开发人员。

在结果公布之前,外部科学家无法判断结果是否真实,公司表示他们正在计划公布结果。该模型也无法得到更广泛的使用——它仍然是一个定制的演示,而不是正式的产品发布。

“这个项目旨在表明我们认真地为科学做出贡献,”Jaech 说。“但是这些功能是否会作为一个单独的模型出现,或者是否会被纳入我们的主线推理模型中,这仍有待确定。”

该模型的工作方式与谷歌的 AlphaFold 不同,后者预测蛋白质的形状。OpenAI 表示,由于山中因子是异常松软和非结构化的蛋白质,因此他们需要一种不同的方法,而其大型语言模型适合这种方法。

该模型接受了来自许多物种的蛋白质序列示例以及哪些蛋白质倾向于彼此相互作用的信息的训练。虽然数据量很大,但这只是 OpenAI 旗舰聊天机器人训练数据的一小部分,这使得 GPT-4b 成为一个例子小语言模型– 适用于重点数据集。

当Retro科学家获得该模型后,他们试图引导它提出可能的山中蛋白质重新设计建议。所使用的提示策略类似于“few-shot”方法,其中用户通过提供一系列带有答案的示例来查询聊天机器人,然后提供一个供机器人响应的示例。

尽管基因工程师有办法在实验室中指导分子的进化,但他们通常只能测试这么多的可能性。即使是典型长度的蛋白质也可以以近乎无限的方式改变(因为它们是由数百种氨基酸组成,每种氨基酸有 20 种可能的变体)。

然而,OpenAI 的模型经常给出蛋白质中三分之一氨基酸发生变化的建议。

an image of Fibroblasts on Day 1; an image of Cells reprogrammed with SOX@, KLF4, OCT4, and MYC on Day 10; and an image of cells reprogrammed with RetroSOX, RetroKLF, OCT4, and MYC on Day 10

开放人工智能

“我们立即将该模型投入实验室,并得到了真实的结果,”Retro 的首席执行官 Joe Betts-Lacroix 说道。他说,该模型的想法非常好,在很大一部分情况下比原始山中因子有所改进。

哈佛大学衰老研究员瓦迪姆·格拉迪舍夫(Vadim Gladyshev)为Retro提供咨询,他表示需要更好的方法来制造干细胞。– 对于我们来说,这将非常有用。“[皮肤细胞]很容易重新编程,但其他细胞则不然,”他说。——而在一个新物种中做到这一点——它通常是极其不同的,而且你什么也得不到。—— 

GPT-4b 究竟如何得出猜测仍不清楚 –就像人工智能模型经常出现的情况一样。“这就像 AlphaGo 击败了最优秀的围棋人类,但花了很长时间才找出原因,”贝茨-拉克鲁瓦说。“我们仍在弄清楚它的作用,我们认为我们的应用方式只是触及了表面。”

OpenAI 表示,此次合作中没有资金易手。但由于这项工作可能会让 Retro 受益(其最大的投资者是 Altman),这一声明可能会增加围绕 OpenAI 首席执行官的副业项目的疑问。

去年,华尔街日报Altman 对私营科技初创公司的广泛投资构成了一个“不透明的投资帝国”,它“造成了越来越多的潜在冲突”,因为其中一些公司也与 OpenAI 开展业务。

就 Retro 而言,仅仅与 Altman、OpenAI 以及 AGI 竞赛相关联就可以提升其形象并增强其雇用员工和筹集资金的能力。Betts-Lacroix 没有回答有关该早期公司目前是否处于融资模式的问题。 

OpenAI 表示,Altman 并未直接参与这项工作,也从未根据 Altman 的其他投资做出决策。 

关于《OpenAI 创建了长寿科学的人工智能模型》的评论


暂无评论

发表评论

摘要

OpenAI 开发了一种语言模型 GPT-4b micro,它比人类更有效地生成蛋白质,能够将普通细胞转化为干细胞。这标志着 OpenAI 的第一个以生物数据为中心的模型,也是其首次公开声称能够提供意想不到的科学结果。该项目始于 Retro Biosciences 与 OpenAI 合作,旨在通过利用山中因子将人类寿命延长 10 年。研究人员利用 GPT-4b micro 的建议,将两种山中因子的功效比原始蛋白质提高了 50 倍以上。虽然该模型的功能尚未得到验证和发布,但它代表了人工智能驱动的科学发现和潜在的通用人工智能进步的重要一步。