经过 ,Intelligencer 的科技专栏作家一个  此前,他是《纽约时报》的记者和评论家,也是《锥子报》的联合编辑。

照片插图:Intelligencer;照片:盖蒂图片社

建造一个需要花费很多钱人工智能这就是为什么最具竞争力的公司要么是拥有大量现金可供燃烧的现有科技巨头,要么是主要从拥有大量现金可供燃烧的现有科技巨头筹集了数十亿美元资金的初创企业。像这样的产品聊天GPT由于两个主要原因,其建造成本异常昂贵。一个是构建模型,一个是大语言模型,使用大量处理器集群和大量电力从大量数据中提取模式和关系的过程。这就是所谓的训练。另一种是主动提供服务,让用户与经过训练的模型进行交互,这也依赖于对大量强大计算硬件的访问或拥有。这就是所谓的推理。 

ChatGPT 于 2022 年发布后,资金迅速涌入该行业 - 并且开放人工智能基于这样的理论:训练类似模型的更好版本会变得更加昂贵。这是事实:尖端模型的训练成本持续攀升(GPT-4 估计使用了价值 7800 万美元的计算来进行训练,而谷歌– Gemini Ultra 的计算成本为 1.91 亿美元, –根据斯坦福大学 2024 年人工智能指数报告)。同时,培训也变得更加高效。由于训练集的庞大规模,除了最大的公司之外,构建“前沿”模型可能仍然是遥不可及的,但训练一个相当实用的大型语言模型——或者具有类似功能的模型一年前的前沿型号已经变得相对便宜。然而,在同一时期,推理已成为很多更实惠,这意味着人工智能产品建成后的部署变得更加便宜。结果是,那些试图为其人工智能产品吸引用户的公司能够,或者至少是受到诱惑,免费赠送这些产品,要么以开放访问 ChatGPT 或 Gemini 等聊天机器人的形式,要么只是内置到人们已经使用的软件中。由于基本的聊天机器人、摘要、文本生成和图像编辑工具突然广泛免费提供,对人工智能工具的使用进行收费的计划有些复杂。例如,Apple Intelligence 能够在用户的 iPhone 和 Mac 上而不是在云端处理大量推理。

这些行业预期——高昂且不断上升的培训成本、不断下降的推理成本以及下行的价格压力——确定了过去两年人工智能融资和发展的方向。然而到了 2024 年,人工智能的发展发生了重大转变。首先,大型实验室开始传出消息称,直接的 LLM 扩展并没有产生他们所希望的结果,导致业内一些人担心进展会受到阻碍。接近一堵意想不到的灾难性的墙。人工智能公司需要一些新的东西。不过,很快,OpenAI 和其他人就从他们已经研究了一段时间的新方法中得到了结果:所谓的“推理”模型,从 OpenAI o1 开始,用公司的话来说“在回答之前先思考”,“在响应用户之前产生一条长长的内部思维链”,换句话说,做一些与在处理过程中运行大量内部查询类似的事情。回答一。本月,OpenAI 报道称,在测试中,其未向公众开放的新 o3 模型在行业基准测试中取得了领先;人工智能先驱 François Chollet 创建了基准之一,描述的该模型是“让人工智能适应新任务的重大突破。”

如果这对 OpenAI 和整个行业来说听起来像是个好消息,那么这是一个绕过令人担忧的障碍的聪明方法,使他们能够继续构建更强大的模型,因为它确实如此!但它也带来了一些新的挑战。培训成本仍然很高,而且还在不断增长,但这些推理模型在推理阶段的成本也高得多,这意味着它们不仅创建成本高,部署成本也高。当 OpenAI 在 12 月初推出每月 200 美元的 ChatGPT Pro 计划时,就有迹象表明这可能意味着什么。上图包含更多内容: 实现高基准分数的成本已达到数千美元。在短期内,这将对如何以及由谁使用前沿模型产生影响。一个收取高额费用并需要几分钟才能响应的聊天机器人的客户群将相当有限,但如果它能够完成真正昂贵的工作,那么它可能是值得的——这与高端市场有很大的不同。-大多数用户习惯于与聊天机器人进行大量、低价值的交互,以对话式聊天或实时编程帮助的形式进行。人工智能研究人员预计此类技术将变得更加高效,让更多人以更低的成本获得当今的前沿功能。他们对这种新的扩展形式持乐观态度,尽管与纯法学硕士的情况一样,“测试时间扩展”的限制可能在人工智能公司开始触及这些限制之前并不明显。

换句话说,对于人工智能研究来说,这仍然是一个令人兴奋的时期,但对于从事人工智能业务来说,这仍然是一个极其昂贵的时期:需求、优先事项和战略可能已经被洗牌了,但底线是人工智能在可预见的未来,公司将花费并损失大量资金(OpenAI 最近告诉投资者,到 2026 年,其损失可能会激增至 140 亿美元)。这对 OpenAI 来说是一个特殊的问题,它与微软从公司筹集了数十亿美元后。首席执行官萨姆·奥尔特曼 (Sam Altman)宣布计划完成 OpenAI 向营利性实体的转变(该公司最初是一家非营利组织),并且比以往任何时候都更有能力从其他投资者那里筹集资金,即使实际利润仍停留在理论上。但微软作为一家规模大得多的公司,仍然保留使用 OpenAI 技术的权利,并充当其主要基础设施提供商。从一个术语来说,它还有权公司收入的 20%。随着 OpenAI 的发展,以及其独立收入的攀升(该公司今年应达到约 40 亿美元,尽管运营出现重大亏损),这对于该公司及其其他投资者来说变得越来越难以容忍。

OpenAI 的协议确实提供了一条出路:如果微软实现通用人工智能,或通用人工智能。这始终是这种安排的一个有点奇怪的特征,至少从外界看来是这样:AGI 的定义受到了激烈的争议,而在这种安排中,OpenAI 可以简单地宣称自己的产品如此优秀和强大,以致于它不得不退出与微软的全面协议,这似乎是一个有能力的科技巨头不会达成的交易。事实证明,根据一个引人入胜的报告在《信息》中,它没有:

微软首席财务官艾米·胡德 (Amy Hood) 告诉公司股东,微软可以使用 OpenAI 在两家公司最新协议期限内开发的任何技术。一位了解条款的人士表示,该期限目前持续到 2030 年。

此外,去年微软和 OpenAI 之间尚未披露的协议称,只有当 OpenAI 开发出具有“能力”的系统来产生最大总利润时,AGI 才能实现。根据 OpenAI 分发给投资者的文件,其最早的投资者(包括微软)有资格。文件显示,这些利润总计约 1000 亿美元。

这一细节充分解释了 OpenAI 的现状——为什么它与微软的不和不断蔓延到公众;为什么它如此积极地追求新的公司结构;以及为什么它从其他投资者那里筹集了这么多资金。它还提供了一些线索,说明为什么这么多核心员工和高管离开公司。作为先于其他人在 OpenAI 上承担数十亿美元风险的交换条件,微软有权在可预见的未来将 OpenAI 视为子公司。

也许同样有趣的是,人工智能公司谈论 AGI 等概念的方式与他们将其写入的方式之间的不匹配。合法的和/或具有法律约束力的文件。在会议、官方材料和采访中,Altman 和微软首席执行官萨提亚·纳德拉 (Satya Nadella) 等人对机器智能发表了看法,推测在机器中创建和遇到“通用”智能或类人智能会是什么样子,并提出:深刻且不可预测的经济和社会变化将会随之而来。关起门来,房间里有律师,他们就不那么哲学化了,通用人工智能的前景用更简单、也许更诚实的术语来表达:这就是我们目前称为“人工智能”的软件的时候开始为其创造者赚很多很多钱。

人工智能的未来不应只看表面价值