OpenAI 追赶 Claude Code 的竞赛内部

山姆·奥尔特曼坐他的双腿盘在办公椅上，深深地凝视着天花板。公平地说，新开放人工智能位于旧金山 Mission Bay 的总部——一座由玻璃和金色木材建成的殿堂——似乎在邀请人们进行这样的沉思。接待处后面的一个亭子里放着一些小册子，这些小册子描述了“人工智能时代”，就好像它们是通往启蒙之路的阶梯。楼梯上的海报标志着人工智能里程碑式的胜利，就像数千人在直播中观看机器在一场比赛中击败顶级电子竞技队一样。刀塔2。在走廊里，研究人员带着神圣的商品走过。一件衬衫上写着“好的研究需要时间”。理想情况下，时间不要太多。

奥特曼我在一个巨大的会议室里。我向他提出的问题是关于人工智能编码革命，以及为什么 OpenAI 似乎没有引领这场革命。数以百万计的软件工程师已经开始将他们的编程任务委托给人工智能，迫使硅谷的许多人第一次考虑到他们工作的自动化。编码代理已成为企业愿意为人工智能支付大量费用的少数领域之一。这一刻可能，而且可以说应该，成为 OpenAI 楼梯上的下一张胜利海报。但现在大字印刷的名字属于别人。

Anthropic 是由 OpenAI 叛逃者创办的规模较小的竞争对手，它的编程代理取得了巨大的成功，克劳德·科德。该公司 2 月份表示，该产品占其业务的近五分之一，年化收入超过 25 亿美元。据一位直接了解情况的人士透露，截至 1 月底，OpenAI 的版本 Codex 的年收入刚刚超过 10 亿美元。什么给？

“首先进入市场的价值很大，”奥特曼最后说道。“我们在 ChatGPT 中就做到了这一点。”但他表示，OpenAI 转向编码的时机已经成熟。他认为该公司的人工智能模型现在足以为非常强大的编码代理提供支持。（当然，公司花费了数十亿美元来培训他们做到这一点。）“这将是一项巨大的业务——不仅仅是它的经济价值，还有编码可以解锁的通用工作，”奥特曼说。“我不会轻易提出这个问题，但我认为这是罕见的数万亿美元市场之一。”更重要的是，他说，Codex 是构建人工智能的“最有可能的途径”。根据 OpenAI 的定义，这是一个在最具经济价值的工作中能够超越人类的人工智能系统。

尽管奥特曼以椒盐卷饼的平静姿势做出自信的声明，但过去几年公司内部的现实却更加混乱。为了了解内幕，我采访了 30 多人，其中包括现任 OpenAI 领导者和经公司批准参与的员工，以及其他不愿透露姓名的人，讨论私营公司的内部运作情况。他们的描述描绘了 OpenAI 处于一种罕见的境地：竞相追赶。

时间回到2021年，Altman 和其他 OpenAI 领导人邀请《连线》杂志记者史蒂文·利维 (Steven Levy) 到他们位于旧金山 Mission 区的原来办公室来看看新的东西。它是 OpenAI GPT-3 模型的一个分支，经过 GitHub 上数十亿行开源代码的训练。在演示中，高管们展示了该工具如何法典，可以接受英文命令并输出简单的代码片段。

OpenAI 总裁兼联合创始人格雷格·布罗克曼 (Greg Brockman) 当时表示：“它实际上可以在计算机世界中代表你行事。”“你实际上拥有一个可以执行命令的系统。”即便如此，OpenAI 研究人员认为 Codex 显然将成为开发“超级助手”的关键。

此时，Altman 和 Brockman 的生活围绕着与 OpenAI 最大投资者微软的会面。这家软件巨头正在利用 Codex 为其首款商业人工智能产品之一提供支持，这是一种名为 GitHub Copilot 的代码完成工具，可以在程序员的常规环境中运行。一位 OpenAI 的早期员工告诉我，现阶段 Codex 只能做自动完成功能，但微软高管将其视为人工智能未来的标志。当 GitHub Copilot 于 2022 年 6 月公开推出时，几个月内就吸引了数十万用户。

OpenAI 的第一个 Codex 团队转向了其他项目。该员工表示，该公司计划将编码能力融入到未来的模型中，并且认为没有必要进行单独的努力。一些工程师被重新分配到公司的图像生成器 DALL-E 2。其他人转而训练 GPT-4，这被视为让 OpenAI 更接近 AGI 的最佳方式。

随后 ChatGPT 于 2022 年 11 月推出，两个月内获得了超过 1 亿用户。所有其他项目都陷入停滞。此后多年，OpenAI 都没有专门的团队来开发 AI 编码产品。Codex 团队的一位前成员表示，这似乎不属于公司新发现的消费者关注点。他们还说，“感觉这个行业已经被 GitHub Copilot 覆盖了”。OpenAI 将提供新模型来支持该工具，但这是微软的地盘。

OpenAI 在 2023 年和 2024 年的大部分时间里都在投资其多模式人工智能模型和代理，旨在理解文本、图像、视频和音频，并像人类一样控制光标和键盘。这种努力似乎更符合人工智能产业的发展方向。初创公司 Midjourney 因其人工智能图像模型而走红，人们普遍认为法学硕士需要看到和听到世界才能获得真正的情报。

人择走了一条不同的道路。它也涉足聊天机器人和多模式模型，但该公司似乎比 OpenAI 更早认识到编码的前景。在最近的播客中，布罗克曼称赞 Anthropic 从早期阶段就“非常专注于编码”。他指出，Anthropic 不仅针对学术竞赛中的困难编码问题来训练其人工智能模型，还针对来自混乱代码存储库的现实世界问题进行训练。“这是我们被拖延的教训，”布罗克曼说。

2024 年初，Anthropic 在一些混乱的代码存储库上训练 Claude Sonnet 3.5。当该模型于六月推出时，许多用户对其编码能力印象深刻。对于一家名为 Cursor 的初创公司来说尤其如此，该公司由一群二十多岁的年轻人创立，该公司允许开发人员通过简单的英语请求更改来使用人工智能进行编码。据一位熟悉该初创公司的人士透露，当该公司采用 Anthropic 新模式时，Cursor 的使用率开始飙升。几个月内，Anthropic 将开始对其自己的版本进行内部测试：Claude Code。

随着 Cursor 的流行，OpenAI 向这家初创公司寻求收购事宜。熟悉这家初创公司的人士告诉我，在谈判进入后期阶段之前，创始人拒绝了这一提议。他们看到了编码行业的潜力，并希望保持独立。

当时，OpenAI 正在训练其第一个所谓的推理模型 o1，该模型可以在给出答案之前逐步解决问题。OpenAI 在发布时表示，该模型“擅长准确生成和调试复杂代码。”OpenAI Codex 研究负责人 Andrey Mishchenko 表示，AI 模型在编码方面变得更好的一个关键原因是因为它是一项可验证的任务。代码要么运行，要么不运行——当模型出现问题时，它会向模型发出清晰的信号。OpenAI 使用这个反馈循环来训练 o1 解决日益困难的编码问题。“如果没有能力在代码库中爬行、实施更改并测试自己的工作（这些都在推理的范围内），编码代理将不会像今天这样有能力，”他说。

到 2024 年 12 月，OpenAI 内部的几个小组开始关注 AI 编码代理。其中一个由 Mishchenko 和 Thibault Sottiaux 领导，Thibault Sottiaux 是前 Google DeepMind 研究员，现在是 OpenAI Codex 的负责人。最初，他们最感兴趣的是编码代理，将其作为加速人工智能研究的一种方式——自动化管理训练运行和监控 GPU 集群的繁重工作。另一项工作由 Alexander Embiricos 领导，他之前从事 OpenAI 的多模式代理工作，现在是 Codex 的产品负责人。Embiricos 创建了一个名为 Jam 的演示，并在整个公司广泛传播。

Jam 可以直接访问其命令行，而不是通过光标和键盘控制计算机。2021 年 Codex 演示展示了人工智能可以输出代码供人类运行，而 Embiricos 的版本可以自行运行代码。他发现自己惊讶地看着一个跟踪贾姆行为的网页，该网页在他的笔记本电脑上一遍又一遍地更新。

“有一段时间，我一直认为多模式交互可能是我们实现使命的方式，就像我们整天与人工智能共享屏幕一样，”Embiricos 说。– 然后事情变得非常清楚：也许让模型以编程方式访问计算机就是我们实现这一目标的方式。 –

这些项目花了几个月的时间才合并为一个统一的工作。当 OpenAI 在 2025 年初完成对 o3 的训练时——这是一个比 o1 更优化的编码模型——它终于具备了构建真正的 AI 编码产品的基础。但 Claude Code 已经做好了公开发布的准备。

克劳德·代码之前首先于 2025 年 2 月作为“有限研究预览”发布，然后于 5 月作为一般版本发布——最先进的是氛围编码。人们花费数亿美元购买工具，让人类程序员指导编码项目，而人工智能则在此过程中填充细节。但 Anthropic 的新产品（如 Jam 演示）直接通过计算机命令行运行，这意味着它可以访问开发人员的所有文件和应用程序。这不再是振动编码；而是振动编码。开发人员可以将他们的工作完全交给人工智能代理。

OpenAI 正在努力推出竞争产品。Sottiaux 告诉我，他于 2025 年 3 月组建了一个“冲刺团队”，其任务是合并 OpenAI 的内部团队，并在短短几周内发布人工智能编码产品。与此同时，Altman 探索了另一项有助于 OpenAI 实现跨越式发展的收购——以 30 亿美元收购人工智能编码初创公司 Windsurf。OpenAI 领导层认为 Windsurf 将提供成熟的 AI 编码产品、知道如何构建该产品的团队以及企业客户的即时基线。

但对 Windsurf 的收购却搁置了几个月。据《华尔街日报》报道，此次搁置是由于 OpenAI 在各方面的超级合作伙伴微软想要获得 Windsurf 的知识产权。自 2021 年以来，这家云巨头一直在使用 OpenAI 的模型为 GitHub Copilot 提供支持，该产品已成为微软财报电话会议的一大亮点。但随着 Cursor、Windsurf 和 Claude Code 提供了新的代理编码体验，GitHub Copilot 开始感觉自己陷入了人工智能的早期时代。OpenAI 推出另一种编码产品也无济于事。

Windsurf 交易是在 OpenAI 和微软关系尤其紧张的时期达成的。两家公司正在重新谈判合作伙伴关系，OpenAI 正试图放松微软对其人工智能产品和计算资源的控制。Windsurf 交易是这一过程的受害者，而 OpenAI 收购这家初创公司的交易到 7 月份就破裂了。那时，谷歌最终聘用了 Windsurf 的创始人；该团队的其余成员被另一家编码初创公司 Cognition 收购。

“我很想完成这件事，”奥特曼说。“你无法控制每笔交易。”虽然 Altman 一直希望收购 Windsurf 能够在一定程度上加速我们的发展，但 Altman 表示 Codex 团队的发展轨迹给他留下了深刻的印象。Sottiaux 和 Embiricos 在谈判期间不断构建和发布更新。Altman 表示，到了 8 月份，OpenAI 就加速了。

格雷格·布罗克曼 (Greg Brockman) 的最爱衡量人工智能性能的方法是使用他发明的一种名为“反向图灵测试”的电脑游戏。他几年前手工编码了它，现在挑战人工智能代理从头开始构建自己的版本。他向他们介绍了基础知识：两个人在不同的计算机上，每个人都在屏幕上看到一对聊天窗口。一个窗口连接到另一个人，一个窗口连接到人工智能。游戏是猜测哪个聊天窗口是AI，同时欺骗你的对手认为你是AI。

布罗克曼说，去年的大部分时间里，公司花了最好的模型时间来开发这样一款游戏，整个过程中需要明确的人工指导和帮助。但到了 12 月，Codex 能够使用新的 GPT-5.2 模型作为引擎，通过一个结构良好的提示创建功能齐全的游戏。

不仅仅是布罗克曼注意到了这种转变。世界各地的开发人员注意到人工智能编码代理突然变得明显更好。这一主要围绕克劳德·科德展开的讨论走出了硅谷，成为主流新闻报道。没有编码经验的普通人开始开发定制软件项目。

使用量的激增并非偶然。Anthropic 和 OpenAI 在此期间投入巨资为其 AI 编码代理获取新客户。一些开发人员告诉《连线》杂志，他们每月 200 美元的 Codex 和 Claude Code 计划能够为他们提供远远超过 1,000 美元的使用量。这些慷慨的费率限制是让开发人员在工作场所使用人工智能编码产品的一种手段，然后 OpenAI 和 Anthropic 可以根据使用情况收费。

据直接了解情况的人士称，早在 2025 年 9 月，Codex 的使用率仅为 Claude Code 的 5%。消息人士称，到 2026 年 1 月，Codex 的用户群猛增至 Claude Code 的近 40%。

George Pickett 是一名开发人员，过去 10 年一直在科技初创公司工作，他最近开始围绕 Codex 组织聚会。“我认为很明显我们将用代理人取代白领工作，”皮克特说。——在社会上，谁知道这意味着什么。这将具有破坏性，但我对正在发生的事情非常乐观。”

Simon Last 是价值 110 亿美元的生产力初创公司 Notion 的联合创始人，他表示，在 GPT-5.2 发布后，他和他的顶级工程师转向了 Codex，很大程度上是因为可靠性。“我发现克劳德·科德只是在骗我，”拉斯特说道。“它说它有效，但实际上无效。”

Codex 团队的研究负责人 Katy Shi 表示，虽然有些人将其默认个性描述为“干面包”，但许多人开始欣赏其不那么阿谀奉承的风格。“许多工程工作都是为了能够接受批评反馈而不将其解读为刻薄的，”石说。

几家主要企业也已签约使用 Codex。“ChatGPT 是人工智能的代名词，这一事实为我们在 B2B 市场提供了巨大的优势，”说道菲吉·西莫，OpenAI 应用程序首席执行官。“公司希望使用员工已经熟悉的技术。”Simo 表示，OpenAI 销售 Codex 的策略主要是将其与 ChatGPT 和其他 OpenAI 产品打包在一起。

思科总裁兼首席产品官 Jeetu Patel 表示，他已告诉员工不要担心使用 Codex 的成本，因为他们需要熟悉该工具。当员工询问“他们是否会因为使用这些工具而失去工作”时，帕特尔说，“我们必须告诉我们的员工：不会，但我保证，如果你不使用这些工具，你就会失去工作，因为你不再具有相关性。”所以你会被淘汰。”

今天，恐慌围绕人工智能编码代理的研究已经远远超出了硅谷。《华尔街日报》称赞克劳德·科德造成了1万亿美元的科技股抛售上个月，投资者担心软件很快就会完全过时。几周后，在 Anthropic 宣布 Claude Code 可用于对运行 COBOL（在 IBM 机器上常见）的遗留系统进行现代化改造后，IBM 的股价遭遇了 25 年来最糟糕的一天。OpenAI 孜孜不倦地努力使其 AI 编码代理成为社会对话的一部分，花费数百万美元制作了有关 Codex（而不是 ChatGPT）的超级碗广告。

在 Mission Bay 寺庙，没有人需要向 Codex 推销。我采访过的许多 OpenAI 工程师都表示，他们很少再敲代码了。他们只是花时间与 Codex 交谈。有时他们会聚在一起并集体进行。

在总部，我参加了 Codex 黑客马拉松——大约 100 名工程师挤在一个大房间里。每个人都有四个小时的时间用 Codex 构建最好的演示。一位 OpenAI 高级领导站在房间的前面，扭开手中的笔记本电脑，对着麦克风说出团队的名字。团队代表紧张地走上讲台，用颤抖的声音简短地介绍了他们的人工智能项目。获奖者获得巴塔哥尼亚背包。

许多项目都是使用 Codex 创建的，旨在帮助工程师更好地使用 Codex。一个小组开发了一个工具，可以将 Slack 消息汇总成每周报告。另一个团队为内部 OpenAI 服务构建了人工智能生成的维基百科风格的指南。以前，许多演示需要几天或几周的时间才能完成，但现在只需一个下午即可完成。

在出门的路上，我遇到了 Instagram 前高管凯文·威尔 (Kevin Weil)，他现在负责 OpenAI for Science，这是该公司为研究人员构建人工智能产品的新部门。他告诉我 Codex 正在为他做一些项目，他会在早上检查这些项目。这已成为 Weil 和其他数百名员工的常规做法。OpenAI 2026 年的目标之一是开发一名自动化实习生来研究（还有什么？）人工智能。

Simo 告诉我，该公司希望 Codex 最终能够支持 ChatGPT 及其所有产品的功能——不是为了编程，而是为了帮助人们完成任务。Altman 表示，他很乐意发布 Codex 的通用版本，但他担心安全问题。他说，一月底，他的一位不懂技术的朋友要求他建立 OpenClaw，一种病毒式人工智能编码代理。Altman 告诉我他拒绝了，因为这“显然还不是一个好主意”，因为 OpenClaw 可以删除重要文件。在 Altman 告诉我这件事几周后，OpenAI 宣布正在招聘 OpenClaw 的创建者。

与我交谈过的许多开发人员告诉我，Codex 和 Claude Code 之间的竞争从未如此激烈。但随着这些工具变得越来越强大，并且被追求效率的企业领导者更广泛地使用，社会需要面对的问题比使用哪种编码代理更重要。

一些监管机构担心 OpenAI 追赶 Claude Code 的竞赛将把安全问题置于次要地位。一家名为 Midas Project 的非营利组织指责 OpenAI 背弃了 GPT-5.3-Codex 的安全承诺，未能正确概述该模型的网络安全风险。OpenAI 的协调负责人 Amelia Glaese 否认为 Codex 牺牲安全的观点，并且 OpenAI 表示 Midas 误解了公司的承诺。

即使对于去年的布罗克曼来说每人捐赠2500万美元一位支持人工智能的超级政治行动委员会和一位支持特朗普的政治行动委员会，以推进 OpenAI 的使命，并明亮地表示“我们正按计划实现 AGI”——新的现实唤起了复杂的感受。在硅谷的工程师中，他一直被认为是一个痴迷的老板，是那种在产品发布前一天晚上深入研究代码库的老板。从很多方面来说，这个不干涉的新时代“非常自由，因为你意识到你的大脑已经被一堆不必要的细节所困扰，”他说。然而，当你成为“这支由数十万代理人组成的团队的首席执行官，他们正在完成你的目标、你的目标、你的愿景”时，他说，“你并不像在杂草中一样清楚如何解决不同的问题。”布罗克曼说，在某些方面，这种新的工作方式会让你“感觉自己在解决问题上失去了脉搏。”

在您的收件箱中
对于来自硅谷人工智能场景中心的调度，注册麦克斯韦·泽夫周刊模型行为时事通讯。

你怎么说？
请在下面的评论中告诉我们您对这篇文章的看法。或者，您可以向编辑提交一封信： 邮箱@wired.com。.

OC

OpenAI 追赶 Claude Code 的竞赛内部

关于《OpenAI 追赶 Claude Code 的竞赛内部》的评论

发表评论

摘要

相关新闻

相关讨论