OC

Knowledge OS
鹦鹉螺口语
OpenAI 推出新的 macOS 应用程序用于代理编码 |TechCrunch
2026-02-02 18:19:31 · 英文原文

OpenAI 推出新的 macOS 应用程序用于代理编码 |TechCrunch

作者:Russell Brandom

人工智能已经对软件的编写方式产生了巨大的影响,许多繁重的编程工作现在由大量代理和子代理来执行。但随着开发人员尝试新的界面和外形尺寸以实现人类与人工智能的协作,即使是最先进的人工智能实验室也很难跟上。 

当前的趋势是代理软件开发——人工智能代理可以独立完成编码任务的系统——以 Claude Code 和 Cowork 应用程序为代表。与此同时,OpenAI 一直在逐步构建其 Codex 工具,该工具以一个命令行工具去年四月和扩展到网络界面一个月后。

现在,OpenAI 正在朝着追赶的方向迈出重要一步。周一,该公司推出了新产品macOS 应用程序对于 Codex,整合了过去一年流行的许多代理实践。新应用程序旨在与多个代理并行工作,集成代理技巧以及其他最先进的工作流程。此次发布也是在不到两个月后GPT-5.2-Codex 的推出,OpenAI 最强大的编码模型,该公司希望该模型足以吸引 Claude Code 用户。

“如果你真的想在复杂的事情上做复杂的工作,5.2 是迄今为止最强大的模型,”首席执行官 Sam Altman 在新闻发布会上告诉记者。“但是,它更难使用,因此我们认为采用这种级别的模型功能并将其放入更灵活的界面中会非常重要。”

虽然 Altman 对 GPT-5.2 的信心是可以理解的,但编码基准却讲述了一个更复杂的故事。GPT-5.2 确实成立TerminalBench 上名列前茅(一项衡量人工智能处理命令行编程任务的测试),至少截至发稿时是这样。但 Gemini 3 和 Claude Opus 的代理得分大致相当——较低,但在基准的误差范围内。结果来自SWE-长凳另一个测试 AI 修复现实世界软件错误能力的编码基准测试也类似,但没有显示出 GPT-5.2 的明显优势。然而,代理用例很难有效地进行基准测试,并且最先进的模型在用户体验方面可能存在很大差异。

Codex 应用程序还配备了一系列新功能,OpenAI 表示这些功能将帮助其实现同等水平,或者在某些情况下超越各种 Claude 应用程序。Codex 应用程序将允许自动化操作,可以设置为按自动计划在后台运行,并将结果放入队列中,以便在用户返回时进行审查。用户还可以根据自己的工作风格为座席选择不同的性格——从务实到善解人意。

但对于该公司来说,最大的卖点是人工智能带来的绝对发展速度。“你可以用一张干净的纸,全新的,在几个小时内制作出一个非常复杂的软件,”奥特曼说。“只要我输入新想法的速度足够快,这就是构建的极限。”

Techcrunch 活动

马萨诸塞州波士顿 | 2026 年 6 月 23 日

Russell Brandom 自 2012 年以来一直关注科技行业,重点关注平台政策和新兴技术。他此前曾在 The Verge 和 Rest of World 工作,并为《Wired》、《Awl》和《麻省理工学院技术评论》撰稿。您可以通过 russell.brandom@techcrunch.com 或拨打 Signal 电话 412-401-5489 联系他。

关于《OpenAI 推出新的 macOS 应用程序用于代理编码 |TechCrunch》的评论

暂无评论

发表评论

摘要

OpenAI 为其 Codex 工具推出了一款新的 macOS 应用程序,集成了先进的代理实践,以与 Claude Code 和 Cowork 等应用程序竞争。该应用程序具有并行代理功能和可定制的代理个性。首席执行官 Sam Altman 强调了 GPT-5.2-Codex 的强大功能,但也承认可用性方面的挑战。尽管 GPT-5.2 在 TerminalBench 上保持最高分,但在现实世界的编码任务中仍面临着来自其他模型的竞争。OpenAI 旨在利用应用程序的灵活性和速度来吸引寻求高效软件开发解决方案的用户。