英语轻松读发新版了,欢迎下载、更新

Vibe编码已死:代理群编码是新的企业护城河

2025-09-12 15:01:11 英文原文

在最近的跨大西洋航班上,马克·鲁多克(Mark Ruddock)Gallos技术,决定让他的AI特工团队上班。在不到48小时的时间里,他在大西洋上驶过大西洋34,000英尺,并为关键客户提供了高风险的产品演示,他的软件平台还没有准备好。

当他的飞行越过冰岛时,他在接受VentureBeat采访时讲述了他的“ Claude Code Swarm”已经建立了50多个React组件,一个用于三个企业集成的模拟API和一个完整的管理界面。通常将人类团队18的开发人员日压缩到六个小时的飞行中。输出不仅仅是原型。这是一个充分记录的,测试和安全的应用程序框架,配有可准备生产的Docker配置和CI/CD管道。

鲁多克昨天在接受采访时告诉我,我保证您将永远不会再以同样的方式建立软件公司。

Ruddock的经历,他首先发布在上周的LinkedIn上,IS不孤立。这是今年夏天发生的AI功能的重大提升的快照。在短短几个月内,AI执行复杂的软件工程的能力以令人眼花diss乱的非线性速度加速了。改进已通过多种方式进行了记录。在技​​术和实践方面的几个重大进步的驱动下,这相当于软件创建方式的根本变化,这已经使去年的范式过时了。

“氛围编码”的时代 - 促使AI的代码AI的对话,探索性实践,由Andrej Karpathy创造``已取代了一个更有纪律的概念:代理群编码。一个 

(可以肯定的是,对于试图即时建立某些东西的绝大多数开发人员来说,Vibe编码可能并没有死,但是我们正在为认真的企业应用程序开发人员谈论,这是我们本文的目标受众。)

夏季Agi对开发人员来说是真实的

现在,即使Karpathy的Vibe编码术语也是遗产。它已经过时了,瓦尔·贝科维奇(Val Bercovici)首席AI官weka,在最近的一次对话中告诉我。这是由这种代理群编码的概念所取代的,在该概念中,协调的多个代理非常实用的MVP和版本的一个应用程序。

群体的想法并不是全新的openai自己的代理人SDK,最初被称为Swarm作为实验框架发布去年。但是这些群体的能力在今年夏天达到了一个拐点。

贝科维奇(Bercovici)是自称为阿吉(Agi)的前怀疑论者,他说,他现在相信阿吉(Agi)即将来临,他在今年夏天目睹了该法规的发展以及他自己的团队的转型。他描述了即使是他最愤世嫉俗的工程师 - 一个被昵称为“黑暗王子”的人。

对于数十年来磨练自己的手艺的开发人员来说,这种东西几乎就像科幻小说。贝科维奇说:``经验丰富的软件开发人员正在看到我们的整个30,40年的整个手工艺品在几个月内发生了根本性的变化。”

解构飞跃:代理如何群体工作

几种截然不同的技术进步的融合正在推动这种突然的飞跃:新一代的基础模型,成熟的代理体系结构以及人类指导他们的技能的快速发展。

根据我与Ruddock和其他处于最前沿的对话,加速度是由这三个核心支柱驱动的。

1。智能基础模型:基础模型的原始智能Openai(GPT-5), 人类(Claude 4系) Xai(Grok 4)今年夏天取得了重大迈进。在测试AI解决实际GitHub问题的能力的行业标准SWE板凳上,今年夏天发布的新模型破坏了先前的记录。例如,Openai的GPT-5现在实现了74.9%的成功率对于这些任务,需要深入的上下文,计划和调试。这与以前的OpenAI高分为58.4%,由其O3模型于7月设定。Claude Opus 4.1在8月达到74.5%,而Claude Opus在5月份的72.4%。

2。复杂的代理体系结构:但是,比任何单一模型更重要的是它们的精心策划方式。“群”是一个结构,将问题分解并分配给多个专业代理。报告在三月“ AI可以完成的任务长度是每7个月加倍。”但是,Amjad Masad首席执行官补充,,,,周三发推文这是通过编排(包括多代理体系结构)在此期间回复了该时期的软件代理在此期间看到的10倍缩放的根本上的10倍缩放(请参阅顶部及以下图表)。对于上下文,REPLIT是Gallos的Mark Ruddock使用的相同的代理解决方案。

 Coding capabilities of base models are accelerating. Source: METR

这种新一代的代理系统掌握了几种关键的结构能力:

  • 重新掌握:现在,代理可以动态编辑自己的任务列表,从而使其在步骤失败或出现更好的路径时适应。此功能是像翘曲这样的代理框架的关键原因SWE板凳得分为75.8%本月,使用自定义编排设置运行。

  • 多代理专业化:代理人群体分配角色,而不是一个AI试图做所有事情的人。“计划者”代理分解了任务,“编码器”代理编写代码,而“评论家”代理会审查工作。这反映了人类软件团队,是框架之类的原则克劳德流由多伦多的Reuven Cohen开发。Bercovici将其描述为一个系统,即“数十个并行的Claude代码实例正在精心策划,以处理规格,文档……完整的CICD DevOps生命周期”。这是代理群背后的引擎,将一个月的团队合作凝结成一个小时。

  • 模型切换:高级系统可以将子任务智能路由到最佳模型,也许可以使用Claude进行高级推理,GPT-5用于原始代码综合,而Grok 4用于快速迭代。

  • 真正的工具集成:这也许是最大的改变游戏规则。代理不再只是在真空中编写代码。现在,它们是在开发人员的实际环境中基础的,使用GREP等基本工具搜索代码库,pytest进行测试,构建诸如Make或pip之类的工具以编译和设置项目,以及git diff来管理更改。这关闭了代码生成和现实世界验证之间的循环。

  • 持续的自主操作:早期的代理人会在复杂的任务上丢失或用完上下文。作为Y组合创始人Paul Graham推文周三,对AI的关键测试是它可以“继续富有成效地思考”多长时间。今年夏天,持续时间爆炸了。例如,Replit的代理3现在可以自主运行长达200分钟,以完成任务 - 与2月其Agent 2前任的20分钟跑步相比,急剧增加。

3。代理工程师的崛起:最后一块是人类。最有效的从业者不是被动提示者。它们是Ruddock所说的“代理工程师”。他们提供了脚手架,纪律和严格的监督,这些监督将AI生成的斜率变成了企业级软件。

例如,Ruddock的过程涉及让代理首先编写详细的产品需求文件(PRD)。然后,他使用持怀疑态度“角色”的第二代理来审查第一代理的代码。最后,他进行了自己的评论。他解释说:“你必须对此非常有意。”“我现在对此做得更好,因为我知道该怎么问,要问什么,如何给它提供护栏,以检查自己的工作。”

从原型到生产:企业工程

今年夏天的飞跃的最重要证据是,代理群的输出已经超出了原型,直到最近才被视为代理编码的上限。代理商正在为生产就绪的应用建立基础。这驳斥了普遍的批评,即AI生成的代码是不适合现实世界部署的“ AI Slop”。

在这一点上,Ruddock是强调的。在他的航班上构建的申请是“ Docker,有能力的Kubernetes,可以运行您期望的所有安全检查……在我降落时,这一切都是如此。”这不是偶然的;是设计。他从Github的“规范模板”启动了项目,该项目已经包括用于安全扫描和代码质量检查的工作流程。

这是代理专业化对企业需求至关重要的地方。Ruddock将特定的角色分配给他的代理商以执行纪律。例如,他指示一位代理人充当“ 15年的安全退伍军人”,并在分析缺陷的代码方面具有丰富的经验。该专业代理的任务是审查主要编码代理的工作,创建模仿高级工程评论的制衡系统。

Bercovici的经验反映了这一点。他指出,代理群现在正在提供应用程序,其中包括“安全审核,红色团队,合规性文档和企业身份验证” - 将演示与可部署产品分开的所有组件。他说,群正在自动化整个严格的CI/CD和DevOps生命周期。

这种转变是深刻的。对话已经从AI是否可以编写函数或Vibe代码一个原型,转变为AI代理团队可以构建,测试,安全并部署整个应用程序。答案越来越多。

有一个巨大的警告。

现实检查:好日子和坏日子

这个新的范式仍然带来挑战。代理群的性能可能是不一致的。Ruddock承认,有时候,有时候出色的经纪人感到惊讶并审核他们的作品。•有时候,经纪人像一个怪异的狗屎头一样出现。为了避免这种情况,他让代理商同时旋转了几个相同产品的版本,以便他可以选择表现最好的代理。

不过,最重要的是,管理这些系统的认知开销是巨大的。瓶颈正在从编写代码的速度转移到验证它。这使人类陷入困境,使他们感到沮丧。一个 METR.org的最新研究发现AI工具实际上可能会放慢经验丰富的开发人员在复杂的任务上,因为精心审查和调试的时间否定了代码生成的最初收益。” 

与在没有深入参与的情况下让AI工作的“ Vibe编码”精神相反,经验丰富的工程师想要更多的控制,而不是更少。他们越来越开放使用LLM,但是它们抵制了一个系统的构想,该系统构建了所有内容,而无需紧密的对话反馈循环。代理平台面临的真正挑战是提供强大的自动化,而无需牺牲开发人员的干预能力,提问和引导过程。

这一点强调了另一个关键点:代理群的少于替换开发人员,而更多地是为了增强最熟练的人,将其角色从动手钥匙板编码器转变为AI驱动工程团队的高级建筑师和验证者。

炒作周期超过现实。六个月前,人类的首席执行官预测AI将是“编写90%的代码”到目前为止 - 一个里程碑,我们显然还遥不可及。尽管不可否认的是,正如Metr和Replit图表所示,进度是指数的,但真正自主,可靠的软件创建的途径仍然充满了复杂性。

在最近的一次DeepMind活动中,有人问Google DeepMind首席执行官Jeff Dean何时可以信任LLMS编写的软件足以操作飞机。据报道,长时间停顿后,迪恩回答:“飞机上有人类吗?”他的回应虽然幽默,但强调了仍然存在的验证挑战。迪恩随后继续说,尽管在实施过程中需要护理,但技术的发展速度是不远的速度,他确实希望大多数软件由LLM撰写。

企业的新护城河

今年夏天的极端加速已永久改变了软件开发的景观。代理工作流的民主化,以用户面向用户的代码执行工具加速了克劳德的代码解释器,正如专家西蒙·威利森(Simon Willison)指出的那样,意味着创建复杂,部署的软件的障碍正在崩溃。

这为企业创造了新的竞争现实。正如鲁多克(Ruddock)所说,软件公司的现代护城河是关于“对问题领域的独特视角”以及“以令人难以置信的速度执行的能力”。它少于该软件,该软件可以在数天(如果不是几个小时)内建造。

对于企业领导者和技术决策者而言,2025年夏天将被记住是在编码应用程序中开枪发射的枪支的那一刻,那些能够最有效地协调代理情报的人将赢得一项编码应用程序。

关于《Vibe编码已死:代理群编码是新的企业护城河》的评论


暂无评论

发表评论

摘要

企业家Mark Ruddock在跨大西洋航班期间使用了AI代理,为即将到来的演示构建复杂的软件组件,展示了AI执行复杂的软件工程任务的能力的重大进步。今年夏天,从“氛围编码”转变为一种称为Agent Swarm编码的更纪律处分的方法的关键转变,其中多个AI代理协同工作以迅速生成功能齐全的MVP和应用程序。推动这一飞跃的关键因素包括更智能的基础模型,复杂的代理体系结构,实际工具集成以及有效指导这些系统的“代理工程师”的兴起。尽管在一致性和验证开销方面面临挑战,但Ruddock强调,这种新范式允许更快,更安全的软件开发,从而有可能改变企业应用程序的前进方式。