作者:Yoko Li
开发人员正在将AI作为工具移动,并开始将其视为软件如何构建的新基础。我们为理所当然的版本控制,模板,文档,甚至是用户的想法而被认为是根据代理驱动的工作流程重新考虑的许多核心概念。
随着代理商成为合作者和消费者,我们希望看到基础开发人员工具的变化。提示可以像源代码一样对待,仪表板可以对话,并且文档对机器和人类的编写一样多。模型上下文协议(MCP)和AI-Native IDE指出了开发循环本身的更深入重新设计:我们不仅对编码进行了不同的编码,而且还为代理商完全参与软件循环的世界设计工具。
在下面,我们探索了九种前瞻性的开发人员模式,尽管很早就以真实的疼痛点为基础,并暗示了可能出现的东西。这些范围从重新思考AI生成的代码的版本控制,到LLM驱动的用户界面和文档。
让我们深入研究每种模式,并带有来自开发社区的例子和见解。
既然AI代理越来越多地编写或修改了应用程序代码的大部分,则开发人员关心的内容开始更改。我们不再确切地遵守逐条编写的代码,而是基于输出是否按预期行为。更改是否通过了测试?该应用程序仍然按预期工作吗?一个
这是一个长期存在的心理模型:GIT旨在跟踪手写代码的精确历史,但是,使用编码代理,粒度变得不那么有意义。开发人员通常不会审核每一个差异,尤其是在变化很大或自动生成的情况下 - 他们只想知道新行为是否与预期的结果保持一致。结果,一旦代码库状态的规范参考开始失去其某些语义价值。”
SHA告诉您,有些事情发生了变化,但没有为什么或者是否有效。在AI优先的工作流程中,更有用的真理单位可能是提示生成代码和测试验证其行为的测试。在这个世界上,您的应用程序的状态可能会以生成(提示,规格,约束)和传递断言的套件的形式更好地表示,而不是冻结的提交哈希。实际上,我们最终可能会追踪及时+测试捆绑包作为可版本的单位,GIT降级为跟踪这些捆绑包,而不仅仅是原始源代码。
进一步迈出一步:在代理驱动的工作流程中,真理的来源可能会向上游转向提示,数据模式,API合同和建筑意图。代码成为这些输入的副产品,更像是编译的人工制品,而不是手动撰写的来源。在这个世界上,git开始起较少的工作空间功能,而不是作为文物日志的工作 - 不仅要跟踪发生了什么变化,而且是谁和谁。我们可能会开始在更丰富的元数据中分层,例如哪种代理或模型进行了更改,哪些部分是受保护的,以及需要人类监督的地方或AI审稿人喜欢的地方钻石可以作为循环的一部分介入。
为了使它更具体,下面是对AI本地git流的模型,在实践中可能是什么样的:
多年来,仪表板一直是与复杂系统交互的主要界面,例如可观察性堆栈,分析,云控制台(思考AWS)等。但是他们的设计通常会遭受超负荷的UX:太多的旋钮,图表和标签,迫使用户既无法寻找信息并弄清楚如何对其进行行动。特别是对于非力量用户或整个团队,这些仪表板可能会变得令人生畏或效率低下。用户知道他们想实现的目标,但不在哪里寻找或用于到达那里的过滤器。
最新一代的AI模型提供了潜在的转变。我们可以在搜索和交互中分层,而不是将仪表板视为刚性画布。LLMS现在可以帮助用户找到正确的控制(在哪里可以调整此API的速率限制器设置?);将整个屏幕的数据综合为可易消化的见解(总结过去24小时内分期的所有服务的错误趋势);以及表面未知/未知数(鉴于您对我的业务了解,产生了我应该关注这个季度的指标列表)。
我们已经看到了像助理UI这使代理商可以利用反应组件作为工具。 正如内容变得动态和个性化一样,UI本身也可以变得适应性和对话。纯粹的静态仪表板可能很快就会感觉到自然语言驱动的接口旁边,该接口根据用户意图重新配置。例如,用户可能会说,而不是单击五个过滤器来隔离指标,向我展示上周末在欧洲的异常,”仪表板重塑以显示该视图,并带有摘要的趋势和相关日志。或者,更强大的�为什么上周我们的NPS得分下降?AI可能会引起调查情绪,将其与产品部署相关联,并产生简短的诊断叙事。
在更大范围内,如果代理商现在是软件的消费者,我们也可能需要重新考虑仪表板是什么或为他们设计的人。例如,仪表板可以使视图优化代理经验结构化的,可访问的表面,旨在帮助代理人感知系统状态,做出决策和行动。这可能会导致双模式接口:一个面向男子的和一个面向代理的界面,既有一个共同的状态,但针对不同的消费方式量身定制。
在某些方面,代理人一旦被警报,CRON作业或基于条件的自动化而填补,但具有更大的上下文和灵活性。而不是像前线逻辑那样如果错误率>阈值,请发送警报,代理商可能会说,错误率正在上升。这是可能的原因,受影响的服务以及拟议的修复。在这个世界上,仪表板只是要观察的地方。他们是人类和代理商都合作,合成和采取行动的地方。
仪表板如何发展以支持人类和机构的观众。
开发人员的行为在文档方面正在转移。现在,用户没有阅读目录或自上而下的扫描,而是从一个问题开始。心理模型不再让我研究这个规格, 但•我想消费的方式为我重新打造这些信息。从被动阅读到主动查询的这种微妙的转变正在改变文档所需的内容。它们不仅是静态HTML或Markdown页面,还可以成为互动知识系统,并以索引,嵌入和工具感知的代理支持。
结果,我们看到了像Mintlify这样的产品的兴起,这些产品不仅将文档作为语义搜索数据库构建,而且还可以作为跨平台编码代理的上下文来源。Mintlify页面现在经常被AI编码代理引用,无论是在AI,VS代码扩展名还是终端代理中,因为编码代理使用最新文档作为生成的基础背景。”
这改变了文档的目的:它们不再仅适用于人类读者,也适用于代理商消费者。在这个新的动态中,文档接口变成类似AI代理的指令。它不仅仅揭示原始内容,而是说明了如何正确使用系统。
过去,入门项目意味着选择一个静态模板,例如样板github repo或cli创建反应应用,,,,下一个初始化, 或者铁轨新。这些模板是新应用程序的脚手架,提供一致性,但几乎没有定制。开发人员符合提供或冒着大量手动重构框架的任何默认设置。
现在,这种动态正在随着文本到应用平台的出现而转移,例如Replit,Same.dev,可爱,convex和Bolt的厨师以及光标等AI IDES。开发人员可以描述他们想要的内容(例如,带有Supabase,Clerk和Stripe的打字稿API服务器),并在几秒钟内具有自定义项目。结果是一个不通用的起动器,而是个性化和有目的的,反映了开发人员的意图和他们选择的堆栈。
这将在生态系统中解锁新的分发模型。而不是坐在长长的头部的一些框架尾巴,我们可能会看到更广泛的综合,特定的世代传播工具和体系结构被动态混合和匹配的地方。少于选择一个框架,而是描述AI可以建立堆栈的结果。一位工程师可能会使用next.js和trpc创建一个应用程序,而另一个工程师则以Vite和React为开始,但都立即获得工作脚手架。
当然,有权衡。标准堆栈带来了真正的优势,包括使团队提高富有成效,改善入职以及使整个组织的故障排除更容易。跨框架进行重构仅仅是技术升降机。它经常与产品决策,基础设施限制和团队专业知识纠缠在一起。但是变化是切换框架的成本或开始。鉴于AI代理人了解项目意图并可以半自治地执行大型重构,因此实验变得更加可行,并在需要时进行逆转过程。
这意味着 框架决策变得越来越可逆。开发人员可能会从Next.js开始,但后来决定迁移到混音和Vite,并要求代理人处理重构的大部分。这减少了框架用于强加和鼓励更多实验的框架,尤其是在项目的早期阶段。它还降低了尝试自以为是的堆栈的标准,因为以后切换不再是一项大规模投资。
几十年来,.ENV文件一直是开发人员在本地管理秘密(例如API密钥,数据库URL和服务令牌)的默认方法。他们简单,便携式和开发人员友好。但是在一个以特工为驱动的世界中,这种范式开始崩溃。当AI IDE或代理商代表我们编写代码,部署服务和编排环境时,不再清楚谁拥有.ENV。
我们看到了这可能是什么样的暗示。例如,最新的MCP规范包括授权 框架基于Oauth 2.1,表明有可能使AI代理替代,可撤销的令牌而不是原始秘密。我们可以想象一个场景,AI代理不会获得您的实际AWS键,而是获得了短暂的凭证或能力令牌,使其可以执行狭义的操作。
这可能会摆脱的另一种方式是,通过当地秘密经纪人的兴起在您的机器上运行的服务或与您的应用程序一起充当代理商和敏感证书之间的中介机构。代理可以请求访问能力(而不是将秘密注入.ENV文件或将其进行硬编码)(部署到分期或将日志发送到哨兵),并且经纪人确定是否授予它的及时,并具有完整的可审核性。这将秘密访问权与静态文件系统脱离,并使秘密管理更像是API授权,而不是环境配置。
我们开始看到新的应用程序类(例如格兰诺拉麦片和强调)要求在MACOS上使用可访问性设置,而不是用于传统可访问性用例,而是使AI代理可以观察并与接口进行互动。但是,这并不是一个黑客:这是一个更深层次的转变。
构建可访问性API旨在帮助用户有视力或电机障碍导航数字系统。但是,当经过深思熟虑时,相同的API可能会成为代理的通用接口层。代理可以观察应用程序辅助技术的语义方式,而不是单击像素位置或刮擦DOMS。可访问性树已经暴露了结构化元素,例如按钮,标题和输入。如果使用元数据扩展(例如意图,角色和负担能力),这可能成为代理商的一流界面,让他们感知并以目的和精度对应用程序采取行动。
有两个潜在的方向:
随着开发人员开始更加流畅地与编码代理一起工作时,我们看到了自然的转变,即代理在后台操作,追求平行工作线程,并在他们的情况下进行报告。这种互动方式开始看起来不像配对编程,而更像是任务编排:您将目标委派,让代理运行并稍后检查。
至关重要的是,这与卸载工作无关。它还压缩了协调。开发人员无需ping另一个团队更新配置文件,分类或重构组件,而是可以将该任务越来越多地分配给对其意图行事并在后台执行的代理。曾经需要同步会议,跨职能交接或长期审核周期可能成为的环境循环请求,生成,和证实。
代理交互的表面也在扩展。开发人员可以通过以下方式开始与代理人互动,而不是总是通过IDE或CLI提示。
这创建了一个模型,其中代理在整个开发生命周期中都存在。他们不仅编写代码,还可以解释设计,响应反馈以及跨平台的错误。开发人员成为决定追求,丢弃或合并的线程的编排者。
也许这种分支和委派给代理商的模型成为了新的git分支不是静态的代码叉,而是一个动态的意图线,直到准备着陆为止。
我们最近出版了深入了解MCP。从那时起,动量加速了:OpenAI公开采用的MCP,该规范的几个新功能已合并,工具制造商开始围绕它作为代理商与现实世界之间的默认接口汇聚。
MCP以此为核心解决了两个大问题:
我们希望将更广泛的收养视为远程MCP和事实上的注册表即将在线。而且,随着时间的流逝,默认情况下,应用程序可能会开始使用MCP表面运输。一个
想一想API如何使SaaS产品互相插入并跨工具组成工作流程。MCP可以通过将独立工具变成可互操作的构建块来为AI代理做同样的事情。一个与MCP客户库烘烤的平台,不仅是AI-Ready,但是较大的生态系统的一部分,可以立即攻入不断增长的代理可访问功能网络。
此外,MCP客户和服务器是逻辑障碍,而不是物理边界。这意味着任何客户端也可以充当服务器,反之亦然。从理论上讲,这可以通过使用MCP客户端消耗上下文的代理商可以通过服务器接口来揭示自己的功能。例如,编码代理可以充当获取GitHub发出的客户的客户,但也可以将自己注册为将测试覆盖范围或代码分析结果暴露给其他代理的服务器。
随着氛围编码代理变得越来越强大,一件事变得很清楚:代理可以生成很多代码,但是它们仍然需要可靠的东西才能插入。就像人类开发人员倾向于付款条纹,Auth的书记员或数据库功能的Supabase一样,代理商也需要类似的清洁和可组合的服务原始人来脚手架可靠的应用程序。
在许多方面,这些服务具有清晰的边界,人体工程学的SDK和理智的默认设置,从而减少故障机会 - 越来越多地用作代理的运行时界面。如果您构建生成SaaS应用程序的工具,则不希望您的代理商滚动自己的身份验证系统或从头开始编写计费逻辑;您希望它使用店员和Stripe等提供商。
随着这种模式成熟,我们可能会开始看到服务优化自己的代理消费,不仅是API,还可以揭示架构,功能元数据和示例流量。这有助于代理更可靠地整合它们。
默认情况下,某些服务甚至可能会开始使用MCP服务器运输,将每个核心原始性变成代理商可以推理并安全地使用的东西。想象一下,店员暴露了MCP服务器,该服务器可以让代理查询可用的产品,创建新的计费计划或更新客户的订阅 - 所有这些都具有许可范围和预先定义的约束。代理商可以说,而不是撰写API电话或通过文档进行狩猎,而是可以说•以49美元的价格制定一个每月的计划,以基于使用的超额销售,店员的MCP服务器将揭示该功能,验证参数并牢固地处理编排。
正如Web早期需要轨道发电机和轨道以快速移动一样,代理时代需要值得信赖的原始功能 - 倒入身份,用法跟踪,计费逻辑和访问控制 - 所有这些都足够抽象以产生反对,但足够表达才能与应用程序一起成长。
这些模式指出了更广泛的转变,其中新开发人员的行为与更有能力的基础模型一起出现。而且,作为回应,我们看到了MCP等新工具链和协议。它不仅在旧工作流程上分层,而且还重新定义了软件如何使用代理,上下文和核心意图构建。许多开发人员的工具层从根本上发生了变化,我们很高兴能在下一代工具上进行投资和投资。