想要您的收件箱中的更聪明的见解吗?注册我们的每周新闻通讯,只能获得企业AI,数据和安全负责人重要的内容。 立即订阅
您看的地方,人们在谈论人工智能代理就像他们只是提示更换整个部门一样。梦想是诱人的:可以处理您向他们扔的任何东西的自主系统,没有护栏,没有约束,只需给他们您的AWS凭证,他们将解决所有问题。但是现实是,这并不是世界的运作方式,尤其是在企业中,可靠性不是可选的。
即使代理商准确99%,这并不总是足够的。如果它优化了食品送货路线,则意味着每百个订单中的一个最终都处于错误的地址。在业务环境中,这种失败率是不可接受的。向客户或监管机构解释这很昂贵,冒险且难以解释。
在金融,医疗保健和运营等现实环境中,实际上提供价值的AI系统看起来不像这样边境幻想。他们在开放世界中即兴创作;他们解决了明确的投入和可预测结果的明确定义的问题。
如果我们不断地追求一半的技术问题,我们会燃烧时间,金钱和信任。但是,如果我们将重点放在我们面前的问题上,那么投资回报率和清晰的界限,我们今天可以使AI工作。
本文是关于切割炒作并建立实际运输,跑步和帮助的AI代理的。
开放世界炒作的问题
科技行业热爱月光(而且我也这样做)。目前,月光灯是开放世界的AI可以处理任何事情,适应新情况,即时学习并以不完整或模棱两可的信息操作的代理商。这是通用情报的梦想:不仅可以理性的系统,而且可以即兴创作。
是什么使问题成为开放世界?
开放世界问题是由我们定义的不要知道。
更正式的是,从研究定义这些复杂的环境,一个完全开放的世界以两个核心特性为特征:
- 时间和空间是无限的:代理商的过去经历可能不适用于新的,看不见的情况。
- 任务是无限的:它们是预先确定的,并且可以动态出现。
在这样的环境中,AI具有不完整的信息;它不能假设不知道真实的是错误的,这简直是未知的。预计AI将在世界导航时适应这些无法预料的变化和新颖的任务。对于当前的AI功能,这给出了一组非常困难的问题。
大多数企业问题都这样
相反,封闭世界的问题是范围已知的问题,规则是明确的,并且系统可以假定其具有所有相关数据。如果某事明确不正确,它可以被视为假。这些都是大多数企业每天实际面临的问题:发票匹配,合同验证,欺诈检测,索赔处理,库存预测。
特征 | 开放世界 | 封闭的世界 |
范围 | 无限 | 定义明确 |
知识 | 不完整 | 完成(在域内) |
假设 | 未知的错误 | 未知= false |
任务 | 紧急,没有预定义 | 固定,重复 |
可检验性 | 非常艰难 | 良好的 |
这些都是通常成为头条新闻的用例,但它们实际上是在乎解决问题。
炒作和无所作为的风险
但是,炒作是有害的:通过在开放世界通用情报上设置标准,我们使企业AI感到无法访问。领导者听到可以做所有事情并冻结的代理商,因为他们不知道从哪里开始。这个问题感觉太大,太模糊,太冒险了。
这就像试图在我们建造工作燃烧引擎之前尝试设计自动驾驶汽车。梦想令人兴奋,但是跳过基本面可以保证失败。
解决你面前的事情
开放世界的问题会导致出色的演示,甚至更好的资金回合。但是,封闭世界的问题是当今实际价值的地方。它们可解决,可测试和自动化。他们坐在每个企业中,只是在等待正确的系统来解决它们。
问题不是AI最终是否会解决开放世界问题。问题是:您现在可以实际部署什么,这会使您的业务更快,更聪明,更可靠?
企业代理商实际上是什么样的
当人们想象的时候人工智能代理今天,他们倾向于想象一个聊天窗口。用户键入提示,代理会以有用的答案做出响应(甚至可能触发一个或两个工具)。对于演示和消费者应用程序来说,这还不错,但这不是企业AI实际上在实践中的工作方式。
在企业中,最有用的代理商是由用户启发的,它们是自主的。
他们没有闲着地等待人类提示他们。他们是长期运行的过程,对数据做出反应流过业务。他们做出决策,呼叫服务并连续和异步产生输出,而无需告知何时开始。
想象一个监视新发票的代理商。每当发票降落时,都会提取相关字段,对其进行检查,以打开采购订单,标志不匹配的标志不匹配并将发票路由以供批准或拒绝,而无需任何人要求这样做。它只是在听这次活动(收到的新发票)并上班。
或考虑客户入职。代理商可能会观看创建新帐户的那一刻,然后启动级联:验证文档,运行知识客户(KYC)检查,个性化欢迎体验并安排后续消息。用户永远不知道代理存在。它只是运行。可靠。实时。
这就是企业代理的样子:
- 它们是由事件驱动的:由系统的更改而不是用户提示触发。
- 他们是自主的:他们没有人类的行动。
- 他们是连续的:他们不会旋转一项任务而消失。
- 他们主要是异步的:它们在后台工作,而不是阻止工作流程。

您不会通过微调巨型模型来构建这些代理。您通过将现有模型,工具和逻辑接线。这是一个软件工程问题,而不是建模问题。
企业代理商的核心只是具有智能的现代微服务。您可以让他们访问事件,给他们正确的上下文,并让语言模型推动推理。
代理=事件驱动的微服务 +上下文数据 + LLM
做得很好,这是一种强大的建筑模式。这也是思维方式的转变。建筑代理不是追逐人工通用情报(AGI)。这是将实际问题分解为较小的步骤,然后组装可以处理它们的专业,可靠的组件,就像我们在良好的软件系统中始终做到的那样。
我们之前解决了这种问题
如果听起来很熟悉,那应该。我们以前来过这里。
当整体无法刻度时,我们将它们分解为微服务。当同步API导致瓶颈和脆性系统时,我们转向事件驱动的架构。这些是数十年来构建现实世界系统的硬击课程。他们之所以起作用,是因为他们为复杂的系统带来了结构和决定论。
我担心我们开始忘记这一历史,并在我们建立AI的方式上重复同样的错误。
因为这不是一个新问题。与新组件相同的工程挑战。目前,企业AI需要与我们这里相同的原则:清晰的边界,宽松的耦合和旨在从一开始可靠的系统。
AI模型不是确定性的,但是您的系统可以是
在大多数企业中,值得解决的问题是封闭世界:具有已知输入,明确规则和可衡量结果的问题。但是,我们使用的模型,尤其是LLMS,本质上是非确定性的。他们通过设计概率。相同的输入可以根据上下文,采样或温度产生不同的输出。
当您回答提示时,这很好。但是,当您运行业务流程时?这种不可预测性是一种责任。
因此,如果您想构建生产级的AI系统,您的工作很简单:确定性基础架构中的非确定性模型。
围绕模型建立决定论
- 如果您知道应该将特定工具用于任务,请不要让模型决定,只需调用该工具即可。
- 如果您的工作流程可以静态定义,则不依赖动态决策,请使用确定性的呼叫图。
- 如果输入和输出是可以预测的,则不会通过过度复杂化代理逻辑引入歧义。
太多的团队正在与每个经纪人一起重新发明运行时编排,让LLM决定下一步要做什么,即使提前知道这些步骤。您只是使自己的生活更加艰难。
事件驱动的多代理系统发光的地方
事件驱动的多代理系统将问题分为较小的步骤。当您将每个人分配给专用的代理并使用结构化事件触发它们时,您最终会以一个松散的耦合,完全可追溯的系统来操作企业系统应该可以工作的方式:具有可靠性,问责制和明确的控制。
而且由于事件驱动:
- 特工不需要彼此了解。他们只是回应事件。
- 工作可以并行进行,从而加快复杂流程。
- 通过事件日志或重试隔离故障并可以恢复。
- 您可以隔离观察,调试和测试每个组件。
不要追逐魔术
封闭世界的问题不需要魔术。他们需要坚实的工程。这意味着将LLM的灵活性与良好的软件工程结构相结合。如果可以使某事确定性,请确定性。将模型保存为实际需要判断的零件。
这就是您如何建立代理商在演示中看起来不好,但实际上运行,扩展和交付生产。
为什么在开放世界中测试要困难得多
在建筑代理商中,最被忽视的挑战之一是测试,但对于企业来说绝对是必不可少的。
在开放世界的情况下,几乎不可能做好。问题空间是无限的,因此输入可以是任何东西,所需的输出通常是模棱两可的,甚至成功的标准也可能会根据上下文而变化。
您如何为可以要求做任何事情的系统编写测试套件?你可以。
这就是为什么在实践中很难验证开放世界的代理。您可以衡量孤立的行为或基准测试狭窄的任务,但是您可以端对端信任该系统,除非您以某种方式看到它在没有人拥有的情况下进行的组合较大的情况下执行。
相比之下,封闭世界的问题使测试可进行。输入受到限制。预期的输出是可以定义的。您可以写断言。您可以模拟边缘案例。您可以知道正确的样子。
而且,如果您更进一步,使用事件驱动的体系结构将代理的逻辑分解为较小的,精心策划的组件,则它会变得更加可行。系统中的每个代理都有一个狭窄的责任。它的行为可以独立测试,其输入和输出被模拟或重播,并且其性能分别评估。
当系统是模块化的,并且每个模块的范围是封闭世界时,您可以构建实际上给您信心的测试集。
这是对生产AI的信任的基础。
建立正确的基础
AI在企业中的未来并不从AGI开始。它始于有效的自动化。这意味着要专注于结构化,界定和丰富的封闭世界问题,并有真正影响的机会。
您不需要一个可以做所有事情的代理商。您需要一个可以可靠地做某事的系统:
- 索赔正确路由。
- 文件准确解析。
- 客户准时跟进。
这些胜利加起来。它们降低了成本,免费时间并建立对AI的信任,作为堆栈的可靠部分。
到达那里并不需要及时的工程或下一个模型的赌注来神奇地概括。它需要做一个好的工程师一直做的事情:以可测试和可观察的方式将问题分解,构建可组合的系统和接线组件。
事件驱动的多代理系统是银弹,它们只是一种以结构化的方式使用不完美工具的实用架构。他们让您隔离需要智能的地方,包含它不在的地方,并构建即使没有各个零件时,也可以预见的系统。
这不是追逐边境的。这是关于将基本软件工程应用于新的问题。
肖恩·法尔科纳(Sean Falconer)是居住的企业家。