英语轻松读发新版了,欢迎下载、更新

停止将工作流称为“代理” - 真实代理AI的指南

2025-08-26 06:46:10 英文原文

杰克·琼斯(Jake Jones),侧面。

法律技术有一个新的成瘾:用LLM和一些集成的任何东西拍打攻击。它是草率的,使买家感到困惑,并且使行业放缓。如果您的产品可以无人看管,那么当世界推迟时,可以重新计划,并且需要定制的UI来照顾每次点击,而不是代理。它是宏伟的幻想的软件。

这件作品在真正的代理系统和工作流剧院的装扮中绘制了一条明亮的界限。期望一些脚趾被踩踏。

一个简单的定义:

ADIC AI是一个可以在约束中自主追求目标的系统。

具体而言,这意味着可以:

1.实现目标(例如,在政策中执行此NDA)。

2.形式并通过多个步骤修改计划。

3.``选择并撰写工具(电子邮件,电子签名,CLM,CRM,日历,知识库),而无需告诉您要使用哪种,何时或如何使用。

4.在外部系统中起作用,观察结果并在现实偏离时适应。

5.``应对障碍(ooo回复,缺失的字段,被阻止的权限),通过重新升级,升级或谈判替代方案来处理障碍。

6.``通过现有渠道(电子邮件,休闲,团队)操作,而不是要求您生活在新界面中。

7.通过规则/政策引擎和可审计日志尊重政策和风险公差。

8.如果没有人类的微观策划,完成工作(或安全停止)。

如果其中任何一个都缺少,我们就不会在代理领土上。

哪种代理AI不是:

  • 不是IF/随后的工作流程。预烘烤的树枝很脆。代理计划,行动,观察和重新计划。
  • 不是带有工具按钮的生成UI。您必须单击的一个漂亮集成面板仍然是软件。
  • 不是一个副本,您必须逐步接受建议。这是辅助AI,而不是自治。
  • 不取决于专用界面。真正的代理商在您已经工作的地方与您会面。
  • 不是我们写了很多集成的代名词。综合计数。

供应商宾果游戏:最常见的假代理模式:

1. 工作流包装器

LLM的僵化业务流程提示胶水。令人印象深刻的演示;第一次折叠财务改变了形式。

2. 整合剧院

``我们是代理,我们与47个工具集成在一起。系统仍然需要您选择工具X,步骤3,选项B。这是一个遥控器,而不是代理。

3. 向导角色扮演

五步UI,询问代理商应该推断的一切。如果人类必须驱动这条路,那就不是自主的。

4. 演奏副驾驶

草稿条款和评论,但可以追逐签名,更新跟踪器或在OOO周围重新路由。那是辅助制图。

5. LLM-As-As-Form-Filler

在您的CLM中自动完成字段,但可以协商时间表,追逐对手或在卡住时预订电话。

如果您在其中任何一个中都认识到您的产品,请停止称其为代理商。

自主阶梯(与您的买家一起使用)

0级自动化工作流程:确定性序列。可靠,脆弱,便宜。

1级辅助AI:草稿,分类,摘录。人类驱动过程。

2级监督代理:跨工具的计划和行为;人类批准关键步骤或例外。

第3级自主权:在政策和风险范围内无人看管;仅在边缘案例上升级。

市场上大多数代理法律技术都是伪装成3级的1级。

代理商的法定最低限度栏

要要求代理人,您应该满足所有以下所有内容:

  • 目标与计划循环:一个明确的计划者根据结果而不是单独提示更新计划。
  • 工具自治:工具的动态选择/组成(包括后备路径)。
  • 障碍恢复:检测阻滞剂(OOO,允许拒绝,丢失数据),尝试替代方案并在上下文中升级。
  • 策略护栏:硬限制(批准阈值,子句库,数据处理规则)在运行时执行。
  • 可审核性:完整的操作日志(WHO/WHAT/WHEL/WHY/WHY),可重复的输入/输出以及确定性的策略检查。
  • 渠道本地操作:通过电子邮件/休闲/团队工作;没有定制的UI依赖性。
  • 停止条件:风险触发,超时和重试天花板,以避免行为失控。

如果您的系统仅通过人类点击即可勾选这些盒子,那不是代理。

一个具体的例子:NDA签名而无需保姆

目标:在政策中执行低风险的NDA。

真正的代理人将:

1.从电子邮件/松弛,对交易对手风险进行分类,选择正确的模板。

2.草稿NDA,应用房屋位置,原木原理。

3.通过电子签名发送;如果签名者是OOO,请重新划定委派,提出呼叫或重新安排。

4.检测非标准编辑;在权威范围内自动谈判,仅升级到阈值以上。

5.更新CLM,CRM,物质跟踪器;通知利益相关者的渠道。

6.``用审核步道和证据包关闭循环。

一个工作流包装器将:生成草稿,打开UI,然后等待您完成其余的工作。

不足的代理只是为了戴徽章

渎职行为的另一种味道:防弹自主权的产品,因此营销可以说“不做辛勤工作”。

  • 在每个微观步骤中强迫批准``控制'',您将代理变成了清单。
  • 禁止工具选择“硬编码”电子签名供应商和日历逻辑,因此代理永远无法重新计划。
  • 躲在遵守范围后面,以避免建筑护栏,然后责怪监管机构缺乏自主权。

如果您这样做,那么您就不会保护;您要躲避工程。

买家应如何评估代理要求

在代表性的事项上要求这四个指标:

1.无人看管的完成率(UCR):完全完成的任务百分比没有人为行动。

2.障碍恢复率(ORR):没有人为帮助的阻止者的百分比。

3.“人类(MTTH)的平均时间:首先需要人类干预之前的平均运行时间。

4.政策违反率(PBR):代理商尝试采取过失行动(应接近零)的每1,000行事件。

然后运行一个黑盒测试:给邮箱,一个CLM,一个E-SIG工具,您的策略和一个真实的收件箱,其中充满了边缘案例。没有供应商经营的演示导轨。观看生存的东西。

建筑很重要(而且不同)

代理系统Arenâtcrud-plus-llm。它们的骨头不同:

•计划者/控制器:维护目标,分解任务,重新计划反馈。

•记忆与状态:案例状态 +长期事件的情节记忆。

•政策引擎:编译时间和运行时间限制;权威阈值;安全行动过滤器。

•工具箱和路由器:工具模式,负担能力,适配器发现和后备。

•监视:执行看门狗,异常检测器,停止条件。

事件总线:异步,事件驱动的循环,而不是请求/响应表。

• - 审计层:不变的日志,人工制品存储,重播。

如果您的代理是一个及时的模板,请致电一些API,那将使现实偏离的那一刻崩溃。

OOO电子邮件,重新审视

特工在遇到障碍时不会掉下来(例如寻求合同批准时的OOO电子邮件)。

真正的代理人将推断延迟影响,检查权限图,与代表联系,提出替代时间表,或者在没有您的手的情况下升级或通过风险意识的摘要升级!

接口神话

代理商不需要专用界面。如果您的系统仅在您的专有UI内部起作用,那不是代理;这是一个要求用户行为改变的产品。代理商应在电子邮件/休闲/团队中嗡嗡作响,并在后台安静地触摸您的CLM/CRM。

命名问题(为什么重要)

代理不是生成AI应用程序的另一个名称。语言塑造预算。当供应商模糊助手,自动化和代理人时,法律团队购买了错误的东西,衡量错误的结果并得出结论。

可行的前进方式

•对水平诚实。如果您是L1/L2,请这样说。副驾驶和智能工作流程具有巨大的价值。

•选择有限的域。从大批量的低风险事务开始(NDA,常规供应商入职,标准DPA)。

正确的工程师护栏。政策引擎,安全工具模式,监视器。不只是到处都是人类。

•发布指标。ucr,orr,mtth,pbr。如果可以的话,您还没有准备好说“代理”。

•与用户相遇。首先频道;仪表板以后。

范式偏移,很明显

新兴行业不是内部具有AI的数字软件。它的智能自主系统在您的堆栈中起作用以实现结果。不同的组成部分,不同的约束,不同的责任。我们不要将它们用作任务,限制它们并审核它们。

停止重新品牌工作流程。建立代理商,或出售您所获得的东西。

关于作者:杰克·琼斯(Jake Jones)是侧翼是一家法律技术公司,为法律团队开发代理商,可以自主处理常规任务。

这是为人工律师撰写的一个教育思想文章,因为该网站越来越意识到,目前在法律技术市场上出售的某些代理商实际上根本不是真正的代理商。因此,我们需要更多地了解此主题。因此,艾尔(Al)要求杰克(Jake)在这个利基领域工作了几年,他帮助清除此事并提出了一些明确的定义。

正如上一篇文章中指出的那样,如果您计划营销新产品或功能,请首先考虑它在描述此产品之前是否实际显示代理特征。

伦敦和纽约的法律创新者会议25

如果您想保持领先于法律AI曲线,那就来 法律创新者纽约,11月19日 + 20和另外, 英国法律创新者11月4日 + 5 + 6,最聪明的头脑将分享他们对我们现在的位置和前进地的见解。 

英国法律创新者首先到达:律师事务所在11月4日,然后是Inhouse Day,5th,然后是我们6日的新诉讼日。

与往常一样,这两个活动都是由令人敬畏的宇航员团队组织的! 

如果您想参加,请与他们联系。


从人造律师那里发现更多

订阅以将最新帖子发送到您的电子邮件。

关于《停止将工作流称为“代理” - 真实代理AI的指南》的评论


暂无评论

发表评论

摘要

尽管缺乏真正的自主权,但法律技术目睹了将产品标记为“代理”的趋势,从而引起混乱和阻碍行业的进步。杰克·琼斯(Jake Jones)澄清说,真正的代理AI可以自主追求限制内的目标,计划多步操作,动态选择工具,而无需人工干预,适应外部变化,通过现有渠道运作,通过审核跟踪尊重政策,并独立完成任务。他将真正的代理商与诸如“工作流剧院”或辅助AI伪装成自治系统之类的误导性产品区分开。琼斯提供了一个基于特定指标评估代理主张的框架,并突出了传统基于CRUD的系统和真正的代理体系结构之间的架构差异。该文章要求在营销法律技术产品中透明度,并强调建立实际代理,而不是重新品牌工作流程。