作者:Ron Miller
人工智能代理被认为是人工智能领域的下一个重大事件,但它们是什么还没有确切的定义。到目前为止,人们对于人工智能代理的具体构成还没有达成一致。
简而言之,人工智能代理最好被描述为人工智能驱动的软件,它可以为您完成一系列人类客户服务代理、人力资源人员或 IT 帮助台员工过去可能完成的工作,尽管它最终可能涉及任何任务。你要求它做事,它就会为你做事,有时跨越多个系统,而不仅仅是回答问题。例如,上个月的困惑发布了一款人工智能代理,可以帮助人们进行假日购物(和这不是唯一的一个)。谷歌上周宣布它的第一个人工智能代理,名为 Project Mariner,可用于查找航班和酒店、购买家居用品、查找食谱和其他任务。
看起来很简单,对吧?然而,由于缺乏清晰度,情况变得复杂。即使在科技巨头之间,也没有达成共识。谷歌将它们视为基于任务的助手,具体取决于工作:为开发人员提供编码帮助;帮助营销人员创建配色方案;协助 IT 专业人员通过查询日志数据来追踪问题。
对于体式,代理人可以表现得像个额外的员工,像任何好同事一样处理分配的任务。塞拉利昂,由 Salesforce 前联合首席执行官 Bret Taylor 和 Google 资深人士 Clay Bavor 创立的一家初创公司,将代理视为客户体验工具,帮助人们实现远远超出过去聊天机器人的操作,从而帮助解决更复杂的问题。
缺乏一致的定义确实给这些东西到底要做什么留下了混乱的空间,但无论它们如何定义,代理都是为了帮助以自动化的方式完成任务,并尽可能少地进行人机交互。
Glasswing Ventures 创始人兼管理合伙人 Rudina Seseri 表示,现在还处于早期阶段,这可能是未能达成一致的原因。– 对于“人工智能代理”是什么,没有单一的定义。然而,最常见的观点是,代理是一种智能软件系统,旨在感知其环境、推理、做出决策并采取行动以自主实现特定目标。”Seseri 告诉 TechCrunch。
她说他们使用了多种人工智能技术来实现这一目标。– 这些系统结合了各种人工智能/机器学习技术,例如自然语言处理、机器学习和计算机视觉,可以在动态域中自主或与其他代理和人类用户一起运行。
Box 联合创始人兼首席执行官 Aaron Levie 表示,随着时间的推移,随着人工智能变得越来越强大,人工智能代理将能够代表人类做更多的事情,并且已经存在推动这种进化的动力。
– 对于人工智能代理,自我强化飞轮有多个组件,这些组件将有助于显着提高人工智能代理在短期和长期内可以完成的任务:GPU 价格/性能、模型效率、模型质量和智能、人工智能框架和基础设施的改进,”Levie 写道在领英上最近。
这是对技术的乐观看法,假设所有这些领域都会出现增长,而这并不一定是既定的。麻省理工学院机器人先驱 Rodney Brooks 在最近接受 TechCrunch 采访时指出人工智能必须处理更棘手的问题比大多数技术都要快,而且它不一定会像摩尔定律下的芯片那样快速增长。
– 当人类看到人工智能系统执行一项任务时,他们会立即将其概括为相似的事物,并对人工智能系统的能力做出估计;“不仅仅是在这方面的表现,还有围绕这方面的能力,”布鲁克斯在那次采访中说道。“而且他们通常非常过度乐观,这是因为他们使用个人在任务中的表现模型。”
问题是跨系统很困难,而且由于一些遗留系统缺乏基本的 API 访问,这让情况变得更加复杂。虽然我们看到 Levie 提到的稳步改进,但让软件访问多个系统并解决其可能遇到的问题可能比许多人想象的更具挑战性。
如果是这样的话,每个人都可能高估了人工智能代理的能力。HFS Research 的研究负责人 David Cushman 认为当前的机器人更像是 Asana:帮助人类完成某些任务以实现某种用户定义的战略目标的助手。挑战在于帮助机器以真正自动化的方式处理突发事件,而我们显然还没有接近这一点。
“我认为这是下一步,”他说。– 这是人工智能大规模独立、有效运行的地方。因此,这就是人类设定指导方针、护栏并应用多种技术将人类排除在循环之外的地方——当一切都是为了保持人类在与 GenAI 的循环,”他说。因此,他说,这里的关键是让人工智能代理接管并应用真正的自动化。
Madrona Ventures 的合伙人 Jon Turow 表示,这将需要创建一个人工智能代理基础设施,这是一个专门为创建代理而设计的技术堆栈(无论你如何定义它们)。在最近的一篇博客文章中,Turow人工智能代理的概述示例目前正在野外工作以及它们今天是如何建造的。
在 Turow 看来,人工智能代理的日益普及(他也承认这个定义仍然有点难以捉摸)需要像任何其他技术一样的技术堆栈。“所有这些都意味着我们的行业需要努力构建支持人工智能代理和依赖它们的应用程序的基础设施,”他在文章中写道。
– 随着时间的推移,推理将逐渐改进,前沿模型将引导更多的工作流程,开发人员将希望专注于产品和数据——这些使它们与众不同的东西。他们希望底层平台能够“正常工作”,具有规模、性能和可靠性。
这里要记住的另一件事是,它可能需要多个模型,而不是单个 LLM,才能使代理发挥作用,如果您将这些代理视为不同任务的集合,这是有道理的。– 我认为目前任何单一的大型语言模型(至少是公开可用的整体大型语言模型)都能够处理代理任务。我认为他们还不能进行多步骤推理,而这确实能让我对代理的未来感到兴奋。我认为我们正在接近这一目标,但还没有实现。”麦格理美国股票研究公司美国人工智能和软件研究主管 Fred Havemeyer 表示。
– 我确实认为最有效的代理可能是多个不同模型的多个集合,并带有一个路由层,该路由层向最有效的代理和模型发送请求或提示。我认为这有点像一个有趣的[自动]主管,委派某种角色。”
最终,对哈夫梅尔来说,整个行业正在努力实现代理商独立运营的目标。– 当我思考智能体的未来时,我希望看到并且希望看到智能体真正自主,能够实现抽象目标,然后完全独立地推理出中间的所有单独步骤”,他告诉 TechCrunch。
但事实是,就这些主体而言,我们仍处于过渡时期,我们不知道什么时候才能达到哈夫迈耶所描述的最终状态。虽然到目前为止我们所看到的显然是朝着正确方向迈出的有希望的一步,但我们仍然需要一些进步和突破,让人工智能代理按照今天的设想运行。重要的是要明白我们还没有做到这一点。
本文最初发布于 2024 年 7 月 13 日,并进行了更新,添加了来自 Perplexity 和 Google 的新代理。