人类几个世纪以来一直在自动化任务。如今,人工智能公司看到了利用我们对效率的热爱获利的道路,并且他们为自己的解决方案起了一个名字:代理。
AI代理是自主程序,能够在几乎没有人类干预的情况下执行任务、做出决策并与环境互动,它们是当今每一家从事AI工作的主要公司的重点。微软拥有“副驾”(Copilots),旨在帮助企业自动化客户服务中心和行政事务等工作。谷歌云首席执行官托马斯·库里安最近概述了六种不同的人工智能生产效率代理的推销方案以及谷歌深度思维公司刚刚从OpenAI挖走了其AI视频产品的主要负责人之一,空,到开发一个用于训练AI代理的模拟系统Anthropic发布了其AI聊天机器人Claude的一项新功能这将让任何人都能创建自己的“AI助手”。OpenAI在其五级方法中将代理作为第2级,以达到AGI(人类水平的人工智能)的目标。
显然,计算领域充满了自主系统。许多人访问过带有弹出式客户服务机器人的网站,使用过类似Alexa Skills的自动语音助手功能,或者编写过自动回复的脚本。一个简单的IFTTT脚本但AI公司认为“代理”——你最好不要叫它们机器人——是不同的。这些代理不会遵循简单的、机械的指令集,相反,它们能够与环境互动,从反馈中学习,并在没有持续的人类输入的情况下做出决策。它们可以动态地管理任务,如购物、预订旅行或安排会议,在面对不可预见的情况时进行适应性调整,并与包括人类和其他AI工具在内的系统交互。
人工智能公司希望代理能够为强大的、昂贵的AI模型提供一种变现方式。风险投资正涌入那些承诺将彻底改变我们与技术互动方式的人工智能代理初创公司。企业设想效率将迎来飞跃,从客户服务到数据分析等一切事务都将由代理来处理。对于个人而言,人工智能公司推销的新生产力时代将是自动化常规任务,释放时间用于创造性和战略工作。真信徒的最终目标是创造出真正意义上的合作伙伴型AI,而不仅仅是工具。
“你真正想要的”,OpenAI首席执行官山姆·阿尔特曼告诉了麻省理工科技评论今年早些时候,阿尔特曼将AI的杀手级应用描述为“一个全能同事,它对我的整个生活了如指掌,了解我所有的电子邮件和曾经进行过的每一项对话,但它并不会给人一种它是某种延伸的感觉。”它可以瞬间处理简单任务,对于更复杂的任务,它会尝试完成这些任务,并在需要时带着问题回来。自上世纪70年代以来,科技公司一直在努力自动化个人助理功能,而现在它们承诺终于快要成功了。
在公司年度Dev Day前夕的OpenAI新闻发布会上,开发者体验负责人Romain Huet使用一个助理代理演示了公司的新实时API。Huet给代理设定了预算和一些购买400颗巧克力覆盆子的限制,并要求它通过电话向一家虚构的商店下单。
该服务类似于2018年推出的一款名为Duplex的谷歌预订机器人。但那个机器人只能处理最简单的场景——事实证明它的通话中实际上有四分之一是由人类发起的.
你在美国开放人工智能研究实验室工作吗?请注意,如果是指特定的公司或组织,如OpenAI,应直接译为“开放人工智能”,此处假设询问的是是否在该机构工作。若需更精确表达,请提供更多信息以便准确翻译。原文如果是简单询问,则直接翻译为:“你在OpenAI工作吗?”我很乐意聊天。你可以通过Signal (@kylie.01) 或电子邮件 (kylie@theverge.com) 安全地联系我。
虽然该订单是用英语下的,但Huet告诉我他在东京做了一个更复杂的演示:他提示一个代理帮他用日语预订一间酒店房间,在整个对话过程中使用日语,然后回拨给他用英语确认已经完成。“当然,我不会理解日语部分——它只是处理就好了,”Huet说。
但是胡埃的演示立即引发了满屋子记者们的担忧。这个AI助手难道不能被用来进行骚扰电话吗?为什么它不表明自己的身份是AI系统呢?(一位参会者说,胡埃在官方开发者大会(Dev Day)上更新了演示版本,使得代理程序明确标示为“Romain的AI助手”)。这种不安情绪显而易见,并不出人意料——即使没有这些代理程序,AI工具本身就已经已经被用于欺骗.
还有一个更紧迫的问题:演示没有工作。代理缺少足够的信息,并且错误地记录了甜点的口味,导致它自动在某一列中填充了诸如香草和草莓这样的口味。而不是说它没有那个信息代理经常会遇到多步骤工作流程或意外情况的问题。他们消耗的能量比传统机器人或语音助手更多。他们在推理或多系统交互时需要大量的计算能力,这使得大规模运行的成本很高。
AI代理提供了一次飞跃式的发展机遇潜在的但对于日常任务而言,它们目前还没有显著优于机器人、助手或脚本。OpenAI和其他实验室旨在通过强化学习来提升其推理能力,同时希望 摩尔定律继续生效提供更便宜、更强大的计算能力。
所以,如果AI代理目前还没有非常有用,为什么这个想法如此流行?简短地说:市场压力。这些公司拥有强大但昂贵的技术,急切地寻找可以实际应用的场景来证明其价值。也对用户收费。承诺与现实之间的差距也创造了一个充满吸引力的炒作周期,从而推动了融资,而恰好是OpenAI筹集了66亿美元就在它开始宣传代理的时候。
AI代理初创公司在过去12个月内获得了82亿美元的投资资金
大型科技公司一直在争相将各种“人工智能”集成到他们的产品中,但他们希望人工智能助手尤其能够成为解锁收入的关键。Huet演示的AI通话功能超越了目前大规模使用的模型所能达到的水平,但他告诉我,随着OpenAI完善其“推理”o1模型,类似的功能最早可能在明年就会变得更加普遍。
目前,这一概念主要局限于企业软件堆栈中,而不是面向消费者的产品。Salesforce 提供客户关系管理(CRM)软件,在其年度 Dreamforce 会议前几周宣布了一个备受瞩目的“代理”功能。该功能使客户能够使用自然语言在几分钟内通过 Slack 构建一个客户服务聊天机器人,而无需花费大量时间编写代码。这些聊天机器人可以访问公司的 CRM 数据,并且处理自然语言比不基于大型语言模型的机器人更容易,这可能使得它们在询问订单和退货等有限任务上表现更好。
AI代理初创公司(仍然是一个含糊的术语)已经成为一项非常热门的投资。在过去的一年里,它们已经通过156笔交易筹集了82亿美元的风险投资资金,同比增长了81.4%。根据PitchBook数据其中一个较为知名的项目是Sierra,这是一款类似Salesforce最新项目的客户服务代理。由前Salesforce联席执行长布莱特·泰勒发起还有Harvey,它为律师提供AI代理,以及TaxGPT,一个用于处理您税务的AI代理。
尽管人们对代理表现出极大的热情,但这些高风险的应用引发了一个明确的问题:它们能否真正被信任来处理像法律或税收这样严肃的事情?AI生成的错误信息,这在ChatGPT用户中经常出现,目前还没有解决的办法。更根本的是,作为IBM在1979年预见性地表示“计算机永远不会承担责备”——作为附带结论,“计算机绝不能做出管理决策。”与其将AI助手视为自主决策者,不如将其视为它们真正的东西:用于低风险任务的强大但不完美的工具。这值得人工智能公司希望人们支付的高昂费用吗?
目前,市场压力占主导地位,AI公司争相实现盈利。“我认为2025年将是代理系统最终进入主流的一年,”OpenAI的新任首席产品官Kevin Weil在新闻发布会上说,“如果我们做得好,这将带我们进入一个真正可以花更多时间去做那些重要的事情,并且少一些盯着手机的时间的世界。”