作者:Edd Gent
尽管近年来人工智能大肆宣传,但该技术的颠覆性影响相当有限。专家表示,随着人工智能代理强行进入我们生活的各个方面,明年这种情况可能会发生变化。
自 2022 年底 ChatGPT 取得惊人成功以来,数十亿美元已涌入该领域人工智能产业随着初创公司和大型科技公司试图利用该技术无可争议的前景。
然而,尽管世界各地现在有数亿人经常使用人工智能聊天机器人,但事实证明,将它们用于生产性用途却变得更加困难。波士顿咨询集团最近的研究发现仅 26%已经尝试过人工智能的公司已经超越了概念验证,从技术中获得了真正的价值。
这可能是因为当前的技术迭代充其量只是一种副驾驶。它们可以帮助用户更有效地完成一些任务,但前提是密切监督和始终存在的错误风险。不过,人工智能行业的权威人士表示,这种情况可能即将发生变化,他们表示,自主人工智能代理有望在 2025 年迎来突破。
“技术第一次不仅仅是为人类提供工作工具,”Salesforce 首席执行官马克·贝尼奥夫 (Marc Benioff) 最近说道写在时间,他拥有的出版物。– 它提供智能、可扩展的数字劳动力,可以自主执行任务。代理无需等待人类输入,而是可以分析信息、做出决策并独立采取行动,并随时适应和学习。
所有 AI 代理的核心都是同一种大语言模型 (LLM),它为 ChatGPT 等服务提供支持。这使得人类可以通过语言与智能体进行交互,但算法也是一种– 推理引擎 –提出了解决任务的分步计划。
代理通常还可以访问与其应用程序相关的外部数据源(例如客户数据库或财务记录)以及可用于实现目标的软件工具。
目前,LLM 的推理能力有限,这限制了代理的部署位置。但随着 OpenAI 的 o1 和 DeepSeek 的 R1 等专业推理模型的出现,智能体有望很快变得更加强大。
主要参与者正在为这一承诺投入巨资。
10 月,微软揭晓副驾驶工作室,它允许公司构建能够执行处理客户查询和识别销售线索等任务的定制代理。同月,Salesforce推出 Agentforce 平台,这还允许客户创建自己的机器人。上个月,贝尼奥夫告诉TechCrunch他的目标是在一年内部署 10 亿特工。
领先的人工智能研究实验室也越来越关注代理。Anthropic 最近预览了其 Claude 3.5 Sonnet 模型的一个版本,该模型可以控制用户的计算机,Google 最近发布的 Gemini 2 经过训练,可以执行类似的任务。OpenAI 也计划推出代号为“Operator”的特工新年伊始。
初创公司也希望参与其中。根据 Pitchbook 的数据,以代理商为中心的企业的融资交易数量有所增加超过80%与去年同期相比。交易价值中位数也上涨了近 50%。
但对于特工突然出现在现场的速度存在一些怀疑。作为边缘笔记,人工智能公司已经投入数十亿美元用于研发几乎没有收入可展示,并且仍在寻找一款杀手级应用程序来证明其天价估值是合理的。实际考虑可能意味着进展比他们希望的要慢。
首先,这些模型仍然容易产生“幻觉”,即对查询生成不正确或误导性的响应。这对于聊天机器人来说已经是个问题了,但当它是一个能够独立行动的代理时,就更令人担忧了。
石英笔记这种风险可能会产生相当大的开销,因为公司必须实施多层安全措施来捕获错误。随着代理数量的增加,这可能会变得极其复杂,并且需要投资新平台,甚至需要“监护代理”来监控他们的活动。
代理商也可能很贵因为通过问题“推理”需要他们多次调用底层的法学硕士。无论是在法学硕士提供商身上花费的美元,还是托管自己模型的公司消耗的能源,这一数字很快就会增加。
尽管如此,许多业内人士预计 2025 年将是部署的转折点。
“我认为 2025 年代理系统将最终成为主流,”OpenAI 新任首席产品官 Kevin Weil 在公司年度开发日之前的新闻发布会上说道, 根据边缘。
德勤的 2025 年全球预测报告预测,在已经使用生成式人工智能的公司中,四分之一将启动人工智能代理的试点或概念验证,到 2027 年这一数字将增加到一半。下半年可能会在某些工作流程中全面采用代理。
其他人则更为乐观。红杉资本的康斯坦丁·布勒告诉彭博社到 2025 年,网络或“群”将会出现AI代理协同工作企业内部。Nvidia 生成式人工智能软件副总裁 Kari Briski 对此表示同意,并认为这将有必要出现人工智能协调者——本质上是监督和协调众多代理的人工智能管理者。
无论谁说得对,代理似乎都将成为 2025 年人工智能行业的主要关注点。如果它得到回报,到今年年底,工作世界可能会发生很大的变化。
图片来源: 加布里埃拉·克莱尔·马里诺在未飞溅
Edd 是一位居住在印度班加罗尔的自由科技作家。他的主要兴趣领域是工程、计算和生物学,特别关注三者之间的交叉点。