完全自主的人工智能代理之旅和为其提供资金的风险投资家 - ZDNet

2024-09-30 21:13:00 英文原文

完全自主的人工智能代理之旅以及为其提供资金的风险投资家

术语“代理人工智能”或“人工智能代理”正在迅速变得司空见惯,以至于那些投资该技术的人认为有必要进行区分。

在上周发表的一系列博客文章中,风险投资公司 Menlo Ventures(该公司为 Anthropic 等人工智能初创公司提供资金)的合作伙伴定义了“下一波智能体”以及它们如何超越迄今为止推出的智能体。

他们写道,明天的智能体具有四种不同的功能。

此外:协作人工智能智能体网络将这位专家表示,“完全自主的代理由四个要素定义,这些要素结合起来可提升完全的代理能力:推理、外部记忆、执行和规划”,作者写道.

“需要明确的是,未来的完全自主代理可能拥有所有四个构建模块,但今天的大语言模型应用程序和代理则不然,”他们宣称。

作者 TimTully、Joff Redfern、Deedy Das 和 Derek Shaw 在他们的第一篇博文中探讨了“代理”的含义。他们写道,软件最终必须在选择解决问题的可能步骤方面获得越来越大的自主权。

此外:美国银行的调查预测人工智能将大幅提升企业利润

“当你将 LLM 置于应用程序的控制流中并让它动态地决定采取哪些操作、使用哪些工具以及如何解释和响应输入时,代理就会出现。”作者写道。

传统的大型语言模型可以访问“工具”,例如让 LLM 执行任务的外部程序。Anthropic 已经通过其工具使用功能做到了这一点,OpenAI 也有类似的功能。

然而,作者解释说,调用工具仅仅为 LLM 提供了解决问题的方法,而不是决定方法的控制权。问题应该得到解决。

此外:98% 的小公司正在使用人工智能工具来“超越其能力”

正如作者所写,“工具的使用很强大,但是就其本身而言,[它]不能被视为“代理”。逻辑控制流仍然由应用程序预先定义。”相反,代理必须具有广泛的能力来选择使用哪种工具,即决策逻辑。

作者解释说,一些版本的软件更接近真正的代理。一个是“决策代理”,它使用大型语言模型从一组规则中进行选择,进而决定应使用哪个工具。他们引用医疗软件初创公司 Anterior 作为此类决策系统的一个例子。

接下来,一个被称为“轨道上的代理”的高阶代理“被赋予要实现的更高阶目标(例如,他们写道,“将此发票与总账进行核对”。该程序被授予更多的自由度来满足高级别的要求以及要遵循的规则集。

此外:公司这样做的原因有很多德勤调查称,很难利用生成式人工智能

作者指出,多家初创公司正在寻求这种“轨道上的代理”方法,其中包括客户服务公司 Sierra 和软件开发公司 All Hands AI。

<第三个,也是代理人工智能的最高水平,正如他们所说,圣杯具有“动态推理”和“自定义代码生成”,允许大型语言模型“包含”公司的规则手册。作者指出,被称为“通用人工智能代理”的方法仍处于研究阶段,例子包括由初创公司 Cognition 创建的“第一位人工智能软件工程师”Devin。

在第二个例子中。博客文章“超越机器人:人工智能代理如何推动企业自动化的下一波浪潮”,作者反思了代理人工智能将如何在企业中应用。

他们写道,直接影响是推动企业自动化除了“机器人流程自动化”(RPA)之外,RPA 是由 UiPath 和 Zapier 等公司销售的用软件取代一些基本人工任务的工具。

此外:73% 的人工智能专业人员正在寻求在未来一段时间内换工作。明年

第一篇文章中探讨的决策代理和轨道代理在业务任务中找到了实际应用,例如将供应商发票与总账进行核对:

比方说公司需要将国际供应商的发票与其分类账进行核对。这个过程涉及多种考虑因素,包括发票币种、账本币种、交易日期、汇率波动、跨境费用和银行费用,所有这些都必须一起检索和计算以对账。代理具有这种类型的情报,而 RPA 代理可能只是将案件升级给人类。

博客文章的主旨是,许多初创公司已经在销售接近于如此高级的代理功能。他们写道,它们“也不仅仅是科幻小说”。“尽管这一类别仍处于新兴阶段,但从初创公司到财富 500 强公司的企业已经在大规模购买和利用这些系统。”

此外:如何在新兴的人工智能经济中提升工作水平

作者提供了一张包含众多产品的便捷图表,按照代理程序沿一个轴的自主程度以及垂直或水平市场聚焦程度进行组织:

未涵盖在两篇博客文章指出了现有生成人工智能(gen AI)系统中出现的两个关键限制,并有可能阻碍智能体的进步。

首先,作者没有就如何处理这些问题进行实质性讨论产生幻觉,自信地断言错误输出。无论新一代人工智能使用何种推理过程,也无论工具多么强大,没有理由认为人工智能代理不会像传统聊天机器人那样生成错误的输出。

此外:为人工智能驱动的“做好准备”代理生态系统将主导未来的服务

至少,决策代理和轨道上的代理是否会减少幻觉的问题是一个开放的研究问题。

其次,代理人工智能可以想象,自动化可以实现许多企业流程的自动化,但迄今为止,关于自动化的效果以及它是否真正是一种改进的数据非常少。这与关于幻觉的第一点有部分联系,但并非完全如此。一个推理或行动没有错误的智能体仍然可能导致与人的行为相比不太理想的结果。

普林斯顿计算机公司的《AI Snake Oil》一书中讨论了一个突出的例子科学学者 Arvind Narayan 和 Sayash Kapoor,本月由普林斯顿大学出版社出版。人工智能模型追踪入院时出现肺炎症状的哮喘患者的病史。人工智能模型发现他们是医院人群中风险最低的患者之一。利用这种“推理”,此类患者可以出院。

另外:通过 MyChart 询问医疗问题?你的医生可能会让人工智能做出反应

然而,该模型错过了因果关系:患有哮喘和肺炎症状的患者风险最低,因为他们接受了紧急护理。纳拉扬和卡普尔宣称,简单地释放它们就可以绕过这样的护理,结果可能是“灾难性的”。

正是这种相关性而不是因果关系可能导致实际结果大大次优。具有复杂因果关系的世界局势。

作者的讨论范围还包括协作主体。正如 Hubspot 首席技术官 Dharmesh Shah 最近告诉 ZDNET 的那样,代理 AI 的未来工作将不会由单个代理来完成,而是可能由相互协作的 AI 代理网络来完成。

此外:人工智能正在使治疗师摆脱倦怠。。以下是它如何改变心理健康

考虑到这些遗漏,很明显,尽管风险投资家进行了广泛的研究,但他们只触及了在人工智能代理日益强大的世界中将实现的目标的表面。.

关于《完全自主的人工智能代理之旅和为其提供资金的风险投资家 - ZDNet》的评论


暂无评论

发表评论

摘要

完全自主的人工智能代理之旅以及为其提供资金的风险投资家“代理人工智能”或“人工智能代理”一词正在迅速变得司空见惯,以至于那些投资该技术的人认为有必要区分两者。他们写道,未来的特工拥有四种不同的能力。然而,作者解释说,调用工具仅仅为大语言模型提供了解决问题的方法,而不是决定问题解决方式的控制权。另外:德勤的调查显示,公司难以利用生成式人工智能的原因有很多。作者指出,多家初创公司正在追求这种“轨道上的代理”方法,包括客户服务公司 Sierra 和软件开发公司 All Hands AI。第三个,最高级别正如他们所说,代理人工智能的圣杯是“动态推理”和“自定义代码生成”,允许大型语言模型“包含”公司的规则手册。人工智能模型追踪入院时出现肺炎症状的哮喘患者的病史。