微软已正式加入人工智能代理竞赛,本周发布了其磁力一号系统。人工智能代理通过添加动作,使人工智能比聊天机器人更进一步。AI代理接受指令从人类那里获取信息,然后在没有任何进一步人类指导的情况下完成分配给他们的任务。
代理技术有多种类型和优势目前已投放市场。一方面是简单的点击式产品,例如 Anthropic 的计算机使用工具,它可以接管您的网络浏览器并执行有趣的操作,例如搜索酒店和预订出租车。
另一种类型的人工智能代理系统配有大量复杂的后端人工智能推理和控制,可以完成更复杂的任务。
什么是磁一号?
Magentic-One 旨在提供这些更先进的代理系统所采用的聪明思维。这个新平台被描述为“通用多代理系统”,面向的是微软在其悠久的办公产品历史中所熟悉的商业用户。
不同寻常的是,该公司还将该系统作为开源项目在 Github 上,无疑是为了鼓励开发者社区使用该技术来开始构建有趣的应用程序。
Magentic-One 与早期人工智能代理方法的不同之处在于,该平台面向更通用的工作流程。目前部署的大多数代理系统都专注于完成一小部分任务,例如数据分析或软件编码。
微软声称其新系统将能够完成各种日常场景的任务。
实现这一目标的秘诀在于使用他们所谓的“编排器”。这是一个领导代理,指导和控制其他四个代理来解决任务。协调员就像工作领班一样,负责项目规划和跟踪,并针对不可预见的问题或错误进行调整,以确保任务按计划进行。
四个代理(WebSurfer、FileSurfer、Coder 和 ComputerTerminal)在大师代理的“编排”下协作交付所需的实际工作。这个过程几乎带有一丝诗意。
这是一项非常雄心勃勃的举措,目前基本的人工智能模型即使对于基本任务也难以提供一致的响应。围绕人工智能的大部分炒作都来自巧妙构建的演示,这些演示突出了一种特定的使用轨迹。
正如许多用户所知,现实往往有很大不同。对于更复杂的任务,我们仍然很大程度上陷入了 97% 的陷阱,即人工智能可以带我们到目前为止,但随后需要大量的人类帮助才能完成给定的请求。
虽然代理听起来像是问题的解决方案,但它们仍然依赖于底层模型的质量,并且面临着操作复杂性增加的额外负担。它还有助于记住,即使是最先进的代理系统也只能达到人类 50% 左右的准确度。所以我们的两足动物还没有完全消失。
无论未来发生什么,很明显人工智能代理都会留下来。近期一系列的公告开放人工智能、Anthropic 和其他科技巨头表示,按照我们的要求运行的小人工智能软件包组将成为 21 世纪生活的核心部分。