微软推出 Magentic-One——一款可以浏览网页和编写代码的人工智能代理

2024-11-13 15:15:52 英文原文

作者:Nigel PowellSocial Links NavigationTech Journalist

magentic-one
(图片来源:微软)

微软已正式加入人工智能代理竞赛,本周发布了其磁力一号系统。人工智能代理通过添加动作,使人工智能比聊天机器人更进一步。AI代理接受指令从人类那里获取信息,然后在没有任何进一步人类指导的情况下完成分配给他们的任务。

代理技术有多种类型和优势目前已投放市场。一方面是简单的点击式产品,例如 Anthropic 的计算机使用工具,它可以接管您的网络浏览器并执行有趣的操作,例如搜索酒店和预订出租车。

另一种类型的人工智能代理系统配有大量复杂的后端人工智能推理和控制,可以完成更复杂的任务。

什么是磁一号?

Magentic-One 旨在提供这些更先进的代理系统所采用的聪明思维。这个新平台被描述为“通用多代理系统”,面向的是微软在其悠久的办公产品历史中所熟悉的商业用户。

不同寻常的是,该公司还将该系统作为开源项目在 Github 上,无疑是为了鼓励开发者社区使用该技术来开始构建有趣的应用程序。

人工智能的未来是代理的。人工智能系统正在从对话发展到完成任务——这就是我们期望人工智能的大部分价值发挥的地方。

Magentic-One 与早期人工智能代理方法的不同之处在于,该平台面向更通用的工作流程。目前部署的大多数代理系统都专注于完成一小部分任务,例如数据分析或软件编码。

微软声称其新系统将能够完成各种日常场景的任务。

在《汤姆指南》中,我们的专家编辑致力于为您带来最好的新闻、评论和指南,帮助您随时了解情况并保持领先地位!

实现这一目标的秘诀在于使用他们所谓的“编排器”。这是一个领导代理,指导和控制其他四个代理来解决任务。协调员就像工作领班一样,负责项目规划和跟踪,并针对不可预见的问题或错误进行调整,以确保任务按计划进行。

四个代理(WebSurfer、FileSurfer、Coder 和 ComputerTerminal)在大师代理的“编排”下协作交付所需的实际工作。这个过程几乎带有一丝诗意。

这是一项非常雄心勃勃的举措,目前基本的人工智能模型即使对于基本任务也难以提供一致的响应。围绕人工智能的大部分炒作都来自巧妙构建的演示,这些演示突出了一种特定的使用轨迹。

正如许多用户所知,现实往往有很大不同。对于更复杂的任务,我们仍然很大程度上陷入了 97% 的陷阱,即人工智能可以带我们到目前为止,但随后需要大量的人类帮助才能完成给定的请求。

虽然代理听起来像是问题的解决方案,但它们仍然依赖于底层模型的质量,并且面临着操作复杂性增加的额外负担。它还有助于记住,即使是最先进的代理系统也只能达到人类 50% 左右的准确度。所以我们的两足动物还没有完全消失。

无论未来发生什么,很明显人工智能代理都会留下来。近期一系列的公告开放人工智能、Anthropic 和其他科技巨头表示,按照我们的要求运行的小人工智能软件包组将成为 21 世纪生活的核心部分。

汤姆指南的更多内容

Nigel Powell 是一位作家、专栏作家和顾问,在技术行业拥有 30 多年的经验。他在《星期日泰晤士报》上每周撰写《不要恐慌》技术专栏长达 16 年,并且是哈珀·柯林斯出版社出版的《星期日泰晤士报》计算机答案一书的作者。他曾是天空电视台地球村节目的技术评论员,也是英国广播公司第五广播电台“男士时刻”的定期撰稿人。

他拥有法学荣誉学位 (LLB) 和工商管理硕士学位 (MBA),他的工作使他成为软件、人工智能、安全、隐私、移动和其他技术创新领域的专家。Nigel 目前是住在伦敦西部,喜欢花时间冥想和听音乐。

关于《微软推出 Magentic-One——一款可以浏览网页和编写代码的人工智能代理》的评论


暂无评论

发表评论

摘要

微软推出Magentic-One,这是一款专为商业用户设计的先进人工智能代理系统。与更简单的点击工具不同,Magentic-One 采用复杂的后端推理和控制来处理各种场景中的复杂任务。该平台在 GitHub 上开源,并设有一个“Orchestrator”,领导四个专业代理(WebSurfer、FileSurfer、Coder、ComputerTerminal)协作完成任务。该举措旨在弥合人工智能演示与实际应用之间的差距,尽管它面临操作复杂性和模型质量限制方面的挑战。