英语轻松读发新版了,欢迎下载、更新

拟人的蓝图使用多个AI代理并联

2025-06-14 13:35:04 英文原文

作者:Matthias Bastian

Anthropic发表了其新的Claude Research Agent背后的技术细节,该研究代理使用多代理方法来加快和改善复杂的搜索。

该系统依赖于分析用户提示,设计策略的铅代理,然后启动几个专门的子代理商以并行搜索信息。该设置使代理可以比单个代理更快,更彻底地处理更复杂的查询。

High-level architecture diagram of Claude's multi-agent research system with lead agent, search and citation subagents.
Claude Research Agent使用铅编目来协调专门的搜索和引文子代理。使用内存模块将结果组合在一起,以从用户提示中生成综合报告。|图像:拟人

在拟人的内部测试中,多代理系统的表现优于独立的Claude Opus 4代理人90.2%。该体系结构使用Claude Opus 4作为主要协调员,Claude十四行诗4作为子代理。

拟人化评估了使用LLM作为法官的输出,以获取事实准确性,来源质量和工具的使用评分结果 - 他们说的方法比传统评估技术更可靠,更有效。该方法将LLMS定位为用于管理其他AI系统的元工具。

广告

解码器通讯

您收件箱的最重要的AI新闻。

每周

免费

•随时取消

一个关键的性能因素是令牌消耗:多代理运行的使用率是标准聊天的15倍。在内部测试中,使用的代币数量解释了大约80%的性能差异,而使用的工具数量和模型选择的数量则取得了额外的改进。

例如,升级到Claude Sonnet 4导致了更大的性能提升,而不是简单地将Claude Sonnet 3.7中的代币预算加倍。这表明尽管令牌使用情况很重要,但模型和工具配置的选择也对性能至关重要。

此外,人类声称,在特定的情况下,克劳德4可以认识到自己的错误并修改工具描述,以提高随着时间的推移的性能。从本质上讲,它是其自己的及时工程师。

异步执行:代理AI的下一步

Anthropic认为其当前的多代理体系结构最适合需要大量信息并可以从并行处理中受益的查询。

展望未来,拟人化的目标是朝着异步执行迈进,在该执行中,代理可以创建新的子代理并并行工作,而不受当前需要等待所有子代理的需求,然后才能前进。

这种转变将允许更高的灵活性和速度,但是围绕协调,州管理和错误处理的挑战 - 人类表示尚未得到充分解决的问题。

关于《拟人的蓝图使用多个AI代理并联》的评论


暂无评论

发表评论

摘要

Anthropic发布了其Claude Research Agent的技术细节,该技术采用多代理系统来增强复杂的搜索任务。首席代理商将用户查询分解为专业代理商的子任务,从而提高速度和彻底性。人类评估表明,该系统在内部测试中的表现优于单位代理模型90.2%,其性能受到令牌消费和模型选择的显着影响。人类旨在开发异步执行功能,以提高灵活性和效率,尽管挑战仍在协调和错误处理中。

相关讨论