OC

Knowledge OS
鹦鹉螺口语
Omnigent 简介:用于组合、控制和共享代理的元工具
2026-06-13 15:27:23 · 英文原文

Omnigent 简介:用于组合、控制和共享代理的元工具

在 Databricks,我们广泛使用和构建代理,从大规模编码到像 Genie 这样的运输代理产品。但尽管特工的能力已经变得更好,但与他们合作却感觉很笨拙。作为用户,我们经常同时打开 4-5 个代理(编码代理、Gemini 搜索等),并花时间在它们与 Docs、Slack 和其他协作工具之间复制粘贴文本。作为代理构建者,我们正在跑步机上通过结合最新的工具、SDK 和模型来改进我们的代理。问题在于,LLM 功能被封装到代理工具中,而这些工具具有不同的接口,这使得组合或交换它们变得困难。

所以我们建造了无所不能:一个元框架,位于您已经使用的代理(Claude Code、Codex、Pi 或自定义代理)之上,并使它们成为更丰富的系统的可互操作部分。Omnigent 针对单一线束无法解决的问题:它添加了组合多个代理、使用高级策略控制它们以及与队友实时协作的简单方法。

我们相信人们很快就会通过这个新的层面与代理合作,即元线束。这就是为什么今天我们要开源Apache 2.0 下的 Omnigent。

Omnigent 架构:运行程序使用统一的 API 将任何代理包装在沙盒会话中。服务器提供策略和共享,并通过终端、应用程序和 Web API 公开每个会话。

为什么要构建元线束?

在 Databricks,我们很早就在 5000 多名成员工程团队中采用了编码代理,并为客户构建了数千个代理。这次经历让我们确信代理工程的前沿正在上升一个水平。最佳结果不再来自单个线束中的单个模型:哈维通过为开源工作模型提供一个可以调用的前沿顾问,在质量和成本方面击败前沿模型,人择建立了其研究产品作为协调并行子代理的主要代理,以及我们自己的精灵使用不同的法学硕士进行规划、搜索和代码生成。工程师们也在改变他们的工作方式:他们不是一次提示一个代理,而是设计循环驱动整个代理团队。

这些模式跨越多个工具、模型和人员,但每个工具只理解自己的会话。为了组合代理、管理它们并与其他人一起工作,您需要在安全带之上添加一层。Omnigent 就是该层,它提供:

  • 组成。无需重写代码即可组合多个模型、工具和技术,并通过一行更改在 Claude Code、Codex、Pi 和您自己的代理之间切换。 
  • 控制。有状态的上下文策略可以跟踪代理操作并强制执行护栏,例如元线束层的成本预算和权限,而不是通过提示。
  • 合作。通过 URL 共享实时座席会话并一起审阅其中的文件,以便团队成员可以实时一起审阅、评论和指导座席。

Omnigent 的工作原理

Omnigent 在命令行代理和代理 SDK 之上引入了一个通用接口,让您可以轻松组合和互换它们,然后重点解决线束停止时的共同问题。关键的见解是,无论每个代理在内部如何利用对其 LLM 的调用,用户的界面都是相同的:消息和文件输入、文本流和工具调用。因此,我们构建了一个通用 API,它包装了基于终端的编码代理(Claude Code、Codex、Pi 等)和 SDK(OpenAI Agents、Claude Agents SDK 等)。

在此界面之上,当前版本的 Omnigent 添加了以下关键功能:

  • 实时协作:您可以邀请其他人查看您的代理会话,对其工作区中的文件进行评论,甚至发送命令,因此您的会话和工作目录成为您协作的主要场所。
  • 同一代理的多个接口:将 Claude Code 等代理连接到 Omnigent 服务器后,您可以通过 Web、移动设备、Mac OS 本机应用程序或 API 访问它。
  • 云执行在您自己的计算机或托管沙箱提供商(例如莫代尔代托纳,在密封环境中安全协作。
  • 上下文安全策略:Omingent 的安全策略超越了编码代理的简单“允许 X/拒绝 Y”,可以跟踪每个会话的动态状态并做出更明智的决策。例如,您可以说代理从 npm 下载新包后,它应该需要人工批准才能进行 git Push,或者它应该只能写入它创建的文档,而不是任何文档。
  • 成本政策:我们动态跟踪的事情之一是每个课程的 LLM 成本。例如,您可以要求 Omnigent 暂停某个代理,并在其每花费 100 美元后要求继续。
  • 强大的操作系统沙箱:在 Omnigent 中,我们的安全团队提供了一个灵活的操作系统沙箱,能够灵活地锁定操作系统访问以及拦截和转换网络要求(例如,不要让代理看到您的 GitHub 安全令牌,而是仅根据批准的请求将其注入出口代理中)。
  • 多线束创作:将自定义代理指定为 YAML,并通过一行更改将其跨线束移植,或者在同一代理中使用不同线束组合子代理。

然而,这些功能只是元框架层可以完成的工作的表面,我们希望很快能从我们的团队和开源社区看到更多的想法。我们路线图上的一些项目包括元线束级别的自动优化盖帕,代理内基于代码的自省类似于内存ExRLM、Omnigent Server MCP(以便代理可以在您的会话中工作)以及更多工具。我们还使 Omnigent 能够轻松部署在各种基础设施上,包括 Fly.io、Railway、Modal 和 Daytona 沙盒以及许多 LLM 提供商,并且我们欢迎提供更多集成的补丁。

A Meta-Harness to Combine, Control and Share Your Age

与代理合作的新层

我们行业中许多最大的转变都来自于转向新的抽象层:例如,虽然工程师过去常常管理单个流程和服务器,但现在他们可以通过 Kubernetes 和 Terraform 等云系统管理整个车队。

我们认为今天的特工们也处于同一时刻。每个安全带都是自己的孤岛,有自己的环境、自己的控件和自己的运行方式,当您切换工具时,它们都不会保留。此外,许多问题本质上是跨线束的,包括组合、安全性和协作。元安全带将您的工作提升到任何单一安全带之上,因此无论运行哪个代理或模型,您的会话、策略和技能都会伴随着您。随着该领域的发展,模型和线束将不断变化;您工作的图层不必如此。

我们正在公开构建该层,我们希望您与我们一起构建它。

尝试一下

Omnigent 今天在 alpha 版本中开源。 

关于《Omnigent 简介:用于组合、控制和共享代理的元工具》的评论

暂无评论

发表评论

摘要

Databricks 推出了 Omnigent,这是一种元工具,旨在集成和增强多个 AI 代理以实现更好的互操作性。Omnigent 通过提供统一的 API、实现实时协作、高级策略控制以及在 Claude Code 和 Codex 等各种 AI 模型之间轻松切换,解决了与组合不同代理界面相关的问题。它支持云执行、安全策略、成本管理和强大的操作系统沙箱。该项目旨在建立一个新的抽象层,以便与跨不同平台的代理一起工作,并在 Apache 2.0 下开源。