OC

Knowledge OS
鹦鹉螺口语
谷歌在 OpenClaw 热潮中重组了浏览器代理团队
2026-03-19 18:00:00 · 英文原文

谷歌在 OpenClaw 热潮中重组了浏览器代理团队

作者:Maxwell Zeff

谷歌正在震动后面的团队水手计划,它的人工智能代理可以导航Chrome浏览器据《连线》报道,它可以代表用户完成任务。据两位知情人士透露,近几个月来,一些从事研究原型工作的谷歌实验室工作人员已转向更优先的项目。

谷歌发言人证实了这些变化,但表示在“水手计划”下开发的计算机使用功能将纳入该公司未来的代理战略中。谷歌已经将其中一些功能整合到其他代理产品中,包括最近推出的双子座特工,发言人补充道。

这一变化发生之际,谷歌和其他人工智能实验室正急于应对高能力智能体的崛起,例如开爪。虽然这些工具目前主要由开发人员使用,但硅谷相信它们很快就会为个人和企业提供通用助手。Nvidia 首席执行官黄仁勋 (Jensen Huang) 将这款热门工具比作代理计算机的新操作系统。“当今世界上的每家公司都需要制定 OpenClaw 战略,”他在本周早些时候的公司开发者大会上表示。

谷歌首席执行官桑达尔·皮查伊 (Sundar Pichai) 强调了 Project Mariner去年的 I/O 大会。当时,浏览器代理似乎是业界的下一个大赌注,OpenAI 和 Perplexity 推出了消费者代理,承诺为用户自动执行在线任务。代理可以像人类一样在网页上单击、滚动和填写表格。然而,这些产品的采用一直难以满足行业期望。

Perplexity 的 Comet 浏览器代理刚刚达到每周活跃用户 280 万2025 年 12 月。与此同时,据报道 OpenAI 的 ChatGPT Agent 崩溃了每周活跃用户少于 100 万最近几个月。与每周与 ChatGPT 交谈的数亿用户相比,浏览器代理的使用基本上相当于舍入误差。

城里的新特工

去年,人工智能世界的势头发生了巨大的转变,转向了 Claude Code 和 OpenClaw(其创建者被 OpenAI 聘用)等代理。与网络浏览代理不同,这些系统通过命令行控制计算机,这已被证明是完成任务的更可靠的方式。其中一些产品包括计算机使用以及其他代理能力。相比之下,浏览器代理现在作为独立产品似乎有些局限性。

人工智能技能提升平台 Workera 的首席执行官基安·卡坦福鲁什 (Kian Katanforoosh) 在斯坦福大学讲授人工智能,他表示,计算机使用代理尚未兴起的部分原因是它们的大量计算需求。大多数代理的工作原理是拍摄一系列网页屏幕截图,将其输入人工智能模型,然后根据他们所看到的内容采取行动。处理所有这些信息有时可能会很慢不可靠的

“Claude Code 和 OpenClaw 表明,使用终端实际上​​效率更高,因为终端是基于文本的,而法学硕士也是基于文本的,”Katanforoosh 说。– 达到相同结果可能需要减少 10 到 100 倍的步骤。 –

这并不是说浏览器代理没有改进,也不是说对计算机使用的研究已经走进了死胡同。

上个月,初创公司 Standard Intelligence 发布了一份计算机使用模型根据视频而不是屏幕截图进行训练。这家初创公司表示,它开发了一种视频编码器,可以将视频压缩到 AI 模型的上下文窗口中,据称其效率比以前的计算机使用模型高 50 倍。为了展示其人工智能模型的功能,这家初创公司将其连接到汽车、实时视频源和电脑键盘上。该模型能够短暂地在旧金山自动驾驶

关于《谷歌在 OpenClaw 热潮中重组了浏览器代理团队》的评论

暂无评论

发表评论

摘要

谷歌正在重组 Project Mariner 团队,这是一款专为浏览器导航和任务完成而设计的人工智能代理。参与该研究原型的谷歌实验室工作人员正在被重新分配到更高优先级的项目。谷歌证实了这些变化,但表示在 Project Mariner 下开发的功能将整合到未来的人工智能战略中,包括 Gemini Agent。这次重组是在 OpenClaw 等先进代理激增之后进行的,行业领导者强调了对此类技术的需求。尽管 Perplexity 和 OpenAI 等公司最初令人兴奋并推出了基于浏览器的代理,但用户采用率仍低于预期。专家认为,Claude Code 和 OpenClaw 等基于命令行的系统由于其基于文本的交互方法而更加高效,这与需要大量计算能力的浏览器代理的屏幕截图驱动方法形成鲜明对比。