新研究表明人工智能代理在网上疯狂运行，几乎没有什么护栏

去年，人工智能代理风靡一时。开放人工智能,谷歌, 和人择所有这些都推出了面向公众的代理，旨在承担人类交给他们的多步骤任务。上个月，一个名为的开源人工智能代理开爪由于其令人印象深刻的自主能力（以及主要的安全问题），它在网络上掀起了一场风暴。但我们并没有真正了解人工智能代理运营的规模，以及所有的讨论是否与实际部署相匹配。麻省理工学院计算机科学和人工智能实验室 (CSAIL) 着手通过最近发布的 2025 年人工智能代理指数来解决这个问题，该指数让我们第一次真正了解人工智能代理在野外的规模和操作。

研究人员发现，在过去一年左右的时间里，人们对人工智能代理的兴趣无疑猛增。2025 年提及“AI 代理”或“代理 AI”的研究论文数量比 2020 年至 2024 年的总数增加了一倍多，麦肯锡的一项调查发现，62% 的公司表示他们的组织至少正在试验人工智能代理。

带着这些兴趣，研究人员将注意力集中在三个不同类别的 30 个著名人工智能代理上：基于聊天的选项，如 ChatGPT Agent 和 Claude Code；以及基于聊天的选项，如 ChatGPT Agent 和 Claude Code；基于浏览器的机器人，例如 Perplexity Comet 和 ChatGPT Atlas；以及 Microsoft 365 Copilot 和 ServiceNow Agent 等企业选项。虽然研究人员没有提供关于网络上部署了多少人工智能代理的确切数字，但他们确实提供了大量关于它们如何运行的见解，而这在很大程度上没有安全网。

麻省理工学院 CSAIL 放大镜下的 30 个人工智能代理中，只有一半包含已发布的安全或信任框架，例如Anthropic 的负责任的扩展政策,OpenAI 的准备框架, 或Microsoft 负责任的 AI 标准。三分之一的代理商没有任何安全框架文档，三分之五的代理商没有合规标准。当你考虑到所审查的 30 个系统中有 13 个表现出机构的前沿水平时，这就令人不安了，这意味着它们可以在很大程度上无需人工监督地跨扩展任务序列运行。浏览器代理尤其倾向于以更高的自主权进行操作。这将包括类似的事情Google 最近推出了人工智能“Autobrowse”它可以通过导航不同的网站并利用用户信息来完成多步骤任务，例如代表您登录网站。

让代理自由浏览且几乎没有护栏的问题之一是，他们的活动与人类行为几乎无法区分，而且他们几乎无法消除可能发生的任何混乱。研究人员发现，30 个代理中有 21 个没有向最终用户或第三方透露他们是人工智能代理而不是人类用户。这导致大多数人工智能代理活动被误认为是人类流量。麻省理工学院发现，只有七个代理发布了稳定的用户代理 (UA) 字符串和 IP 地址范围以进行验证。几乎同样多的人明确使用类似 Chrome 的 UA 字符串和住宅/本地 IP 上下文来使他们的流量请求显得更加人性化，从而使网站几乎不可能区分真实流量和机器人行为。

对于一些人工智能代理来说，这实际上是一个有市场的功能。研究人员发现，开源 AI 代理 BrowserUse 向用户推销自己，声称可以绕过反机器人系统，像人类一样进行浏览。超过一半的测试机器人没有提供有关如何处理 robots.txt 文件（放置在网站根目录中的文本文件，用于指导网络爬虫如何与网站交互）、用于验证人流量的验证码或网站 API 的具体文档。困惑甚至表明代理代表用户行事不应受到抓取限制因为它们的功能就像人类助手一样。”

事实上，这些代理在野外没有太多保护，这意味着存在真正的漏洞威胁。安全评估和披露缺乏标准化，导致许多代理可能容易受到诸如及时注射，其中人工智能代理发现隐藏的恶意提示，可能会使其破坏其安全协议。根据麻省理工学院的数据，30 名特工中有 9 名没有针对潜在有害行为的防护措施的记录。几乎所有代理商均未披露内部安全测试结果，30 家代理商中有 23 家未提供第三方安全测试信息。

只有四个代理（ChatGPT Agent、OpenAI Codex、Claude Code 和 Gemini 2.5）提供了特定于代理的系统卡，这意味着安全评估是根据代理的实际运行方式而定制的，而不仅仅是底层模型。但 OpenAI 和 Google 等前沿实验室提供了更多关于“存在和行为一致性风险”的文档，但缺乏有关日常活动中可能出现的安全漏洞类型的详细信息，研究人员将这种习惯称为“安全清洗”，他们将其描述为发布高级别安全和道德框架，同时仅选择性地披露严格评估风险所需的经验证据。

至少出现了一些解决麻省理工学院研究人员提出的担忧的动力。早在 12 月，OpenAI 和 Anthropic（以及其他公司）联手，宣布成立基金会创建人工智能代理的开发标准。但人工智能代理指数显示了代理人工智能操作的透明度差距有多大。人工智能代理充斥着网络和工作场所，以惊人的自主权和最少的监督来运作。目前几乎没有迹象表明安全性会很快达到一定规模。

OC

新研究表明人工智能代理在网上疯狂运行，几乎没有什么护栏

关于《新研究表明人工智能代理在网上疯狂运行，几乎没有什么护栏》的评论

发表评论

摘要

相关新闻

相关讨论