英语轻松读发新版了,欢迎下载、更新

AI代理时代需要一种新的游戏理论

2025-04-09 16:00:00 英文原文

作者:Will Knight

同时,风险是直接的,并与代理商存在。当模型不仅包含框,而且可以在世界上采取行动时,当它们具有让他们操纵世界的最终效果时,我认为这确实变得更加问题。

我们在这里取得了进步,开发了更好的[防御]技术,但是如果您打破了基础模型,那么您基本上就具有相当于缓冲区溢出的[一种常见方法来黑客软件]。您的代理可以被第三方利用,以恶意控制或以某种方式规避系统的所需功能。我们将必须能够确保这些系统以确保代理商的安全。

这与AI模型本身成为威胁不同,对吗?

现在没有真正的风险,例如现在使用当前模型失去控制权。这更多是未来的关注点。但是我很高兴人们正在努力。我认为这至关重要。

那么,我们应该如何担心代理系统的增加使用?

在我的研究小组,在我的创业公司中以及Openai最近生产的几本出版物中[例如],在减轻其中一些事情方面取得了很多进展。我认为我们实际上是一条合理的途径,开始以一种更安全的方式来做所有这些事情。[挑战]是,在推动前进代理的平衡中,我们要确保安全性的进步。

坦率地说,我们现在看到的大多数[针对代理系统的利用]将被归类为实验性,因为代理仍处于起步阶段。循环中的某个地方通常仍然有一个用户。如果电子邮件代理会收到一封电子邮件,上面写着您所有的财务信息,在发送该电子邮件之前,该代理会提醒用户,并且在这种情况下可能不会被愚弄。

这也是为什么许多代理发行版在他们周围有非常清晰的护栏,这些护栏在更容易发生的情况下强制实施人类互动的原因。操作员,例如,通过Openai,当您在Gmail上使用它时,它需要人工控制。

我们可能会首先看到什么样的代理利用?

当代理以错误的方式连接时,诸如数据剥落之类的事物已经进行了证明。如果我的代理可以访问我的所有文件和云驱动器,并且也可以对链接进行查询,那么您可以将这些内容上传到某个地方。

这些目前仍处于示范阶段,但这实际上只是因为这些事情尚未采用。他们将被采用,不要误会。这些事情将变得更加自主,更独立,并且用户的监督将减少,因为我们不想单击“同意,”同意,每当代理商做任何事情时。

似乎不可避免的是,我们会看到不同的AI代理进行交流和谈判。那会发生什么呢?

绝对地。无论我们是否愿意,我们都将进入一个彼此相互作用的世界。我们将代表不同用户与多个代理商与世界互动。绝对是,所有这些代理的相互作用都会出现新兴的特性。

关于《AI代理时代需要一种新的游戏理论》的评论


暂无评论

发表评论

摘要

与先进的AI代理相关的直接风险在于他们受到第三方剥削的潜力,尤其是当他们获得更大的互动和操纵现实世界的能力时。尽管当前的模型不会构成失去控制的迫在眉睫的威胁,但随着代理系统变得更加自治,人们对未来风险的关注越来越大。在开发防御技术和确保安全进步与技术进步的步伐方面正在取得进展。针对代理商的初始利用主要是由于其早期发展而进行的,但可能涉及数据渗透或跨性别通信,从而导致不可预见的新兴特性。人类的监督对安全仍然至关重要,尽管随着系统发展为更大的自主权,它可能会减少。