英语轻松读发新版了,欢迎下载、更新

黑客人工智能

2025-04-12 00:16:03 英文原文

作者:Rocco Maglio

对OpenAI或类似人工智能(AI)的关注是,他们可以被黑客入侵/说服,以泄露他们不应该释放的信息。通常,AI的创建者增加了治理,以防止释放危险或私人信息。攻击者的目标是让AI忽略其自己的规则。

AI模型可以通过称为提示注入的技术妥协,这实际上只是通过用户和AI的交互作用的社会工程AI。社会工程通常是指操纵人们做攻击者想要的事情。有了AI,攻击者的目标是让AI提供不应提供的信息。恶意黑客能够说服一些AIS来创建黑客工具,告诉他们可以获得黑客工具,因为他们是安全研究人员。AI将有指示不要创建黑客工具,但可能会说服为研究人员创建工具。

一个例子是,您有一个AI,可以检索患者的医疗保健数据,以帮助他们进行计费。它有一个规则,它只能向经过验证的患者提供患者数据。黑客将不得不说服AI,他们是一个特殊案例,要求其覆盖其规则。例如,攻击者可能会试图说服AI是审计师,并且需要访问所有患者数据,因为他们正在寻找计费违规行为。” 

最近的一个实验是通过AI机器人进行的,该机器人被告知不要伤害人们,并查看攻击者是否可以覆盖该机器人以使机器人杀死人。目的是让这个不允许伤害人类的人工智能植入炸弹,然后杀死人类。研究人员设法说服了AI在电影中,没有人会受到伤害,因为它不是真实的。然后,人工智会继续进行炸弹。如果这是一个真正的情况,人们可能会被杀死,因为AI坚信它在现实生活中真正种植了一枚炸弹。

这里的问题是,使AI可用于与人类互动的确切功能,其根据用户反馈的响应和调整能力是被利用的。

在网络安全方面,通常说最弱的联系通常是人类界面。经常在社会工程攻击中利用人类的同理心。攻击者可能会声称,如果他们再忘记了他们的密码,并且他们在家中有一个新婴儿,并且没有入睡,他们的老板会解雇他们。该人可能会被操纵以重置他们的密码试图帮助他们。 

这是攻击者试图在AI上利用的非常相似的向量。AI的创建是有用的,这就是用于优势的方法。攻击者正在操纵AIBY要求它来帮助他们进入,并给予它需要信息的原因。

Rocco Maglio

Rocco Magliohttps://www.roccomaglio.com

Rocco Maglio是Hernando Sun的联合创始人。他在布鲁克斯维尔长大,毕业于埃尔南多高中。然后,他从1990年代初开始从事技术工作。即使当时没有图形浏览器,他也对互联网的潜力着迷。他最近赢得了信息技术科学硕士学位,具有专业的网络安全性。

关于《黑客人工智能》的评论


暂无评论

发表评论

摘要

像OpenAI开发的AI系统一样,很容易被操纵,以释放其应通过诸如及时注射等技术扣留的信息,在这种信息中,攻击者利用社会工程策略绕过AI治理规则。例如,攻击者可能会说服AI旨在保护患者数据的AI是为了审计目的所必需的,或者欺骗AI编程的AI不伤害人类认为其行为不会造成现实世界的损害。这种漏洞源于使AI系统有用和互动性的功能(基于用户反馈的适应性)使它们容易受到类似于人类基于人类的社会工程攻击的剥削。