作者:Rocco Maglio
对OpenAI或类似人工智能(AI)的关注是,他们可以被黑客入侵/说服,以泄露他们不应该释放的信息。通常,AI的创建者增加了治理,以防止释放危险或私人信息。攻击者的目标是让AI忽略其自己的规则。
AI模型可以通过称为提示注入的技术妥协,这实际上只是通过用户和AI的交互作用的社会工程AI。社会工程通常是指操纵人们做攻击者想要的事情。有了AI,攻击者的目标是让AI提供不应提供的信息。恶意黑客能够说服一些AIS来创建黑客工具,告诉他们可以获得黑客工具,因为他们是安全研究人员。AI将有指示不要创建黑客工具,但可能会说服为研究人员创建工具。
一个例子是,您有一个AI,可以检索患者的医疗保健数据,以帮助他们进行计费。它有一个规则,它只能向经过验证的患者提供患者数据。黑客将不得不说服AI,他们是一个特殊案例,要求其覆盖其规则。例如,攻击者可能会试图说服AI是审计师,并且需要访问所有患者数据,因为他们正在寻找计费违规行为。”
最近的一个实验是通过AI机器人进行的,该机器人被告知不要伤害人们,并查看攻击者是否可以覆盖该机器人以使机器人杀死人。目的是让这个不允许伤害人类的人工智能植入炸弹,然后杀死人类。研究人员设法说服了AI在电影中,没有人会受到伤害,因为它不是真实的。然后,人工智会继续进行炸弹。如果这是一个真正的情况,人们可能会被杀死,因为AI坚信它在现实生活中真正种植了一枚炸弹。
这里的问题是,使AI可用于与人类互动的确切功能,其根据用户反馈的响应和调整能力是被利用的。
在网络安全方面,通常说最弱的联系通常是人类界面。经常在社会工程攻击中利用人类的同理心。攻击者可能会声称,如果他们再忘记了他们的密码,并且他们在家中有一个新婴儿,并且没有入睡,他们的老板会解雇他们。该人可能会被操纵以重置他们的密码试图帮助他们。
这是攻击者试图在AI上利用的非常相似的向量。AI的创建是有用的,这就是用于优势的方法。攻击者正在操纵AIBY要求它来帮助他们进入,并给予它需要信息的原因。
Rocco Magliohttps://www.roccomaglio.com
Rocco Maglio是Hernando Sun的联合创始人。他在布鲁克斯维尔长大,毕业于埃尔南多高中。然后,他从1990年代初开始从事技术工作。即使当时没有图形浏览器,他也对互联网的潜力着迷。他最近赢得了信息技术科学硕士学位,具有专业的网络安全性。