作者:Iain Martin
安全研究人员表示,作为生成式AI的主要在线存储库,Hugging Face托管了数千个包含可以篡改数据和窃取信息的隐藏代码的文件,包括用于支付AI和云运营商的令牌。
来自安全初创公司ProtectAI的研究人员,隐藏层以及Wiz几个月来一直警告黑客已经将“恶意模型”上传到Hugging Face的网站上,该网站现在托管了超过一百万个可供下载的模型。
“那些试图向您的系统植入恶意代码的老式特洛伊木马计算机病毒已经进化到了人工智能时代,”Protect AI的创始人兼首席执行官Ian Swanson表示。这家位于华盛顿州西雅图的初创公司在今年年初开始扫描Hugging Face时发现了超过3000个恶意文件。
根据斯旺森的说法,一些不良行为者甚至建立了假的Hugging Face个人资料,冒充Meta或其他科技公司,诱使不知情的人下载。对Hugging Face进行扫描发现了一些假冒Facebook、Visa、SpaceX和瑞典电信巨头爱立信等公司的虚假账户。
斯旺森表示,有一个假冒来自基因组检测初创公司23AndMe的模型在被发现之前已被下载了数千次。他警告说,当这个假的23AndMe模型被安装后,隐藏在其内部的恶意代码会悄悄搜寻AWS密码,这些密码可以用来盗取云计算机资源。在得知这一风险后,Hugging Face删除了该模型。
Hugging Face现已将其平台整合了ProtectAI的恶意代码扫描工具,在用户下载任何内容之前显示扫描结果。
公司告知福布斯它从2022年开始验证了像OpenAI和Nvidia这样的大公司的资料。在2021年11月,它开始扫描通常用于在平台上训练机器学习模型的文件中的不安全代码。“我们希望我们的工作与Protect AI的合作以及更多类似合作将有助于更好地信任机器学习模型,从而使分享和采用变得更加容易。”Hugging Face的CTO Julien Chaumond在一封电子邮件中说道。福布斯.
恶意模型带来的风险已经足够严重,足以引起美国网络安全和基础设施安全局以及加拿大和英国的安全机构联合发出警告。四月美国国家安全局(NSA)及其英国和加拿大 counterpart 警告企业扫描任何预训练模型以查找危险代码,然后仅在远离关键系统的环境中运行这些模型。注意:这里的"counterpart"如果特指机构对应部门的话,在中文里通常也会保留为“ counterparts”,所以保持不变。
针对Hugging Face的黑客通常会向开发者从该网站下载的代码中注入恶意指令,在不知情的目标运行模型时利用这些指令劫持模型。“这些都是经典的攻击,但它们只是隐藏在模型内部,”Swanson说。“没有人会知道这个模型正在做这些不法的事情,而且几乎不可能追溯到这一点。”
Hugging Face上一次估值为45亿美元时筹集资金2亿3500万美元2023年8月。这家由Clément Delangue、Julien Chaumond和Thomas Wolf于八年前创立的初创公司,在2018年从运营一个面向青少年的聊天机器人应用程序转向了一个机器学习平台。迄今为止,该公司已筹集了4亿美元,并被称为AI研究人员的GitHub。
“长期以来,人工智能是研究人员的领域,安全措施相对基础,”肖蒙德说。“随着我们的受欢迎程度增长,那些可能想针对人工智能社区的潜在不良行为者数量也在增加。”
更新:Protect AI澄清它发现的恶意模型数量以千计,而不是以万计。
福布斯价值20亿美元的表情符号:Hugging Face欲成为机器学习革命的启动平台 By 福布斯人工智能创业公司Hugging Face以40亿美元估值筹集新风投资金截至
福布斯AI独角兽Hugging Face收购了一家初创公司,以便最终托管数亿个模型 By福布斯“就像维基百科和ChatGPT有了一个孩子”:揭秘这家热门AI初创公司如何挑战谷歌的地位截至