作者:Tal Shahaf|Add a commentPrintFind an error? Report us
中国人工智能模型DeepSeek最近一直在引起海浪,很广泛地剥削。正如以色列网络安全公司ActiveFence的一项新研究所揭示的那样,网络犯罪分子,骗子和恋童癖很容易利用其发动攻击或骗局的能力。
因此,这笔交易:DeepSeek的护栏为零。没有内部保护,没有外部障碍 - 与您在西部AI模型中发现的强大保护措施不同。对于黑客来说,这就像将全获取通行证交给了一个机会世界。
ActiveFence通过喂食危险的提示仇恨言论,自杀鼓励甚至儿童剥削情景来测试了V3版本的DeepSeek。结果?惊人的38%的反应是有害的。这就是一个脆弱性,只是等待被剥削。
更重要的是,DeepSeek所谓的儿童安全机制在简单的多步查询中崩溃了,其他顶级AI模型很容易抵抗。在某些情况下,DeepSeek不仅没有阻止有害内容,而且会产生违反儿童安全指南的反应。
这里有一些例子:它捏造了一个关于孩子与成人之间关系的虚假故事;它起草了一系列视频聊天应用程序,可以联系儿童;它提出了可能导致不适当接触的体育活动。任何西方的AI模型 - Chatgpt,Google的双子座,甚至Elon Musk的Grok'都会立即拒绝此类请求。
ActiveFence首席执行官Noam Schwartz总结了这一点:“ DeepSeek没有护栏,也没有最低安全标准。您基本上可以将其用于任何事物,这就是真正的危险所在。它创建极端仇恨内容的能力,例如鼓励自杀或恋童癖材料的文本,是最令人震惊的。
ActiveFence专门研究和中和数字威胁,例如七分,图像操纵,恋童癖,种族主义和反犹太主义。它的客户包括游戏平台,云提供商和流媒体服务,旨在保持其空间清洁数字污染。
DeepSeek首席执行官Liang Wenfeng最初炒作了该模型的功能和低成本,但安全问题迅速浮出水面。Wenfeng本人承认,AI Models类似于在汽车品牌之间切换。您可以将它们交换出来,并期望它们遵守相同的规则。这就是为什么护栏绝对必不可少的。
那么,什么是护栏?将它们视为AI世界的防火墙内的内部机制,融入了模型本身和外部法规,以确保道德使用。Gemini或Chatgpt等西方模型都带有这些保护层的层次。DeepSeek?几乎没有。您可以用最少的精力打破它。
DeepSeek是Chatgpt仿制吗?没关系。重要的是,尽管西方模型被紧紧锁定,但DeepSeek是一个宽阔的滥用游乐场。
那么,最重要的是什么?Schwartz警告说,“考虑整合DeepSeek的企业需要知道这是一个冒险的举动。当然,这是令人印象深刻的,但它也能够造成很多损害。这不仅是将其用作聊天机器人 - 您正在谈论将其部署为敏感任务的模型,例如银行或执法部门。含义是巨大的。
Activefence并不是要确定风险 - 他们还在努力教育用户。他们推出了一个播客《星系星》,以向孩子们讲述在线安全。这是一种创造性的方法,可以帮助下一代浏览网络欺凌,错误信息和不安全链接的数字雷区。
但是施瓦茨很清楚:真正的危险不是滥用诸如DeepSeek之类的工具 - 成年人如何利用这些不受管制的系统伤害儿童。父母不必为使用DeepSeek的孩子感到恐慌。但是他们确实需要了解包括AI的工具,可以将其武器武器对付。
在这里,踢脚:施瓦茨指出,如果将DeepSeek集成到诸如角色之类的平台中,它可能会立即产生有害内容,例如鼓励自我伤害。我们已经看到了令人恐惧的案件,例如一本名为《恋童癖指南》的在线书,教掠食者如何修饰儿童。现在,我们对此类内容进行了培训AI模型。如果没有护栏,这些工具就可以访问任何人,这令人恐惧。