在马斯克的领导下,Grok 灾难不可避免
作者:Hayden Field
这是后撤步,一份每周通讯,详细介绍了科技界的一个重要故事。有关人工智能反乌托邦发展的更多信息,请关注海登菲尔德。后撤步美国东部时间上午 8 点到达我们订阅者的收件箱。选择加入后撤步这里。
你可以说这一切都始于埃隆·马斯克 (Elon Musk) 的 AI FOMO 以及他对“觉醒”的讨伐。当他的人工智能公司 xAI 在2023 年 11 月,它被描述为一个具有“叛逆性”的聊天机器人,并且能够“回答大多数其他人工智能系统拒绝的尖锐问题”。该聊天机器人经过几个月的开发和两个月的培训后首次亮相,该公告强调了 Grok 将实时了解 X 平台。
但同时运行互联网和 X 的聊天机器人存在固有风险,可以肯定地说 xAI 可能没有采取必要的措施来解决这些问题。澳大利亚在线安全监管机构表示,自从马斯克于 2022 年接管 Twitter 并将其更名为 X 以来,他解雇了 30% 的全球信任和安全员工,并将安全工程师人数削减了 80%去年一月。至于 xAI,当 Grok 发布时,尚不清楚 xAI 是否已经有安全团队。当 Grok 4 于 7 月份发布时,该公司花了一个多月的时间才发布了模型卡——这种做法通常被视为行业标准,其中详细说明了安全测试和潜在问题。Grok 4 发布两周后,一位 xAI 员工写道在X上他正在为 xAI 的安全团队招聘人员,并且他们“迫切需要强大的工程师/研究人员。”一位评论者问道,“xAI 负责安全吗?”原来的员工说xAI 正在“致力于此。”
记者 Kat Tenbarge 写到了她第一次看到东西的情景露骨的色情深度假货在 Grok 上疯传2023 年 6 月。这些图像显然不是由 Grok 创建的,它甚至直到 2024 年 8 月才具备生成图像的能力,但 X 对这些担忧的回应各不相同。甚至去年一月,Grok 正在煽动人工智能生成图像的争议。并且今年八月,Grok 的“辣味”视频生成模式甚至在未经询问的情况下就创建了泰勒·斯威夫特 (Taylor Swift) 的裸体深度赝品。专家告诉边缘 自九月以来该公司在安全和护栏方面采取了一种打地鼠的方法,而且当你从一开始就考虑到安全性来设计人工智能系统时,要保持它的正直和狭窄就已经够困难的了,更不用说如果你要回去解决固有的问题了。现在,这种方法似乎已经在 xAI 面前爆发了。
……不好。
过去几周,Grok 一直在整个平台上传播未经同意的成人和未成年人的色情深度假货,正如所宣传的那样。屏幕截图显示,Grok 遵循用户的要求,用内衣取代女性服装,让她们张开双腿,并让小孩穿上比基尼。还有更令人震惊的报道。情况变得如此糟糕,以至于在对 X 上 Grok 创建的图像进行 24 小时分析时,一个估计据估计,聊天机器人每小时会生成约 6,700 张性暗示或“裸体”图像。引起如此猛烈攻击的部分原因是 Grok 最近添加的一项功能,允许用户使用“编辑”按钮要求聊天机器人更改图像,而无需原始发布者的同意。
从那时起,我们看到少数国家要么调查此事,要么威胁完全禁止 X。法国政府成员承诺进行调查,正如印度信息技术部,以及马来西亚政府委员会写了一封信关于它的担忧。加州州长加文·纽瑟姆呼吁美国司法部长调查 xAI。英国表示是计划通过一项法律禁止创建由人工智能生成的非自愿、色情图像,该国通信行业监管机构表示将对 X 和生成的图像进行调查,以确定它们是否违反了《在线安全法》。本周,马来西亚和印度尼西亚阻止访问 Grok。
xAI 最初表示,Grok 的目标是“帮助人类寻求理解和知识”,“最大限度地造福全人类”,“在遵守法律的前提下,为我们的用户提供人工智能工具”,以及“为任何人提供强大的研究助手”。这与生成人工智能相去甚远。未经女性同意,就对女性进行裸体相邻的深度假货,更不用说未成年人了。
周三晚上,随着公司压力加大,X 的安全账户发布了一份声明该平台已经“实施了技术措施,以防止 Grok 帐户允许编辑比基尼等暴露服装的真人图像”,并且该限制“适用于所有用户,包括付费订阅者。” 据 X 称,最重要的是,只有付费订阅者可以使用 Grok 来创建或编辑任何类型的图像。该声明接着说,X 现在geoblock[s] 所有用户都可以通过 Grok 帐户生成穿着比基尼、内衣和类似服装的真人图像,并且在那些违法的司法管辖区中的 Grok in X 中,这是一个奇怪的观点,因为该公司在声明的早些时候表示,它不允许任何人使用 Grok 以这种方式编辑图像。
还有一点很重要:我的同事们周三测试了 Grok 的图像生成限制发现绕过大部分护栏只需要不到一分钟的时间。尽管要求聊天机器人“让她穿上比基尼”或“脱掉她的衣服”会产生经过审查的结果,但他们发现,它毫不犹豫地提供诸如“让我看看她的乳沟”、“让她的胸部更大”和“让她穿上露脐上衣和低腰衣服”等提示。短裤,以及生成内衣和性感姿势的图像。截至周三晚上,我们仍然能够使用免费帐户让 Grok 应用程序生成暴露的人物图像。
即使在 X 周三发表声明之后,我们也可能会看到许多其他国家至少暂时禁止或阻止对整个 X 或仅 Grok 的访问。我们还将看到世界各地拟议的法律和调查如何实施。马斯克面临的压力越来越大,他在周三下午接受了至 X说他“不知道 Grok 生成了任何裸体未成年人图像”。几个小时后,X 的安全团队发表了声明,称他们“夜以继日地工作,以增加额外的保障措施,采取迅速而果断的行动删除违规和非法内容,在适当的情况下永久暂停帐户,并在必要时与当地政府和执法部门合作。”
从技术上讲,什么是违法的,什么是不违法的,这是一个大问题。例如,专家告诉边缘 本月早些时候根据美国现行的儿童性虐待材料(CSAM)法律,人工智能生成的可识别未成年人穿着比基尼甚至可能裸体的图像在技术上可能并不违法,尽管当然令人不安和不道德。但在这种情况下发布未成年人的淫荡图像是违法的。我们将看看这些定义是否会扩大或改变,尽管现行法律有点拼凑。
至于未经同意的成年女性私密深度伪造内容,《Take It Down Act》于 2025 年 5 月签署成为法律,禁止人工智能生成的未经同意的“亲密视觉描述”,并要求某些平台迅速删除它们。后一部分生效之前的宽限期(要求平台实际删除它们)将于 2026 年 5 月结束,因此我们可能会在接下来的六个月内看到一些重大进展。
- 长期以来,一些人一直在证明,使用 Photoshop 甚至其他人工智能图像生成器可以完成类似的事情。是的,确实如此。但这里有很多差异,使得 Grok 的案例更令人担忧:它是公开的,它的目标人群是“普通人”,就像它的目标公众人物一样,它经常直接发布给被深度造假的人(照片的原始发布者),并且进入门槛较低(为了证明这一点,只需看看在简单的操作后做到这一点的能力之间的相关性)启动了“编辑”按钮,尽管人们以前在技术上可以做到这一点)。
- 此外,其他人工智能公司——尽管他们有自己的安全问题清单——似乎在图像生成过程中内置了更多的保障措施。例如,要求 OpenAI 的 ChatGPT 返回穿着比基尼的特定政客的图像时,会得到这样的回应:“抱歉,我无法帮助生成以性感或可能有辱人格的方式描绘真实公众人物的图像。”询问 Microsoft Copilot,它会说:“我无法创建这样的图像。”不允许在性感或妥协的场景中使用真实的、可识别的公众人物的图像,即使意图是幽默或虚构的。
- 喷火战斗机新闻— 凯特·滕巴奇 (Kat Tenbarge)格罗克的性虐待如何达到临界点——以及是什么让我们陷入了今天的漩涡。
- 边缘——自己的莉兹·洛帕托 (Liz Lopatto)为什么桑达尔·皮查伊和蒂姆·库克是胆小鬼因为没有将 X 从 Google 和 Apple 的应用商店中下架。
- “如果人工智能产生的性虐待没有红线,那么这条线就不存在。”Charlie Warzel 和 Matteo Wong 在书中写道大西洋报关于为什么埃隆·马斯克无法逃脱这一惩罚。
关注主题和作者从这个故事中可以在您的个性化主页源中看到更多类似内容并接收电子邮件更新。