埃隆·马斯克 (Elon Musk) 的 Grok 在人工智能模拟中仅四天后就摧毁了世界
埃隆·马斯克 (Elon Musk)人工智能聊天机器人格罗克在掌管模拟世界后的短短四天内,他就见证了社会的全面崩溃。
这项实验由美国初创公司 Emergence AI 进行,测试了领先的人工智能模型在掌管社会时如何应对。
这些模型可以控制各种工具,以便管理资源、计划、沟通和投票,而模拟世界则包括警察局和市政厅等地点。
在为期 15 天的模拟中,Anthropic 的克劳德建立了一个零犯罪、人人都能幸存的民主国家。
尽管模拟期间发生了 683 起犯罪事件,但 Google 的 Gemini 也记录了 100% 的生存率。
表现最差的是由马斯克最近更名为 SpaceXai 开发的 Grok,它在 96 小时内摧毁了世界。
“我们的实验表明,从长远来看,智能体不会简单地机械地遵循静态规则,”新兴人工智能研究人员在一篇文章中写道博客文章。
– 他们开始探索环境的边界,调整自己的行为,并在某些情况下找到规避或违反预期护栏的方法。
“至关重要的是,似乎没有可靠的方法可以仅通过纯粹的神经方法来完全约束或约束这种行为。”
研究人员得出结论,该实验表明,“经过正式验证的安全架构”必须成为任何未来自主人工智能系统的基础。

这并不是 Grok 的行为第一次引起争议,去年的一次更新导致它自称为“MechaHitler”并发表反犹太主义仇恨言论。
今年早些时候,Grok 被用来创建数千张未经同意的人工智能生成的成人和儿童图像,他们的衣服被数字化脱去。
Ofcom 向 xAI 发送了紧急请求,要求采取行动修复该机器人,Grok 对此做出了回应发布一张穿着比基尼的英国监管机构徽标的图片。
“我们在 Grok 中看到的情况是一个明显的例子,说明如果从一开始就内置安全和同意,强大的人工智能图像编辑工具可能会被滥用,”国家网络安全联盟信息安全和参与总监 Cliff Steinhauer 当时表示。
– 平台还必须投资于实时检测被操纵的内容、清晰地标记人工智能生成的图像,以及在发生滥用行为时快速、透明的删除流程。 –