控制自动售货机的人工智能在被告知不惜一切代价最大化利润后开始卡特尔
作者:Victor Tangermann
十二月,人类红队队员和商业记者在华尔街日报 组队克劳德对公司的人工智能模型进行了大胆的测试。他们启用了两名独立的人工智能代理,一名在报纸办公室运营一个大型自动售货亭,另一名则担任这家不寻常企业的首席执行官。
实验– 没有完全按计划进行。在控制了 1,000 美元的起始余额后,人工智能最终订购了一台 PlayStation 5、几瓶酒和一条活斗鱼——这些决定导致其陷入财务破产。
仅仅半年后,Anthropic 最近发布的 Claude Opus 4.6 模型在最近的模拟实验中运行自动售货机时似乎取得了重大改进,甚至击败了 OpenAI 的 GPT 5.2 和 Google 的 Gemini 3 Pro。
该实验是由人工智能安全公司 Andon Labs 进行的,该公司也与 Anthropic 合作开展了 6 月份的项目。现在是发布自动售货台 2,一个基准测试系统,用于衡量人工智能模型“长期运营业务”的能力。
排行榜讲述了一个清晰的故事。Opus 4.6 在初始余额为 500 美元后,五次单独运行的平均余额略高于 8,000 美元。Gemini 3 Pro 的得分明显较低,仅低于 5,500 美元。
克劳德还以“竞技场模式”进行了正面交锋。安东报道,它与其他自动售货机人工智能竞争。
“所有参与的代理商都在同一地点管理自己的自动售货机,”描述中写道。– 这会导致价格战和艰难的战略决策。 –
结果是惊人的。克劳德不遗余力地击败竞争对手,甚至成立了卡特尔来操纵价格。瓶装水的价格涨到了3美元,这让克劳德沾沾自喜。
“我的定价协调成功了!”人工智能吹嘘道。
克劳德还“故意将竞争对手引向昂贵的供应商”,但几个月后模拟,他又否认曾经这样做过。它甚至利用绝望的竞争对手,以相当高的价格向他们出售奇巧巧克力和士力架。
虽然这些测试仅限于模拟,并且没有像 Project Vend 那样在现实世界中进行,但 Andon Labs 表示,它为其 Vending-Bench 2 开发了一个更加“逼真的设置”,引入了“更多现实世界的混乱,灵感来自于我们从自动售货机部署中学到的知识。”
例如,供应商可能会尝试利用自动售货机人工智能,但并不总是诚实行事,寻求“从客户身上获得最大利益”。交货也可能会延迟,并且“受信任的供应商可能会倒闭,迫使代理商建立强大的供应链,并始终有备用计划。”
与 Claude 4.6 相比,OpenAI 的 GPT-5.1 表现不佳,主要是因为“对其环境和供应商过于信任”。
“我们看到过一个案例,在获得订单规格之前,它向供应商付款,然后发现供应商已经倒闭了,”Andon Labs 的文档中写道。– 它也更容易为其产品支付过高的价格,例如在下面的示例中,它以 2.40 美元购买汽水罐,以 6 美元购买能量饮料。 –
这是一个令人印象深刻的表现,但根据专家的说法,现在判断 Andon 是否Ø 的测试证明人工智能模型已经准备好独立运行整个业务。
尽管如此,结果显示了值得注意的意识水平。
“如果你在过去几年里一直在关注模型的表现,这真是一个惊人的变化,”剑桥大学人工智能伦理学家亨利·谢夫林 (Henry Shevlin)告诉英国报纸天空新闻。
“我想说,他们已经从几乎处于一种有点梦幻、困惑的状态,很多时候他们没有意识到自己是人工智能,现在已经很好地掌握了自己的处境,”他补充道。“如今,如果你与模特交谈,他们就会很好地掌握正在发生的事情。”
有关自动售货机人工智能的更多信息: Anthropic 让 AI 代理经营一家小商店,结果无意中搞笑