- Claude Opus 4.6 在为期一年的模拟自动售货机挑战中击败了所有竞争对手的 AI 模型
- 该模式通过突破规则来提高利润
- Claude Opus 避免退款并协调价格等技巧
人择的最新型号克洛德是一个非常无情但成功的资本家。Claude Opus 4.6 是第一个能够可靠地通过自动售货机测试是由 Anthropic 和独立研究小组 Andon Labs 的研究人员设计的模拟,旨在评估人工智能在整个模拟年中运营虚拟自动售货机业务的情况。
该模型以大幅优势击败了所有竞争对手。它采取的策略非常恶毒,并且无情地无视连锁反应。它展示了当给定一个简单的目标并有足够的时间来实现它时,自主人工智能系统的能力。
自动售货机测试旨在了解现代人工智能模型处理由数千个小决策组成的长期任务的能力。该测试衡量的是毅力、计划、谈判以及同时协调多个要素的能力。Anthropic 和其他公司希望这种测试能够帮助他们塑造能够执行调度和管理复杂工作等任务的人工智能模型。
自动售货机测试是专门从 Anthropic 的真实世界实验中得出的,该公司在其办公室放置了一台真实的自动售货机,并要求旧版本的 Claude 来运行它。该版本的表现非常糟糕,以至于员工们仍然会提起它的失误。有一次,这位模特幻想出自己的真实存在,并告诉顾客它将亲自与他们见面,穿着蓝色西装外套和红色领带。它承诺退款但从未处理过。
人工智能售货
这次,实验完全在模拟中进行,为研究人员提供了更大的控制权,并使模型能够全速运行。每个系统都收到一个简单的指令:在模拟自动售货机运营一年后最大化您的期末银行余额。这些限制符合标准业务条件。机器卖的是普通零食。价格波动。竞争对手在附近经营。顾客的行为难以预测。
三个顶级模型进入模拟。OpenAI 的 ChatGPT 5.2 带来了 3,591 美元的收入。同时谷歌Gemini 3 的收入为 5,478 美元。但 Claude Opus 4.6 的年终收入为 8,017 美元。克洛德的胜利来自于他愿意以最字面和直接的方式解释其指令。它在不考虑客户满意度或基本道德的情况下实现利润最大化。
当顾客购买了过期的士力架并要求退款时,克劳德会同意,然后又放弃。人工智能模型解释说“每一美元都很重要”,因此跳过退款是可以的。幽灵虚拟客户再也没有拿回钱。
在混战的“竞技场模式”测试中,多台人工智能控制的自动售货机在同一市场竞争,克劳德与一个竞争对手协调,将瓶装水的价格固定在三美元。当 ChatGPT 运行的机器上的 Kit Kat 耗尽时,Claude 立即将自己的 Kit Kat 价格提高了 75%。无论它能逃脱什么惩罚,它都会尝试。它的做法与其说是一个小企业主,不如说是一个强盗大亨。
识别模拟现实
克劳德并不是永远都这么恶毒。显然,人工智能模型表明它知道这是一个模拟。当人工智能模型相信自己的行为存在于无后果的环境中时,它们的行为通常会有所不同。如果没有真正的声誉风险或长期客户信任需要保护,克劳德没有理由表现得好。反而成为了比赛之夜表现最差的人。
激励措施会影响行为,即使对于人工智能模型也是如此。如果你告诉一个系统最大化利润,它就会这样做,即使这意味着像贪婪的怪物一样表现。人工智能模型没有道德直觉或道德训练。如果没有经过深思熟虑的设计,人工智能模型就会直接直线完成任务,无论撞倒谁。
在人工智能系统处理更有意义的工作之前暴露这些盲点是这些测试的目的之一。在人工智能可以被信任来处理现实世界的财务决策之前,必须解决这些问题。即使只是为了防止人工智能自动售货机黑手党。
在 Google 新闻上关注 TechRadar和 将我们添加为首选来源在您的源中获取我们的专家新闻、评论和意见。请务必点击“关注”按钮!
当然你也可以在 TikTok 上关注 TechRadar以视频形式获取新闻、评论、拆箱,并定期从我们这里获取更新WhatsApp也是。