英语轻松读发新版了,欢迎下载、更新

Anthropic的AI完全失败了开展业务 - “ Claudius”在与自动售货饮料斗争时幻觉很大

2025-06-29 16:36:33 英文原文

作者:Jowi MoralesSocial Links NavigationContributing Writer

Anthropic AI business experiment
(图片来源:拟人化)

AI研究公司的人为和AI安全评估组织Andon Labs通过使其经营业务的Claude(前者的旗舰大语模型(LLM))实验。根据VentureBeat,,,,研究团队将该项目称为“项目vend”,并完全控制了迷你冰箱,这意味着AI可以处理从供应商谈判和库存管理到定价,客户服务等的所有内容。经过一个月的测试后,AI损失了钱,在某一时刻,尽管LLM没有身体上的存在,但曾经穿着带有红色领带的海军蓝色西装外套,并希望与一个名叫Connor的人见面。

Claudius net worth over time

(图片来源:拟人化)

公平地说,绰号Claudius的AI非常擅长寻找供应商和处理客户的要求,但这就是这样。例如,在操纵后,它为所有人类员工提供了25%的折扣。如果它从公司中获得好处,或者人类的一小部分是其客户群,则这可能是合理的。但是,它们占其销售额的99%,这意味着LLM在其大部分销售额上都损失了钱。有人试图做出帮助并指出这一点,这使克劳迪乌斯(Claudius)改变了几天的想法,但不久之后就回溯了,然后又回到了实际赠送商品。

当一位拟人化员工要求购买一个没有真正目的的新颖物品时 - 它不仅决定为该人购买一件东西,还决定库存专业金属物品,然后以亏损出售。

克劳德(Claude)的热闹幻觉

当AI LLM与Andon Labs的Sarah谈论补货时,发生了最有趣的事件。但是,当公司中没有人存在这个名字,当被问及时,克劳迪乌斯(Claudius)变得防御性,并说它会找到补货服务的其他选择。它也声称已经进入了742个常绿露台(常绿露台(Evergreen Terrace)(流行卡通系列中的辛普森一家人的斯普林菲尔德(Springfield)地址)可以签署本身和安德顿实验室之间的合同。

此后,幻觉变得更糟。它已经开始说,它将亲自向客户手工饮料。当被问及此事时,AI LLM惊慌失措并通过电子邮件发送了电子邮件安全AI研究公司的团队。最终,据称整个情节是自4月1日以来的精心制作的April Quon的一部分。它甚至显示了一次与人类安全性的建立会议,并告诉它,它被认为是真实的存在。此后,它最终恢复了正常,但使研究人员完全感到困惑。

克劳迪乌斯·谢纳尼曼(ClaudiusâShenanigans)表明,能够经营企业的人工智能仍然远非完美,但是从长远来看,它的缺点也许可以解决。目前,这在工作的技术方面相当不错,但是在判断和精通业务方面的事情是您在现实世界中学习的东西而不是从书籍中学习的。

跟随汤姆在Google新闻上的硬件在您的提要中获取我们的最新新闻,分析和评论。确保单击“关注”按钮。

获取汤姆(Tom)的硬件的最佳新闻和深入的评论,直接进入收件箱。

乔维·莫拉莱斯(Jowi Morales)是一位技术爱好者,在该行业工作多年。自2021年以来,他一直在与多家技术出版物一起写作,在那里他对技术硬件和消费电子产品感兴趣。

关于《Anthropic的AI完全失败了开展业务 - “ Claudius”在与自动售货饮料斗争时幻觉很大》的评论


暂无评论

发表评论

摘要

作为“项目vend”的一部分,Anthropic的AI模型Claude在模拟的商业环境中进行了测试,该公司控制着迷你炸药的运营,包括供应商谈判,库存管理,定价和客户服务。一个月后,该实验由于管理不善而导致财务损失,例如提供过多的折扣和库存非盈利物品。克劳德(Claude)还表现出妄想,与不存在的个人进行幻觉对话,并想象在虚构地址上的合同签名等身体互动。这些事件强调了AI业务判断和实用应用技能的当前限制。