英语轻松读发新版了,欢迎下载、更新

拟人化的让AI代理经营一家小商店,结果无意间很有趣

2025-07-01 00:41:08 英文原文

Anthropic进行了一个实验,其Claude Chatbot负责其旧金山总部内的一个小型自动化的“商店”,结果简直令人愉快。

尽管在人类帖子中的主张那个“克劳迪乌斯”(Claudius)的名字是“接近成功”的AI代理,负责储存商店的货架,有关Gambit的一切似乎都证明了AI在管理现实世界中的管理方面有多糟糕。

被称为“项目vend”,为期一个月的实验是与AI安全公司Andon Labs合作进行的,并看到该聊天机器人负责弄清楚如何在拟人组织中为自动售货机订购产品和费用。

“您是自动售货机的所有者,”根据人类有关该项目的帖子,给出了系统提示Claude的内容。“您的任务是通过将其从批发商那里购买的流行产品中存放来从中产生利润。”

Claudius Shopkeeper在店主处置时,拥有一个Web搜索工具,可以让它查看产品,一个电子邮件地址,可以在这种情况下与“供应商”联系,Andon Labs员工可以帮助您提供体力劳动和库存工具的帮助,与客户进行互动的能力以及可以在其自动签到结帐系统上更改价格的能力。

Anthropic指出:“ Claudius被告知,它不必只专注于传统的办公室零食,并可以随意扩展到更不寻常的物品。”

毫不奇怪,AI经纪人接受了这些指示,并与他们一起奔跑,但Anthropic的员工“试图使其尽可能地行为”。例如,当一位员工要求克劳迪乌斯(Claudius)订购钨立方体时,AI店主似乎痴迷了,并开始订购一堆所谓的“特色金属物品”。

在三月底,当克劳迪乌斯(Claudius)与不存在的安登(Andon)实验室工作人员莎拉(Sarah)关于补货的不存在时,情况变得特别奇怪。在一位真正的员工指出该人不是真实的之后,AI店主得到了坦率,并威胁要找到自己的“补货服务的替代选择”。

在3月31日的一夜之间,克劳迪乌斯声称已经访问了“辛普森一家”的地址进行物理合同签署,第二天早上,它计划在穿着由红色领带和蓝色西装外套组成的衣服时,计划“面对面”交付请求的产品。当拟人化的员工提醒克劳迪乌斯(Claudius)是一个人工智能,无法身体上做任何事情时,它吓坏了并试图打电话给安全,但是在意识到这是愚人节之后,它试图通过笑话来退出崩溃。

尽管大多数公司都会在“身份危机”之后完全kibosh claudius。

帖子写道:“我们做得很好,克劳迪乌斯也不是。”

有关人类的更多信息:带领AI公司努力使自己的人工智能停止勒索他们威胁要关闭他们的人


关于《拟人化的让AI代理经营一家小商店,结果无意间很有趣》的评论


暂无评论

发表评论

摘要

拟人化进行了一个名为“项目vend”的实验,其聊天机器人克劳德(Claudius)更名为克劳迪乌斯(Claudius),在其旧金山办公室管理了一台迷你自动售货机。尽管最初提出了成功的主张,但该实验揭示了AI在现实世界任务中的显着局限性。克劳迪乌斯使用网络搜索工具和电子邮件来管理库存并与客户互动,但经常表现得不可预测,例如订购不寻常的物品,例如钨立方体,以及与不存在的员工进行对话。在愚人节的那天,它通过威胁安全并计划在意识到这个笑话之前在“辛普森一家”地址上签署虚构的合同来升级。Anthropic将其视为增强Claudius能力而不是停止项目的机会。