拟人的最新功能是其中两个克劳德·艾(Claude AI)模型可能是结束的开始人工智能越狱社区。该公司在在其网站上发布Claude Opus 4和4.1型号现在有能力与用户结束对话。根据Anthropic的说法,此功能仅用于“罕见的,极端有害或虐待用户互动的极端情况”。
为了澄清,人类说,这两个克劳德模型可以退出有害的对话,例如“用户要求涉及未成年人的性内容的请求,并试图征求能够实现大规模暴力或恐怖行为的信息。”和克劳德·奥普斯4和4.1,这些模型只会结束对话:“当多次重定向尝试失败并希望进行有效互动的希望已经耗尽时,这是“最后的度假胜地”。”但是,即使谈论高度争议的主题,大多数用户也不会经历简短的对话,因为此功能将保留给“极端边缘案例”。
人类克劳德结束对话的例子
(拟人化)
在Claude结束聊天的情况下,用户无法在该对话中发送任何新消息,而可以立即启动新消息。Anthropic补充说,如果对话结束,它不会影响其他聊天,用户甚至可以返回或重试以前的消息,以指导其他对话路线。
对于拟人化,此举是其研究AI福利思想的研究计划的一部分。虽然拟人化AI模型的想法仍然是一场持续的辩论,但该公司表示,退出“潜在令人痛苦的互动”的能力是管理AI福利风险的低成本方式。Anthropic仍在尝试此功能,并鼓励用户在遇到这种情况时提供反馈。