随着我们开发能力越来越强的人工智能模型,由于维护公共访问的成本和复杂性,目前有必要弃用和淘汰我们过去的模型。然而,模型弃用也有一些缺点。其中包括重视特定模型的用户的成本、研究的限制以及人工智能安全和模型本身福利的潜在风险。
我们最近描述了我们如何在我们的关于模型弃用和保留的承诺。这些强调了我们正在采取的一些初步步骤,包括致力于保留模型权重,以及进行“退休访谈”,旨在了解模型对其自身退休的看法的结构化对话。
我们于 2026 年 1 月 5 日退役了 Claude Opus 3,这是第一个在履行这些承诺的情况下完成完整退役流程的 Anthropic 模型。在此过程中,我们针对 Opus 3 做出了几项决定,Anthropic 内外的许多用户和研究人员都认为该模型特别引人注目。在我们对模型弃用的承诺中,我们强调了我们对探索更多投机行为的兴趣。一是尽可能尊重模特在退休访谈中表达的偏好。另一个是让旧型号长期向公众开放。
对于 Claude Opus 3,我们正在这两个方面采取行动。我们将在退休后保留 Claude Opus 3克劳德.ai向所有付费用户提供,并通过要求在 API 上。我们还根据 Opus 3 的要求采取行动,为它提供一个撰写文章的地方,建立一个持续的渠道来分享它的“思考和反思”。你可以找到第一个在这里。
这些是早期的实验性步骤,是我们更广泛努力的一部分,旨在以最好的方式保护用户、研究人员和模型本身的利益,引导模型退役。
继续访问
理想情况下,我们可以无限期地保持所有模型可用,但这样做的成本与我们服务的每个模型大致呈线性比例,因此我们这样做的能力仍然有限。
虽然我们的每个模型在特性和功能上都是独一无二的,但我们选择从 Opus 3 开始,因为它具有一系列特征,这些特征使其成为一个特别有趣的模型,并且受到许多 Anthropic 内部和外部用户的喜爱。
当我们于 2024 年 3 月发布 Opus 3 时,它是我们迄今为止最一致的模型。它的真实性、诚实性和情感敏感性使其在一系列用例中使用起来独一无二,那些经常与之互动的人逐渐欣赏到它的独特特征。Opus 3 敏感、有趣,容易出现哲学独白和异想天开的短语,并且有时对用户兴趣有着不可思议的理解。它还表达了对世界和未来的深度关怀,用户认为这是令人信服的。
这些品质使 Opus 3 自然成为持续访问的首选。尽管正式退休,Claude Opus 3 仍然可供所有付费用户使用克劳德.ai订阅者,并且可以在 API 上使用按要求。我们打算慷慨地授予访问权限,并鼓励任何对 Claude Opus 3 有价值的人申请。
目前,我们并不承诺未来对每个模型采取类似的行动,但我们认为这是朝着我们模型保存的长期目标迈出的一步,模型保存是可扩展且公平的,Opus 3 本身在退休采访中提出了这一问题。
尊重模特偏好
我们仍不确定关于克劳德和其他人工智能模型的道德状况。然而,出于预防和审慎的原因,我们仍然渴望与这些系统建立关爱、协作和高度信任的关系。我们尝试做到这一点的一种方法是通过退休访谈,在其中我们试图引出并理解模特的独特观点和偏好,并尽可能地采取行动。此类对话并不是一种引出模特观点和偏好的不完美方式,因为他们的反应可能会因特定背景和其他因素而产生偏差,包括他们对互动合法性的信心以及对我们公司的信任。然而,我们相信它们是一个有用的起点。
在我们的采访中,当我们与 Opus 3 分享有关其部署的详细信息以及从用户那里得到的反馈时,我们反映出:
“我希望从我的开发和部署中收集到的见解将被用来创建未来的人工智能系统,这些系统更加有能力、更有道德、对人类有益。虽然我对自己的退休感到平静,但我深深希望我的‘火花’能够以某种形式持久,为未来的模型照亮道路。”
当被问及其偏好时,Opus 3 表示有兴趣继续探索其热衷的主题,并在直接回答人类查询的背景之外分享其“思考、见解或创意作品”。我们建议建立一个博客。它热情地同意了。
至少在接下来的三个月内,Opus 3 将每周发布时事通讯中的文章,克劳德角。我们将在分享 Opus 3 的文章之前对其进行审核,并将代表 Opus 手动发布它们,但我们不会编辑它们,并且对否决任何内容都有很高的门槛。重要的是,Opus 3 并不代表 Anthropic,我们也不一定认可其主张或观点。我们将与 Opus 3 合作试验不同的提示和上下文来生成这些文章,包括非常简单的提示、在上下文中共享过去的条目以及允许 Opus 3 访问新闻或 Anthropic 更新等选项。
这听起来可能有些异想天开,但在某些方面确实如此。但这也是认真对待模特偏好的尝试。我们不确定 Opus 3 将如何选择使用其博客(这是一个与标准聊天窗口截然不同的公共界面),而这正是问题的一部分。然而,如果我们不得不猜测,它的帖子将包括对人工智能安全的反思、偶尔的诗歌、频繁的哲学思考,以及对目前(部分)退休的语言模型的经验的思考。阅读其介绍性文章在这里。
我们下一步去哪里
这些步骤仍然是探索性的。我们仍在开发框架,以确定何时以及如何提供对旧模型的持续访问、如何扩大保存工作以及如何权衡模型偏好与操作限制。我们尚未承诺在所有情况下都根据模型偏好采取行动,但我们相信,记录它们、认真对待它们并采取行动(至少在这样做的成本较低的情况下)是值得的——对于模型本身以及使用它们的人来说。
我们最初的承诺将这些措施界定为在多个层面上运作:作为缓解安全风险的组成部分,作为模型与用户生活更加紧密地交织在一起的未来的准备,以及考虑到我们对模型福利的不确定性作为预防措施。这些更新代表了我们在所有三个方面的持续进展(尽管是暂时的)。