独家:Anthropic 正在测试“Mythos”,这是其“有史以来开发的最强大的人工智能模型” |财富
作者:Beatrice Nolan
人工智能公司Anthropic正在开发, 该公司表示,并已开始对早期访问客户进行测试,这是一种比之前发布的任何模型都更强大的新人工智能模型数据泄露这揭示了模型的存在。
Anthropic 的一位发言人表示,新模型代表了人工智能性能的“一步改变”,并且是“我们迄今为止构建的最强大的模型”。该公司表示,该模型目前正在由“抢先体验的客户”进行试用。
模型的描述无意中存储在可公开访问的数据缓存中,并由财富。
周四晚上之前,在一个不安全且可公开搜索的数据存储中发布的一篇博客文章草稿称,新模型被称为 Claude Mythos,该公司认为它带来了前所未有的网络安全风险。
同样的不安全、可公开发现的文件揭示了计划在欧洲举行的、仅限受邀者参加的首席执行官峰会的细节,这是该公司向大型企业客户销售其人工智能模型的努力的一部分。
根据计算机和网络安全公司 LayerX Security 的高级人工智能安全研究员 Roy Paz 和剑桥大学网络安全研究员 Alexandre Pauwels 分别找到和审查的文件,人工智能实验室将这些材料(包括似乎宣布新模型的博客文章草稿)留在了一个不安全的公共数据湖中。
Pauwels 表示,总共似乎有近 3,000 条与 Anthropic 博客相关的资产,这些资产之前从未在该公司的新闻或研究网站上发布过,但可以在该数据缓存中公开访问。财富要求评估和审查材料。
得知数据泄露后财富周四,Anthropic 取消了公众搜索数据存储并从中检索文档的能力。
在一份声明中提供给财富,Anthropic 承认其内容管理系统配置中的“人为错误”导致博客文章草稿无法访问。它将留在不安全且可公开搜索的数据存储中的未发布材料描述为“考虑发布的内容的早期草稿”。
除了提到 Mythos 之外,博客文章草稿还讨论了一种新的人工智能模型,据称该模型将被称为 Capybara。Anthropic 在文件中表示:“Capybara”是新模型层的新名称:比我们的 Opus 模型更大、更智能,而 Opus 模型迄今为止是我们最强大的。Capybara 和 Mythos 似乎指的是相同的基础模型。
目前,Anthropic 销售的每种型号均具有三种不同尺寸:最大且功能最强大的型号版本为 Opus 品牌;虽然更快、更便宜,但功能较差,版本的品牌为 Sonnet;最小、最便宜、最快的称为俳句。然而,在博客文章中,Anthropic 将 Capybara 描述为一种新的模型,它比 Opus 更大、功能更强大,但也更昂贵。
“与我们之前的最佳模型 Claude Opus 4.6 相比,Capybara 在软件编码、学术推理和网络安全等测试中获得了更高的分数,”该公司在博客中表示。
该文件还表示,该公司已经完成了 Claude Mythos 的培训,博客文章草案将其描述为“迄今为止我们开发过的最强大的人工智能模型”。
在回答有关博客文章草稿的问题时,该公司承认培训和测试了新模型。“我们正在开发一种通用模型,在推理、编码和网络安全方面取得有意义的进步,”Anthropic 发言人表示。– 鉴于其强大的功能,我们正在慎重考虑如何发布它。按照整个行业的标准做法,我们正在与一小群早期访问客户合作来测试该模型。我们认为这个模型是一次重大变革,也是我们迄今为止构建的最强大的模型。”
该文件财富网络安全专家审查的内容包括网页的结构化数据,包括标题和发布日期,表明它是计划产品发布的一部分。它概述了该模型的谨慎推出策略,从一小群早期访问用户开始。博客草案指出,该模型的运行成本很高,而且尚未准备好全面发布。
重大的新网络安全风险
根据泄露的文件,新的人工智能模型带来了重大的网络安全风险。
– 在准备释放 Claude Capybara 时,我们希望格外谨慎,并了解其带来的风险,甚至超出我们在自己的测试中了解到的风险。该文件称,我们特别希望了解该模型在网络安全领域的潜在近期风险,并分享结果以帮助网络防御者做好准备。
Anthropic 似乎特别担心该模型的网络安全影响,并指出该系统“目前在网络能力方面远远领先于任何其他人工智能模型”,并且“它预示着即将到来的一波模型,这些模型可以利用远远超过防御者努力的方式利用漏洞。”换句话说,Anthropic 担心黑客可能会利用该模型进行大规模网络攻击。
该公司在博客草案中表示,由于存在这种风险,其模型的发布计划将重点关注网络防御者:“我们将在组织的早期访问中发布它,让他们在提高代码库的稳健性以应对即将到来的人工智能驱动的漏洞浪潮方面占据先机。”
Anthropic 和 OpenAI 的最新一代前沿模型已经跨越了一个门槛,两家公司表示,这带来了新的网络安全风险。2 月份,当 OpenAI 发布 GPT-5.3-Codex 时,该公司说这是它在其准备框架下第一个被归类为“高性能”的模型,用于执行与网络安全相关的任务,也是第一个经过直接训练来识别软件漏洞的模型。
与此同时,人类导航类似的风险同周发布了 Opus 4.6。该模型展示了发现生产代码库中以前未知的漏洞的能力,该公司承认这种能力具有双重用途,这意味着它既可以帮助黑客,也可以帮助网络安全防御者发现并关闭代码中的漏洞。
公司还拥有报道黑客组织,包括与中国政府有联系的组织,试图在现实世界的网络攻击中利用克劳德。在一个有记录的案例中,Anthropic 发现,一个中国国家资助的组织在该公司发现之前,已经使用克劳德代码开展了一场协调一致的活动,渗透到大约 30 个组织(包括科技公司、金融机构和政府机构)。在接下来的 10 天内,Anthropic 调查了整个操作范围,禁止了相关账户,并通知了受影响的组织。
专属行政静修处
据网络安全专业人士称,尚未公开信息的泄露似乎源于该公司内容管理系统(CMS)用户的错误,该系统是用于发布该公司公共博客的软件。
使用内容管理系统创建的数字资产默认设置为公开,并且通常在上传时分配一个可公开访问的 URL,除非用户明确更改设置以使这些资产保持私有。因此,大量缓存的图像、PDF 文件和音频文件似乎已通过现成的内容管理系统错误地发布到不安全且可公开访问的 URL。
Anthropic 在一份声明中承认财富“我们的外部 CMS 工具之一出现问题,导致草稿内容无法访问。”该公司将此问题归因于“人为错误”。
许多文档似乎被丢弃或未使用,用于过去的博客文章,例如图像、横幅和徽标。然而,有几份似乎是私人或内部文件。例如,一项资产的标题描述了员工的“育儿假”。
这些文件还包括一份 PDF 文件,其中包含有关即将在英国举行的欧洲公司首席执行官仅限受邀者参加的务虚会的信息,Anthropic 首席执行官达里奥·阿莫迪 (Dario Amodei) 表示: 将参加。其他与会者的名字并未列出,但被描述为欧洲最有影响力的商界领袖。
为期两天的静修被描述为一次“亲密聚会”,在英国乡村一座由 18 世纪庄园改建的酒店和水疗中心进行“深思熟虑的对话”。该文件称,与会者将听取立法者和政策制定者关于企业如何采用人工智能的看法,并体验克劳德未发布的功能。
人类发言人告诉财富该活动是我们去年举办的一系列活动的一部分。我们期待与欧洲商界领袖共同讨论人工智能的未来。”