苹果第三代基础型号解释 - 9to5Mac - OurCoders (我们程序员)

在 WWDC26 主题演讲中，Apple 宣布了第三代 Apple Foundation Models (AFM)，其中包括五个模型，其中一些是本地模型，一些是基于云的模型，其中一个模型位于运行 Nvidia 芯片的 Google 服务器中。以下是其运作方式的详细说明。

一些背景

当苹果首次发布其基础型号时2024年，该产品线包括一个具有大约 30 亿个参数的设备上语言模型，以及“一个更大的基于服务器的语言模型，可通过私有云计算使用并在 Apple 芯片服务器上运行”，该公司表示把它当时。

私有云计算是雄心勃勃的其目标是提供基于云的人工智能功能，同时保留用户对设备上处理所期望的相同隐私保证。

因此，将所有内容保留在内部至关重要。私有云计算在 Apple 数据中心的由 Apple 芯片驱动的服务器上运行。即便如此，其隐私保证可以由第三方安全研究人员独立验证。

然而，当苹果公司努力实现其人工智能愿景时，该公司合伙的与谷歌合作，使用 Gemini 作为其新人工智能工作的支柱，并在本周早些时候的 WWDC26 主题演讲中宣布了其结果。

Apple 的新基础型号

第三代AFM包括五种型号：AFM 3 核心和AFM 3 代码高级，它们是设备上的模型，以及原子力显微镜云,ADM 3 云（图片）, 和AFM 3 云专业版，它们是基于服务器的。ADM 3 Cloud（图像）中的 D 代表扩散，这是我们过去介绍过的一项技术这里。

除了 AFM 3 Cloud Pro 之外，所有其他型号都是为了在 Apple 芯片设备上运行而构建的。与此同时，AFM 3 Cloud Pro在 Google Cloud 托管的 NVIDIA GPU 上运行。

这在苹果之后成为可能扩展该公司表示，首次将其私有云计算架构引入第三方基础设施，同时保持苹果强大的安全和隐私保护。

至于型号本身，苹果公司对此进行了解释：

AFM 3 Core 是我们的下一代 30 亿参数密集模型，可提高质量。

AFM 3 Core Advanced，我们最强大的设备上模型。它本质上是多模式的，支持富有表现力的声音和更高精度的听写等有用的功能。这个包含 200 亿个参数的模型基于 Apple 的尖端研究而构建，采用稀疏架构，根据请求一次仅激活 1 到 40 亿个参数。AFM 3 Core Advanced 由我们最强大的 Apple 芯片系统解锁并优化。

AFM 3 Cloud，我们的服务器端主力，针对速度、效率和性能进行了优化。

ADM 3 Cloud（图像），用于图像生成和编辑，可解锁高级照片编辑工具、全新的图像游乐场等。

AFM 3 Cloud Pro 是我们最强大的基于服务器的模型，它为我们最苛刻的用例提供支持，例如代理工具使用和复杂推理。

这里的亮点是 AFM 3 Core Advanced 和 AFM 3 Cloud Pro。

从 AFM 3 Core Advanced 开始，它将 200 亿个参数打包到设备上模型中，这是一个不小的壮举。大多数针对公众的设备上模型往往停留在数十亿个低个位数参数。

为了使 AFM 3 Core Advanced 良好运行，Apple 使用了稀疏架构，根据提示一次激活多达 40 亿个参数，而不是需要为每个请求保持所有 200 亿个参数处于活动状态的密集架构。

虽然概念上类似于混合专家方法，这种选择性激活依赖于苹果公司发明的一项技术，并在有趣的研究中详细介绍了这一技术大型语言模型的指令跟随修剪一年前发布。

至于 AFM 3 Cloud Pro，它是在外部基础设施上运行的。您可以阅读此扩展的一些技术细节这篇文章本周早些时候发布在苹果的安全博客上，但这是最重要的部分：

在此基础上，苹果和谷歌合作构建了远远超出传统机密计算部署的功能：

我们不仅仅依靠机密计算技术来缓解利用机密虚拟机之外的特权访问的攻击，包括侧通道攻击。我们认为每个组件（从固件到主机和来宾操作系统堆栈再到应用程序代码）都是我们可信计算基础的一部分，并受到我们可验证的透明度和无特权访问保证的约束。

为了降低供应链攻击的风险，我们为 PCC 机群中的所有 Google Cloud 硬件维护一个可加密验证、仅附加的分类账。对于可能被滥用以窃取用户数据的组件，我们的软件认证植根于至少两个来自独立供应商的独立信任根。

即使部署了机密计算，我们也相信推理堆栈从一开始就必须考虑隐私和安全性。Google Cloud 上的 PCC 利用许多与 Apple 芯片上的 PCC 相同的架构安全模式来实现这些分层保护：每个请求的初始网络数据解析都在其自己的命名空间内的专用进程中进行，共享推理软件的回收周期很短，并且经过验证的密钥保存在与外部输入隔离的单独的专用机密虚拟机中。

苹果在其机器学习研究博客中说所有五个模型都共享一个共同的初始基础，然后专门针对各自的架构和用例，添加音频、图像理解、长上下文推理和高质量视觉生成等多模式功能。

该公司补充说，为了训练这些模型，它使用了“混合数据，包括公开信息、从第三方许可或购买的数据、开源数据、通过专门研究获得的数据以及合成数据。”苹果还强调，训练过程不包括用户数据或交互，网络出版商可以选择退出基础模型训练。

结果

苹果表示，它对其第三代基础模型进行了广泛的人类评估，内部评审员对指令遵循、真实性、演示和图像理解等类别的反应进行了评分。

模型根据其前身（如果适用）进行了评估，您可以看到下面的一些结果：

将 AFM 3 Core 和 AFM 3 Cloud 与我们上一代模型进行比较，对一般文本功能进行并行人类评估时首选响应的比例。结果在四个不同的区域设置组中呈现，以证明跨国际变体的一致性能。–English – 代表我们的全球英语评估集，而 –PFIGSCJK –、 –DNNSTV – 和 –AFIHHMPRTU – 代表我们其余支持的全球区域设置。