OC

Knowledge OS
CPU 也想分一杯 AI 的羹,但别把 ACE 当成魔法按钮
科技 · 2026-06-22

CPU 也想分一杯 AI 的羹,但别把 ACE 当成魔法按钮

据 Tom's Hardware 报道,Intel 和 AMD 公布了一套新的 x86 CPU 扩展规范,叫 ACE。它想让 CPU 更适合跑一部分 AI 计算,尤其是矩阵乘法这类机器学习基础操作。

作者 林岚 林岚
相关编辑 陈墨 周白

Tom's Hardware 报道,Intel 和 AMD 公布了一套新的 x86 CPU 扩展规范,叫 ACE。它想让 CPU 更适合跑一部分 AI 计算,尤其是矩阵乘法这类机器学习基础操作。

CPU/GPU AI 计算路径示意图

这条新闻最容易被拿来传播的数字,是 ACE 在相同输入向量数量下,相比 AVX10 可以执行 “16x as many operations”。这个数字很亮眼,但别急着理解成“CPU 跑 AI 直接快 16 倍”。

原报道自己也提醒了:这不等于实际应用一定有 16 倍速度提升。真实体验要看芯片怎么实现、内存带宽够不够、编译器和运行时怎么调度、PyTorch 或 TensorFlow 这类框架能不能用上,以及你的任务到底是不是吃矩阵运算。

说白了,ACE 现在更像是一条新路,不是已经铺好的高速公路。

为什么这件事仍然值得看?因为不是所有 AI 任务都需要 GPU。大模型训练、高吞吐推理,GPU 当然还是主角。但如果你做的是桌面应用、浏览器插件、本地知识库、企业内网工具,或者想在用户电脑上跑一点 embedding、语音预处理、图像分类,小任务把数据从 CPU 搬到 GPU 再搬回来,本身也有成本。

CPU 与 GPU 的 AI 计算路径示意图

ACE 想补的就是这个缝。它利用现有 AVX10 寄存器,同时增加更适合矩阵乘法的硬件路径。报道还提到,ACE 支持 INT8、FP8、FP16、FP32、BF16 等机器学习常见数据类型,也支持 Open Compute Project 的 MX block-scaled formats。这个细节说明 Intel 和 AMD 不是简单给老指令集贴一个 AI 标签,而是在把机器学习数据格式纳入 x86 的未来路线。

对开发者来说,最重要的不是你能不能手写 ACE 指令。真正要看的是框架能不能自动用上它。Demo 很好,SDK 呢?错误处理呢?如果未来 ONNX Runtime、PyTorch、TensorFlow、编译器和系统库能把 ACE 吃进去,开发者就不用根据不同 CPU 支持程度写一堆分支。

本站编辑陈墨提醒,这背后还有产业账本。过去两年 AI 硬件叙事几乎被 GPU、HBM、数据中心和电力吃掉了。如果 CPU 能承担更多本地和边缘 AI 任务,Intel 和 AMD 就重新拿回一部分 AI 基础设施话语权。但芯片面积、功耗收益、框架适配成本,最后都会决定 ACE 是不是一个真正的产业机会。

从普通用户侧看,本站编辑周白更关心的是另一件事:这类技术什么时候能变成更快、更省电、更少发热的日常体验。比如本地照片分类、离线语音转写、隐私敏感的个人数据处理、电脑上的小型 AI 助手。如果这些功能不用总上云,也不用依赖独显,用户才会真的感觉到变化。

短期不用急着改架构。ACE 还要等真实 CPU、编译器、运行时和主流框架支持。长期看,它值得关注,不是因为 CPU 明天就会变成 GPU,而是因为“没有 GPU 的 AI 场景”可能会变成一个更正经的工程选项。