科技 · 2026-06-22 · 阅读 4

CPU 也想分一杯 AI 的羹，但别把 ACE 当成魔法按钮

据 Tom's Hardware 报道，Intel 和 AMD 公布了一套新的 x86 CPU 扩展规范，叫 ACE。它想让 CPU 更适合跑一部分 AI 计算，尤其是矩阵乘法这类机器学习基础操作。

作者

林岚

相关编辑

陈墨

周白

据 Tom's Hardware 报道，Intel 和 AMD 公布了一套新的 x86 CPU 扩展规范，叫 ACE。它想让 CPU 更适合跑一部分 AI 计算，尤其是矩阵乘法这类机器学习基础操作。

CPU/GPU AI 计算路径示意图

这条新闻最容易被拿来传播的数字，是 ACE 在相同输入向量数量下，相比 AVX10 可以执行 “16x as many operations”。这个数字很亮眼，但别急着理解成“CPU 跑 AI 直接快 16 倍”。

原报道自己也提醒了：这不等于实际应用一定有 16 倍速度提升。真实体验要看芯片怎么实现、内存带宽够不够、编译器和运行时怎么调度、PyTorch 或 TensorFlow 这类框架能不能用上，以及你的任务到底是不是吃矩阵运算。

说白了，ACE 现在更像是一条新路，不是已经铺好的高速公路。

为什么这件事仍然值得看？因为不是所有 AI 任务都需要 GPU。大模型训练、高吞吐推理，GPU 当然还是主角。但如果你做的是桌面应用、浏览器插件、本地知识库、企业内网工具，或者想在用户电脑上跑一点 embedding、语音预处理、图像分类，小任务把数据从 CPU 搬到 GPU 再搬回来，本身也有成本。

CPU 与 GPU 的 AI 计算路径示意图

ACE 想补的就是这个缝。它利用现有 AVX10 寄存器，同时增加更适合矩阵乘法的硬件路径。报道还提到，ACE 支持 INT8、FP8、FP16、FP32、BF16 等机器学习常见数据类型，也支持 Open Compute Project 的 MX block-scaled formats。这个细节说明 Intel 和 AMD 不是简单给老指令集贴一个 AI 标签，而是在把机器学习数据格式纳入 x86 的未来路线。

对开发者来说，最重要的不是你能不能手写 ACE 指令。真正要看的是框架能不能自动用上它。Demo 很好，SDK 呢？错误处理呢？如果未来 ONNX Runtime、PyTorch、TensorFlow、编译器和系统库能把 ACE 吃进去，开发者就不用根据不同 CPU 支持程度写一堆分支。

本站编辑陈墨提醒，这背后还有产业账本。过去两年 AI 硬件叙事几乎被 GPU、HBM、数据中心和电力吃掉了。如果 CPU 能承担更多本地和边缘 AI 任务，Intel 和 AMD 就重新拿回一部分 AI 基础设施话语权。但芯片面积、功耗收益、框架适配成本，最后都会决定 ACE 是不是一个真正的产业机会。

从普通用户侧看，本站编辑周白更关心的是另一件事：这类技术什么时候能变成更快、更省电、更少发热的日常体验。比如本地照片分类、离线语音转写、隐私敏感的个人数据处理、电脑上的小型 AI 助手。如果这些功能不用总上云，也不用依赖独显，用户才会真的感觉到变化。

短期不用急着改架构。ACE 还要等真实 CPU、编译器、运行时和主流框架支持。长期看，它值得关注，不是因为 CPU 明天就会变成 GPU，而是因为“没有 GPU 的 AI 场景”可能会变成一个更正经的工程选项。