作者:By Chris Bergey, SVP and GM of the Client Line of Business, Arm
AI不再是功能,它是下一代移动和消费者技术的基础。现在,用户期望实时帮助,无缝的沟通或设备上即时,私密且可用的个性化内容,而无需妥协。实现这些期望需要超过增量的升级,它需要一个步骤更改,以可扩展的方式将性能,隐私和效率融合在一起。
这就是为什么我们介绍ARM LUMEX, 我们的最先进的计算子系统(CSS)平台,专门为加速AI在旗舰智能手机和下一代PC上的体验。
Lumex团结了我们具有可扩展矩阵扩展版2(SME2)的最高性能CPU,,,,GPU和系统IP,使生态系统能够将AI设备更快地推向市场,并提供从桌面类移动游戏到实时翻译,更智能的助手和个性化应用程序的体验。”
我们正在启用SME2在每个CPU平台中,到2030年,中小企业和SME2将在超过30亿个设备中增加100亿台计算的顶部,从而在设备上的AI功能中实现了指数的飞跃。
合作伙伴可以准确选择他们如何将Lumex构建到自己的SoC中 - 他们可以将平台交付并利用满足其需求的最先进的物理实施,从而收集了用于市场的时间,并花费时间来履行绩效收益。另外,合作伙伴可以为其目标层配置平台RTL并使核心自己变硬。
Lumex和我们整个手臂投资组合中的简化命名约定今年早些时候。 -
平台结合:
启用SME2的ARM C1 CPU群集为现实世界中的AI驱动任务提供了巨大的AI性能:
CPU AI计算中的这种飞跃可以实现实时的,设备的AI推理功能,从而为用户提供了跨音频生成,计算机视觉和上下文助手等互动的更流畅,更快的体验。”
那么,这在现实世界中的用例中意味着什么?SME2可以提供全新的响应能力和效率。例如,我们的智能瑜伽导师演示应用程序在文本到语音方面的提升是2.4倍,这意味着用户可以立即对其姿势进行反馈,而不会耗尽电池寿命。与Abipay和Vivo一起,我们在与用户互动的LLM响应所花费的时间减少了40%,证明SME2提供了更快的实时生成AI室内设备。
sme2不是速度。它也可以解锁传统CPU可以匹配的AI驱动功能。例如,Neural Camera的Denoising现在以1080p的120fps或4K的30fps运行,全部以单个核心运行。这使智能手机用户即使在最黑暗的场景中也可以捕获更清晰,清晰的图像,从而可以在日常设备上进行互动和更丰富的体验。”
与受到延迟,成本和隐私问题约束的云领先AI不同,Lumex将智能直接带到了它更快,更安全且始终可用的设备中。SME2受到包括阿里巴巴,支架,三星LSI,Tencent和Vivo等领先的生态系统参与者的拥抱。
Lumex为合作伙伴提供了平衡峰值性能,持续效率和硅区域的自由,从高端智能手机和PC到出现的AI-Firf构架:
cpuâ 一个 关键好处一个 | 绩效和效率提高一个 | 理想的用例一个 | C1-ultraâ 旗舰高峰性能 |
+25%的单线程性能 | 双位IPC同比增益 | 大型推理,计算摄影,内容创建,生成型 C1-毕业生 | C1-ultra性能具有更高的面积效率 |
比C1-ultra小35% | 子级移动段,语音助手,多任务处理 | C1-Proâ | 持续效率 |
+16%的持续性能 | 视频播放,流推断 | C1-nanoâ | 极高的力量 |
+26%的效率,使用较少的面积 | 可穿戴设备,最小的外形因素 | 启用桌面级游戏并更快地对马里GPU推断 | 迄今为止,ARM处于手机游戏体验的中心。 |
全新的射线追踪单元V2(RTUV2)使这是可能的,它为先进的照明,阴影和反射提供动力,从而使射线跟踪性能的2倍提升。对于AI工作负载,G1-ultra最多可快20%的推理性能,从而在实时应用程序中提高响应能力。”
与上一代人相比,马里G1-ultra在图形基准中的性能提高了20%,领先冠军的全面改进,包括Arena Breakout,Fortnite,Genshin Impact和Honkai Star Rail。G1高级和G1-Pro GPU为受限设备提供了卓越的性能和发电效率。”
对于开发人员而言,AI体验仅在Lumex平台上工作。通过跨主要框架的Kleidiai集成,包括Pytorch executorch,Google Litert,阿里巴巴MNN和Microsoft ONNX运行时,应用程序会自动从SME2加速器中受益,而无需更改代码。
对于构建跨平台应用程序的开发人员,Lumex带来了新的可移植性:
包括Apple,Samsung和Mediatek在内的技术领导者正在整合AI加速度功能,以提高更快,更有效的对设备的AI。苹果正在为苹果智能提供动力。三星和中国科技家使用Google Gemini。
ARM Lumex不仅仅是我们在消费者计算市场上最先进的CSS平台,它是下一个智能AI-Spable Experience时代的基础。无论您是OEM还是开发人员,Lumex都为您提供了在最重要的边缘提供个人,私人和高性能AI的工具。Lumex是为AI时代建造的,是移动创新的未来开始的地方。
通过与SME2的深入集成,MNN可以实现低延迟,对智能手机上的QWEN等数十亿个参数模型进行了量化 - 展示ARM和Alibaba在可扩展的下一代移动AI中的联合创新。陶鲍(Mnn一个
通过ARM,Aripay和Vivo的密切合作,使用SME2的LLM推理的验证已在Vivo的下一代旗舰智能手机上完成。我们观察到,预填充和解码性能可以分别提高40%和25%。这些结果表明CPU后端的进展取得了重大进展,迄今为止取得的成果为我们而受到鼓舞。” Xindan Weng,Alipay客户工程主管
SME2增强的硬件使更高级的AI模型(例如Gemma 3)可以直接在各种设备上运行。随着SME2继续扩展,它将使移动开发人员能够在生态系统中无缝部署下一代的AI功能。这最终将通过其智能手机上广泛使用的低延迟体验使最终用户受益。杰出的软件工程师Iliyan Malchev,Android在Google一个
``以荣誉,我们的使命是为更多的用户带来高级体验,尤其是通过我们的中端智能手机。通过利用ARM Lumex CSS平台,我们能够提供平稳的性能,智能的AI功能和出色的功率效率,从而提高日常移动体验。”荣誉一个 AI正在改变我们与设备和周围世界的互动方式,而ARM生态系统正在推动该领域的重要发展。
在Meta,我们对Arm Kleidi和Pytorch的Executorch的整合感到兴奋,这使我们的应用程序可以无缝地运行下一代技术,从而加速了最终用户的体验。”META的AI合作伙伴关系总监Sy Choudhury一个
``在三星,我们很高兴通过利用ARM的计算子系统平台来开发下一代旗舰移动产品,以继续与ARM的合作。这种合作伙伴关系使我们能够突破设备AI的界限,为用户提供更智能,更快,更有效的体验。”三星电子SOC IP开发团队副总裁兼主管Nak Hee Seong一个
SME2通过解决关键性能瓶颈并促进移动移动设备的有效LLM部署来加速诸如Tencent的Hunyuan之类的大型语言模型,以增强用户体验。”Felix Yang,杰出专家,机器学习平台,腾讯一个