英语轻松读发新版了,欢迎下载、更新

使用ARM的新Lumex CSS平台在消费设备上交付的更聪明,更快,更个人的AI,推动了双位性能提升

2025-09-10 02:37:30 英文原文

作者:By Chris Bergey, SVP and GM of the Client Line of Business, Arm

新闻亮点:

  • ARM LUMEX CSS平台将实时的机上AI用例,例如助手,语音翻译和个性化,新的启用SME2的ARM CPU可提供高达5倍的AI性能 
  • 开发人员可以使用Kleidiai访问SME2性能,现在已集成到所有主要的移动OS和AI框架中,包括Pytorch Executorch,Google Litert,Alibaba MNN和Microsoft ONNX Runtime
  • 对于旗舰设备,ARM Lumex CSS平台实现了前所未有的六年两位数IPC性能增长 
  • 新的Mali G1-Ultra重新定义了移动娱乐娱乐,并为游戏玩家建造,2倍射线追踪Upliftâ 

AI不再是功能,它是下一代移动和消费者技术的基础。现在,用户期望实时帮助,无缝的沟通或设备上即时,私密且可用的个性化内容,而无需妥协。实现这些期望需要超过增量的升级,它需要一个步骤更改,以可扩展的方式将性能,隐私和效率融合在一起。 

引入ARM LUMEX 

这就是为什么我们介绍ARM LUMEX, 我们的最先进的计算子系统(CSS)平台,专门为加速AI在旗舰智能手机和下一代PC上的体验。 

Lumex团结了我们具有可扩展矩阵扩展版2(SME2)的最高性能CPU,,,,GPU和系统IP,使生态系统能够将AI设备更快地推向市场,并提供从桌面类移动游戏到实时翻译,更智能的助手和个性化应用程序的体验。” 

我们正在启用SME2在每个CPU平台中,到2030年,中小企业和SME2将在超过30亿个设备中增加100亿台计算的顶部,从而在设备上的AI功能中实现了指数的飞跃。 

合作伙伴可以准确选择他们如何将Lumex构建到自己的SoC中 - 他们可以将平台交付并利用满足其需求的最先进的物理实施,从而收集了用于市场的时间,并花费时间来履行绩效收益。另外,合作伙伴可以为其目标层配置平台RTL并使核心自己变硬。 

Lumex和我们整个手臂投资组合中的简化命名约定今年早些时候。 -  

平台结合: 

  • 下一代SME2启用ARMV9.3 CPU群集,包括C1-ultraC1-Pro,为旗舰设备提供动力 
  • 新的C1-毕业生,为亚级领域市场建立的目的,在班级效率上提供最佳 
  • 新的马里G1-ultra gpu随着下一代射线跟踪,可以实现高级图形和游戏,并提高AI性能 
  • 迄今为止,最灵活,最有力的动态共享单元(DSU)臂已经交付:C1-DSUâ 
  • 优化3NM节点的物理实现 
  • 整个软件堆栈的深入集成,为开发人员提供无缝的AI加速度的使用Kleidiai库一个 

启用了SME2的CPU,到处加速AI

启用S​​ME2的ARM C1 CPU群集为现实世界中的AI驱动任务提供了巨大的AI性能: 

  • AI性能最多可振作5倍 
  • 4.7倍基于语音的工作负载的潜伏期降低 
  • 2.8倍更快的音频产生 

CPU AI计算中的这种飞跃可以实现实时的,设备的AI推理功能,从而为用户提供了跨音频生成,计算机视觉和上下文助手等互动的更流畅,更快的体验。” 

那么,这在现实世界中的用例中意味着什么?SME2可以提供全新的响应能力和效率。例如,我们的智能瑜伽导师演示应用程序在文本到语音方面的提升是2.4倍,这意味着用户可以立即对其姿势进行反馈,而不会耗尽电池寿命。与Abipay和Vivo一起,我们在与用户互动的LLM响应所花费的时间减少了40%,证明SME2提供了更快的实时生成AI室内设备。 

sme2不是速度。它也可以解锁传统CPU可以匹配的AI驱动功能。例如,Neural Camera的Denoising现在以1080p的120fps或4K的30fps运行,全部以单个核心运行。这使智能手机用户即使在最黑暗的场景中也可以捕获更清晰,清晰的图像,从而可以在日常设备上进行互动和更丰富的体验。” 

与受到延迟,成本和隐私问题约束的云领先AI不同,Lumex将智能直接带到了它更快,更安全且始终可用的设备中。SME2受到包括阿里巴巴,支架,三星LSI,Tencent和Vivo等领先的生态系统参与者的拥抱。 

每个产品层的建筑自由 

Lumex为合作伙伴提供了平衡峰值性能,持续效率和硅区域的自由,从高端智能手机和PC到出现的AI-Firf构架: 

cpuâ 一个 关键好处一个 绩效和效率提高一个 理想的用例一个 C1-ultraâ 旗舰高峰性能 
+25%的单线程性能 双位IPC同比增益 大型推理,计算摄影,内容创建,生成型 
C1-毕业生 
C1-ultra性能具有更高的面积效率 
比C1-ultra小35% 子级移动段,语音助手,多任务处理 C1-Proâ 持续效率 
+16%的持续性能 视频播放,流推断 C1-nanoâ 极高的力量 
+26%的效率,使用较少的面积 可穿戴设备,最小的外形因素 启用桌面级游戏并更快地对马里GPU推断 迄今为止,ARM处于手机游戏体验的中心。

新的Arm Mali G1-Ultra GPU继续推动移动游戏的界限,提供高保真的游戏机级图形。

全新的射线追踪单元V2(RTUV2)使这是可能的,它为先进的照明,阴影和反射提供动力,从而使射线跟踪性能的2倍提升。对于AI工作负载,G1-ultra最多可快20%的推理性能,从而在实时应用程序中提高响应能力。” 

与上一代人相比,马里G1-ultra在图形基准中的性能提高了20%,领先冠军的全面改进,包括Arena Breakout,Fortnite,Genshin Impact和Honkai Star Rail。G1高级和G1-Pro GPU为受限设备提供了卓越的性能和发电效率。” 

最后,用于移动的开发人员友好的AI 

对于开发人员而言,AI体验仅在Lumex平台上工作。通过跨主要框架的Kleidiai集成,包括Pytorch executorch,Google Litert,阿里巴巴MNNMicrosoft ONNX运行时,应用程序会自动从SME2加速器中受益,而无需更改代码。 

对于构建跨平台应用程序的开发人员,Lumex带来了新的可移植性: 

  • 诸如Gmail,YouTube和Google Photos之类的Google应用程序已经准备就绪,可以确保无缝集成,因为基于Lumex的设备上市 
  • 跨平台可移植性意味着为Android构建的优化可以无缝扩展到手臂和其他平台上的窗户 
  • 像Alipay这样的合作伙伴已经在使用SME2有效运行的设备LLM上展示了 

包括Apple,Samsung和Mediatek在内的技术领导者正在整合AI加速度功能,以提高更快,更有效的对设备的AI。苹果正在为苹果智能提供动力。三星和中国科技家使用Google Gemini。 

ARM LUMEX:AI时代的平台级情报 

ARM Lumex不仅仅是我们在消费者计算市场上最先进的CSS平台,它是下一个智能AI-Spable Experience时代的基础。无论您是OEM还是开发人员,Lumex都为您提供了在最重要的边缘提供个人,私人和高性能AI的工具。Lumex是为AI时代建造的,是移动创新的未来开始的地方。 

支持报价: 

通过与SME2的深入集成,MNN可以实现低延迟,对智能手机上的QWEN等数十亿个参数模型进行了量化 - 展示ARM和Alibaba在可扩展的下一代移动AI中的联合创新。陶鲍(Mnn一个 

通过ARM,Aripay和Vivo的密切合作,使用SME2的LLM推理的验证已在Vivo的下一代旗舰智能手机上完成。我们观察到,预填充和解码性能可以分别提高40%和25%。这些结果表明CPU后端的进展取得了重大进展,迄今为止取得的成果为我们而受到鼓舞。” Xindan Weng,Alipay客户工程主管

SME2增强的硬件使更高级的AI模型(例如Gemma 3)可以直接在各种设备上运行。随着SME2继续扩展,它将使移动开发人员能够在生态系统中无缝部署下一代的AI功能。这最终将通过其智能手机上广泛使用的低延迟体验使最终用户受益。杰出的软件工程师Iliyan Malchev,Android在Google一个 

``以荣誉,我们的使命是为更多的用户带来高级体验,尤其是通过我们的中端智能手机。通过利用ARM Lumex CSS平台,我们能够提供平稳的性能,智能的AI功能和出色的功率效率,从而提高日常移动体验。”荣誉一个 AI正在改变我们与设备和周围世界的互动方式,而ARM生态系统正在推动该领域的重要发展。

在Meta,我们对Arm Kleidi和Pytorch的Executorch的整合感到兴奋,这使我们的应用程序可以无缝地运行下一代技术,从而加速了最终用户的体验。”META的AI合作伙伴关系总监Sy Choudhury一个 

``在三星,我们很高兴通过利用ARM的计算子系统平台来开发下一代旗舰移动产品,以继续与ARM的合作。这种合作伙伴关系使我们能够突破设备AI的界限,为用户提供更智能,更快,更有效的体验。”三星电子SOC IP开发团队副总裁兼主管Nak Hee Seong一个 

SME2通过解决关键性能瓶颈并促进移动移动设备的有效LLM部署来加速诸如Tencent的Hunyuan之类的大型语言模型,以增强用户体验。”Felix Yang,杰出专家,机器学习平台,腾讯一个 

关于《使用ARM的新Lumex CSS平台在消费设备上交付的更聪明,更快,更个人的AI,推动了双位性能提升》的评论


暂无评论

发表评论

摘要

ARM介绍了Lumex CSS平台,该平台采用SME2启用CPU,可提供高达5倍的AI性能。这使得无需互联网依赖的设备上的语音翻译和个性化等实时AI功能。开发人员可以通过Kleidiai访问SME2性能,并集成到主要的移动OS和AI框架中。Mali G1-Ultra GPU通过高级射线追踪增强了游戏体验,并改善了AI性能。Lumex支持从高端智能手机到可穿戴设备的各种产品层,提供平衡的峰值性能,持续的效率和硅面积优化。诸如阿里巴巴,支架,三星LSI,Tencent和Vivo之类的合作伙伴正在接受SME2在现实世界应用中的速度和效率。