英语轻松读发新版了,欢迎下载、更新

解开Axion:Google Cloud为AI时代构建的基于自定义的基于ARM的处理器

2025-04-09 12:43:12 英文原文

作者:Bhumik Patel

博客 2025年4月9日

硅的创新如何授权组织和开发人员部署可扩展的高性能云和AI应用程序

经过Bhumik Patel,,,,服务器生态系统开发主管手臂

云计算的需求飙升,尤其是在AI驱动的时代,促使开发人员寻求降低总拥有成本(TCO)的性能优化,节能解决方案。我们致力于通过Arm Neoverse满足这些不断发展的需求,这将迅速成为塑造云基础架构未来的开发人员的选择平台。

Google Cloud与ARM合作设计了定制的硅,以进行现实世界的性能。结果:Axion,Google的第一个基于Neoverse的CPU,构建的,旨在超越传统处理器,其性能,效率和规模更高。这项合作为开发人员带来了更大的选择,并推进了云创新。 

Google Cloud客户和内部服务的强烈采用

Axion处理器建立在Neoverse V2平台上,专门设计为为广泛的工作负载提供非凡的性能和能源效率,包括云本地应用程序,要求AI型号和许多Google Cloud Services,例如Compute Engine,Google Kubernetes Engine(GKE),批次和DataProc,以及DataProc,以及DataPlroc,以及DataPlroc,and alloydb and alloydb and Cloudsql,目前都在预览中。

从内容流到企业规模的数据服务,各行业的公司都是使用基于ARM的Google Axion处理器并发现计算效率,可伸缩性和TCO的实质性提高。Google Cloud客户(例如Clickhouse,Dailymotion,Databricks,Elastic,LoveHolidays,Mongodb,Palo Alto Networks,Paramount Global,Redis Labs和Starburst)已经看到了变革结果。例如,Spotify大致观察到250%的性能使用基于轴的C4A VM。

打破性能障碍

Google Axion处理器在AI推导工作负载和通用计算中都表现出色。对于AI推断,Axion的专业优化可带来显着的性能增长,从而使AI工作负载更快,更有效。这对于诸如自然语言处理,计算机视觉和推荐系统等应用特别有益。AI开发人员可以利用 手臂kleidi,一系列轻巧,高性能的开源库。Kleidi与领先的框架集成在一起,显着提高了AI的AI应用程序的性能,而开发人员没有额外的努力。 

Axion处理器利用ARM的高级建筑特征,使开发人员能够大规模部署复杂的AI模型,而无需牺牲速度或性能。 

例如,与基于X86的替代方案相比,Google Axion的MLPERF DLRMV2基准表现出了三倍的全精度性能,展示了其在建议系统中的高级功能。许多用户更喜欢FP32精度,以避免与INT8这样的较低精确格式相关的准确性问题,因为不准确的建议可能会导致销售损失,客户满意度降低和对品牌声誉的损失。

在另一个示例中,对于偶尔会提供过时或不准确的答案的AI聊天机器人,检索演出的一代(RAG)方法论提供了一种强大的解决方案来增强其准确性和相关性。在我们的测试中,当在Google Axion处理器上运行RAG应用程序时 交付高达2.5倍的性能 与x86替代方案相比。

斧头处理器为通用工作负载提供了显着的性能提高,并从下面的结果中可以看出。通过优化高吞吐量和较低的延迟,Axion可以实现更快的应用程序响应时间,增强的用户体验以及改进的资源利用率,使其非常适合Web服务器,数据库,分析和容器化的微服务。” 

此外,基于轴突的C4A VM特别适合HPC工作负载,因为它们将天然Neoverse核心的性能与每个VCPU的足够内存带宽相结合。HPC开发人员可以利用Neoverse平台上可用的开源和商业科学计算应用程序和框架的丰富生态系统,包括 Linux的手臂编译器和 手臂性能库。我们对行业标准崩溃和影响模拟应用程序的测试Altair®Openradioss¢在基于轴承的C4A VM上显示出显着的性能优势。 

加速云迁移

为了支持和加速开发人员在云中采用ARM架构,我们最近发起了一项全面的云迁移计划。这项倡议的核心是我们的新 云迁移资源集线器,提供100多个详细的学习路径,旨在通过在多个平台上无缝迁移常见的工作负载来指导开发人员。随着支持Axion的独立软件供应商(ISV)的列表,随着掌声,Couchbase,Honeycomb,IBM Instana的可观察性,Verve和Viant等杰出参与者的发展, 手臂的软件生态系统仪表板•方便地使开发人员了解可用的和推荐版本的Neoverse的主要开源和商业软件。从第一天开始,这确保了兼容性和平稳的操作。 

这些资源使有兴趣采用或迁移到基于Google Cloud Axion的C4A VM的开发人员可以参与ARM的积极社区支持渠道,包括专门用于移民的专业GitHub存储库。ARM的云迁移专家还可以提供直接的工程援助和个性化的支持,尤其是对于企业规模的迁移,有助于确保平稳而成功地过渡到基于轴心的解决方案。

总而言之,Google Cloud的引入Axion处理器表示为为其客户提供更多样化和更高的性能计算选项的战略性。通过利用ARM的架构和Google的自定义硅设计,Axion为各种工作量提供了卓越的性能和效率,从要求AI推导和HPC应用程序到通用和云本地服务。这与我们的云迁移计划和强大的软件生态系统相结合。 

其他资源

仅允许提供信息,非商业或个人用途的任何重复使用。

编辑联系人

ARM编辑团队

editorial@arm.com

关于《解开Axion:Google Cloud为AI时代构建的基于自定义的基于ARM的处理器》的评论


暂无评论

发表评论

摘要

Google Cloud与ARM合作推出了Axion,这是一种基于Neoverse的自定义CPU,旨在与传统处理器相比提供出色的性能,效率和可扩展性。Axion建立在Neoverse V2平台上,针对云代表应用程序,AI模型和各种Google Cloud Services进行了优化,这表明了对整个行业的企业的计算效率和TCO的显着提高。关键功能包括对复杂AI模型部署的高级体系结构支持以及通用工作负载和HPC任务中的增强性能。该计划还包括一项全面的云迁移计划,以促进开发人员对ARM架构的采用。

相关讨论