NVIDIA 将 Blackwell 平台设计贡献给开放硬件生态系统,加速人工智能基础设施创新

2024-10-15 16:36:40 英文原文

NVIDIA GB200 NVL72 设计贡献和 NVIDIA Spectrum-X 以帮助加速下一工业革命

OCP全球峰会—为了推动开放、高效和可扩展的数据中心技术的发展,NVIDIA今天宣布已将其NVIDIA Blackwell加速计算平台设计的基础要素贡献给开放计算项目(OCP)以及对OCP标准的NVIDIA Spectrum-X™的扩展支持。

在今年的OCP全球峰会上,NVIDIA将分享关键的内容部分。NVIDIA GB200 NVL72系统机电设计与OCP社区合作——包括机架架构、计算和交换板机械设计、液体冷却及热环境规范,NVIDIA NVLink™电缆卡匣体积——以支持更高的计算密度和网络带宽。

NVIDIA已经在多个硬件代次中正式向OCP做出了多项贡献,包括其NVIDIA HGX™ H100底板设计规范,以帮助生态系统提供更多来自世界各地计算机制造商的选择,并扩大人工智能的采用。

此外,扩展了 NVIDIA Spectrum-X以太网网络平台与OCP社区开发的规范保持一致使公司能够解锁部署OCP认证设备的AI工厂的性能潜力,同时保护其投资并维持软件一致性。

“基于与OCP十年的合作,NVIDIA正在与行业领导者一起制定可以广泛应用于整个数据中心的规范和设计,”NVIDIA创始人兼首席执行官黄仁勋表示。“通过推进开放标准,我们帮助全球组织充分利用加速计算的全部潜力,并创造未来的AI工厂。”

下一代工业革命的加速计算平台
NVIDIA的加速计算平台旨在驱动人工智能的新时代。

GB200 NVL72 基于NVIDIA MGX™ 模块化架构这使得计算机制造商能够快速且低成本地构建各种数据中心基础设施设计。

液冷系统连接了36个NVIDIA Grace™ 处理器以及72NVIDIA Blackwell GPU在机架规模设计中。拥有72个GPU的NVIDIA NVLink域,它作为一个巨大的单体GPU工作,提供比NVIDIA H100 Tensor Core GPU快30倍的实时万亿参数大型语言模型推理速度。

NVIDIA Spectrum-X以太网网络平台,现在包括下一代NVIDIA ConnectX-8超级网卡™支持OCP的交换抽象接口(SAI)和云端开放式网络软件(SONiC)标准。这使得客户可以使用Spectrum-X的自适应路由和基于遥测技术的拥塞控制来加速面向扩展的人工智能基础设施以太网性能。

ConnectX-8超级网卡具有高达800Gb/s速度的加速网络功能和针对大规模AI工作负载优化的可编程数据包处理引擎。ConnectX-8 SuperNICs将支持OCP 3.0,预计明年推出,为组织构建高度灵活的网络提供支持。

数据中心的关键基础设施
随着世界从通用计算转向加速和人工智能计算,数据中心基础设施变得越来越复杂。为了简化开发过程,NVIDIA正与全球40多家提供关键组件的电子产品制造商紧密合作,创建AI工厂。

此外,包括一系列合作伙伴正在黑威尔平台上进行创新和构建。元数据,计划将其基于GB200 NVL72的Catalina AI机架架构贡献给OCP。这为计算机制造商提供了构建高计算密度系统的灵活选项,并满足了数据中心日益增长的性能和能效需求。

“多年来,NVIDIA一直是开放计算标准的重要贡献者,包括他们高性能计算平台在过去两年中一直是我们的Grand Teton服务器的基础,”Meta工程副总裁Yee Jiun Song表示。“随着我们不断努力满足大规模人工智能日益增长的计算需求,NVIDIA在机架设计和模块化架构方面的最新贡献将帮助整个行业加速开发和实施AI基础设施。”

了解更多关于NVIDIA在2024年OCP全球峰会上对开放计算项目的贡献,该峰会将于10月15日至17日在圣何塞会议中心举行。

关于《 NVIDIA 将 Blackwell 平台设计贡献给开放硬件生态系统,加速人工智能基础设施创新》
暂无评论

摘要

NVIDIA GB200 NVL72 设计贡献和 NVIDIA Spectrum-X 帮助加速下一次工业革命 OCP 全球峰会——为了推动开放、高效和可扩展的数据中心技术的发展,英伟达今日宣布已将其 NVIDIA Blackwell 加速计算平台设计的基础元素贡献给了开放计算项目(OCP),并扩大了对 OCP 标准的 NVIDIA Spectrum-X™ 支持。在今年的 OCP 全球峰会上,NVIDIA 将与 OCP 社区分享关键部分的 NVIDIA GB200 NVL72 系统机电设计——包括机架架构、计算和交换托盘机械结构、液体冷却及热环境规范以及 NVIDIA NVLink™ 电缆卡盒体积规格,以支持更高的计算密度和网络带宽。NVIDIA 已经在其多个硬件世代中向 OCP 做出了多项官方贡献,包括其 NVIDIA HGX™ H100 底板设计规范,以帮助生态系统提供来自全球计算机制造商的更多选择,并扩大人工智能的应用。数据中心的关键基础设施 随着世界从通用计算转向加速和 AI 计算,数据中心基础架构变得越来越复杂。了解更多关于英伟达对开放计算项目的贡献,在 2024 年 OCP 全球峰会上进行交流,该峰会将于 10 月 15 日至 17 日在圣何塞会议中心举行。