据报道 Nvidia 取消了双机架 72 GPU GB200 的开发分析师称该公司打算专注于单机架产品 - Tom's Hardware

2024-10-01 20:08:37 英文原文

据报道,Nvidia 取消了双机架 72 GPU GB200 的开发。分析师表示,该公司打算专注于单机架产品

尝试创建和支持的配置更少。

据媒体分析师 Ming-Chi Kuo 表示,Nvidia 正在停止开发基于双机架 72 路 GB200 的 NVL362,转而专注于单机架 NVL72 和 NVL36。他是一位信誉良好的分析师,似乎拥有有关此事的内幕信息。单机架 NVL36 和 NVL72 机器将按计划上市,据说这一决定是由有限的资源和客户偏好驱动的。然而,之前的报告表明,双机架 NVL362 将是 Nvidia 客户中最受欢迎的选择。

该公司最初计划开发三种基于 Blackwell GPU 的 GB200 型号,用于 AI 和 HPC 工作负载:NVL36、NVL72 和 NVL362。然而,管理所有三个项目变得具有挑战性,特别是考虑到同时处理两个不同的 72-GPU 版本(NVL72 和 NVL362)的复杂性。因此,Nvidia 现在只专注于 NVL72 和 NVL36。

Nvidia 的 GB200 NVL72 机架包含 18 个计算托盘和 9 个 NVSwitch 托盘(18 个 NVSwitch ASIC),每个托盘容纳两块 Bianca 板,每块板上有 1 个 Grace CPU 和 2 个 Blackwell GPU。这是 Nvidia 最强大的产品,但它也是最耗电的解决方案,因为它的功耗约为 120kW。

SemiAnalysis 预计,由于其极端的功率和密度要求(典型机架功率为 12kW,而基于 H100 的机架功耗约为 40kW),大多数数据中心无法支持,因此该配置的使用会受到限制。然而,有一个主要客户计划进行广泛部署,郭明池声称微软已经表现出对 NVL72 而非 NVL362 的明显偏好。

GB200 NVL362 由两个互连的机架组成,最初预计是更常用的配置。每个机架有 18 个 Grace CPU 和 36 个 Blackwell GPU,保持 72 个 GPU 之间的完全连接。然而,它需要 36 个 NVSwitch ASIC,因此比 1 个 NVL72 消耗更多功率,并且性能稍低。一台 GB200 NVL362 预计每个机架消耗 66kW(总共 132kW),略高于 NVL72,但其尺寸更大,与现有数据中心更兼容。

GB200 NVL72 的空间效率远高于 GB200 NVL362。然而,大多数 Nvidia 客户无法支持 NVL72 的功率和冷却​​密度要求。此外,Ming-Chi Kuo 表示,这些复杂性可能会将 GB200 NVL72 的发货推迟到 2025 年下半年。然而,之前的报道表明,一些 NVL72 机器将于今年 12 月交付,大概是交付给微软。

“我最新的供应链调查显示,NVL72 量产可能会推迟到 2H25(相对于 Nvidia 的乐观目标是 1H25),”郭明池写道。

今年早些时候,Nvidia 在用于 AI 和 HPC 的 B100 和 B200GPU 封装方面遇到了产量下降的问题,这促使其生产低产量的 Blackwell 硬件来满足需求并改进这些处理器的设计。精炼 GPU 将于 10 月底开始量产,因此将在 1 月底投入使用。在这种背景下,专注于基于 GB200 的 NVL72 设计,针对寻求最高性能的最苛刻客户,对于 Nvidia 来说绝对有意义。

还应该指出的是,配备 Blackwell 处理器的基于 x86 的服务器将于 2025 年上市。现阶段,这些机器的外形尺寸仍然未知,初步报告指向 NVL72 和 NVL362 机器。现在可能首先转向 NVL72 和 NVL36 机架,随后将推出定制的第三方解决方案。

保持领先地位:获取 Tom's Hardware 新闻通讯

获取 Tom's Hardware 新闻通讯最佳新闻和深入评论,直接发送到您的收件箱。

Anton Shilov 是 Toms Hardware 的特约撰稿人。在过去的几十年里,他涵盖了从 CPU 和 GPU 到超级计算机,从现代工艺技术和最新的晶圆厂工具到高科技行业趋势的所有内容。

关于《据报道 Nvidia 取消了双机架 72 GPU GB200 的开发分析师称该公司打算专注于单机架产品 - Tom's Hardware》
暂无评论

摘要

据报道,Nvidia 取消了双机架 72 GPU GB200 的开发,分析师表示,该公司打算专注于单机架产品,尝试创建和支持更少的配置。一台 GB200 NVL362 预计每个机架消耗 66kW(总共 132kW),略高于 NVL72,尽管它的尺寸更大,与现有数据中心更兼容。然而,之前的报道表明,一些 NVL72 机器将于今年 12 月交付,大概是交付给微软。在这种背景下,专注于基于 GB200 的 NVL72 设计,针对寻求最高性能的最苛刻客户,对于 Nvidia 来说绝对有意义。Anton Shilov 是 Toms Hardware 的特约撰稿人。