英语轻松读发新版了,欢迎下载、更新

NVIDIA的新GPU定义可能意味着价格更高的AI软件

2025-04-01 18:36:00 英文原文

评论在上个月的GPU技术会议上,NVIDIA通过将其定义为GPU而违反了惯例。

首席执行官詹森·黄(Jensen Huang)在舞台上解释说:“我犯了一个错误的一件事:布莱克威尔实际上是两个GPU。”在GTC。“我们称那个芯片为GPU,这是错误的。原因是它搞砸了所有的NVLink命名法。”

但是,NVIDIA转向计数GPU死亡而不是SXM模块,因为单个GPU不仅简化了NVLink模型编号和命名约定。NVIDIA可以收取的AI Enterprise许可证的数量也可以增加一倍。

NVIDIA的AI Enterprise Suite,涵盖了许多AI框架,包括访问其推理微服务(尼姆),每年的gpu,每年$ 4,500或每小时$ 1的价格。这意味着NVIDIA HGX B200具有八个模块(每个模块一个Blackwell GPU)的价格为每年36,000美元或每小时$ 8。

但是有了新的HGXB300 NVL16,Nvidia现在将每个模具都视为GPU。而且由于该系统还具有八个模块,每个模块都有两个模块,因此总计达到16 GPU。这意味着,假设NVIDIA的AI Enterprise订阅定价没有更改,那么其最新的HGX盒子将使您退缩的两倍。

命名大会的变化与去年的不同布莱克韦尔系统。在我们的Blackwell发布覆盖范围中,NVIDIA与我们称Blackwell为“ chiplet”建筑 - 多个单独的模具或一个链接在一个处理器软件包中的chiplets”,认为这实际上是“两次reticle Limited Die Architection,它充当统一的单一GPU”。

与去年的B200相比,最新的B300 GPU也不是更强大。作为快速复习,HGX B300在2.3TB时提供了约1.5倍的记忆容量,而B200上的记忆容量为1.5TB,而4位浮点(FP4)perf的每个系统的浮点(FP4)perf量高约50%,每个系统的密集Petaflops略高于105。但是,性能跳跃仅用于可以利用FP4性能的工作负载。在较高的精度上,B300在较旧的系统中没有任何浮点优势。

令人困惑的是,此更改仅适用于NVIDIA的气冷B300盒,而不是更强大的GB300 NVL72系统,该系统继续将包装算作GPU。

那给什么呢?好吧,根据NVIDIA的Hyperscale和HPC的副总裁Ian Buck的说法,有一个技术原因。

主要区别在于,HGX底盘上提供的B300软件包缺少前一代Blackwell加速器上发现的芯片到芯片互连。这意味着这两个芯片确实是两个不同的144GB GPU,共享一个共同的软件包。Buck解释了这使NVIDIA获得更好的功率和热量。这确实带来了一些缺点。由于两者之间没有C2C互连,因此,如果一个模具想访问另一个内存,则必须在NVLink开关上脱包,然后进行掉头。

另一方面,GB300保留了C2C接口,避免了包装内存绕组。由于两个模具可以直接交流和共享内存,因此它们将其视为一个统一的GPU-至少就NVIDIA的软件和许可而言。

但是,随着Nvidia的发布,这种技术例外不会持续很长时间维拉·鲁宾(Vera Rubin)SuperChips将包含B300风格的命名约定,并开始将单个模具算作GPU,因此将其命名为NVL144。

这也是NVIDIA的Vera Rubin Ultra平台,于2027年下半年可以要求576 GPU每个架子。正如我们之前探索的那样,实际上只是144个模块 - 在Blackwell Ultra之前,我们本来会考虑一个GPU,每个模块有四个模块。

如果我们不得不猜测,自Nvidia揭幕Blackwell以来,我们将在这一年中赌注,GPU巨头意识到它正在将订阅软件收入放在桌面上。我们说这看起来是因为当我们问Nvidia时,命名变更将如何影响AI Enterprise许可时,他们告诉我们定价细节尚未完成。

一位发言人说:“定价细节仍在最终确定B300,而GTC主题演讲中显示的鲁宾没有任何细节可以分享。”El Reg。®

关于《NVIDIA的新GPU定义可能意味着价格更高的AI软件》的评论


暂无评论

发表评论

摘要

NVIDIA改变了对GPU构成的定义,从计数SXM模块转变为其中的个体死亡。此举会影响NVLINK命名法,并可能增加每个系统可以收取的AI企业许可证的数量。HGX B300现在将每个模具视为单独的GPU,增加了成本,但并没有显着提高先前模型的性能。但是,此更改仅适用于气冷系统。更强大的GB300 NVL72系统由于芯片到芯片互连而保留了较旧的命名约定。NVIDIA的Vera Rubin Superchips将遵循新的B300风格大会,以将死亡视为单个GPU。