自媒体写作的 QRIES 方法论,初学者如何写出让人信服的好文章

Nvidia 推出一款新的 CPU 和 GPU 合并 AI 处理器 — GB200 Grace Blackwell NVL4 Superchip 拥有四个 B200 GPU、两个 Grace CPU

2024-11-19 19:25:23 英文原文

作者:Aaron KlotzSocial Links NavigationContributing Writer

Nvidia H200 NVL PCIe GPU
(图片来源:Nvidia)

Nvidia 宣布推出两款产品:GB200 NVL4(一款配备两个 Grace CPU 的巨型四核 B200 GPU 模块)和 H200 NVL PCIe GPU(针对风冷数据中心)。

GB200 Grace Blackwell NVL4 Superchip 是标准(非 NVL4)双 GPU 变体的更强大的变体,具有多达四个B200Blackwell GPU 通过 NVLink 相互连接,并且两个Grace 基于 ARM 的 CPU全部在一块主板上。该解决方案针对具有高达 1.3TB 一致性内存的 HPC 和 AI 混合工作负载。Nvidia 宣传 GB200 NVL4 的模拟性能、训练性能和推理性能分别是 Nvidia GH200 NVL4 Grace Hopper Superchip(其直接前身)的 2.2 倍、1.8 倍和 1.8 倍。

Nvidia 表示,GB200 NVL4 超级芯片将于 2024 年 2H 上市,多家供应商包括 MSI、华硕、技嘉、纬创、和硕、华擎 Rack、联想、HP Enterprise 等。

Nvidia 的 H200 NVL 是一款双插槽风冷 GPU,具有 PCIe 5.0 连接(128 GB/s)。该冷却器针对机架安装解决方案进行了优化,采用流通式设计,进气从右向左流动;没有鼓风机式风扇。

性能比Nvidia的略差H200采用 SXM 外形规格。H200 NVL 的 FP64 额定值为 30 TFLOPS,FP32 的额定值为 60 TFLOPS。张量核心性能额定为 FP64 的 60 TFLOPS、TF32 的 835 TFLOPS、BFLOAT16 的 1,671 TFLOPS、FP16 的 1,671 TFLOPS、FP8 的 3,341 TFLOPS 和 INT8 的 3,341 TFLOPs。

然而,Nvidia 表示 H200 NVL 比它所取代的 H100 NVL 快得多。其内存容量提高了 1.5 倍,内存带宽提高了 1.2 倍,推理性能提高了 1.7 倍,HPC 工作负载性能提高了 1.3 倍。Nvidia 还快速与 Ampere 进行比较,表示 H200 NVL 比 Ampere 的同等 GPU 快 2.5 倍。

H200 NVL PCIe GPU 针对绝大多数数据中心配置(包括风冷服务器机架)进行了优化。Nvidia 表示,根据一项调查,大约 70% 的企业机架使用风冷和 20kW 或更少的功率。作为 PCIe GPU,数据中心提供商可以重复使用现有机架,仅更换 GPU,从而减少浪费并显着降低升级硬件的成本。H200 NVL 还配备了 NVLink,为每个 GPU 提供高达 900 GB/s 的带宽,使系统提供商能够在单个设备中连接最多四个 GPU 以提高性能。

将 Tom's Hardware 的最佳新闻和深入评论直接发送到您的收件箱。

Nvidia 的新型风冷 GPU 面世之际,Nvidia 的 Blackwell GPU 正面临着严重的问题。过热问题。尽管使用成熟的液体冷却系统,系统集成商仍被迫重新设计 Blackwell GPU 支持的服务器机架,因为 GPU 在机架中的散热量巨大,仅消耗高达 120KW 的功率。H200 NVL 甚至不是一个强有力的竞争对手B200,但Nvidia的风冷数据中心GPU凸显了低功耗风冷GPU的显着优势。

H200 NVL 可从多个供应商处获得,例如戴尔、惠普企业版、联想和 Supermicro。此外,新的 GPU 将在 Aivres、华擎 Rack、华硕、技嘉、英格拉科技、英业达、微星、和硕、QCT、纬创资通和纬颖科技的平台上提供。

Aaron Klotz 是《Tom’s Hardware》的特约撰稿人,报道与计算机硬件(例如 CPU 和显卡)相关的新闻。

关于《Nvidia 推出一款新的 CPU 和 GPU 合并 AI 处理器 — GB200 Grace Blackwell NVL4 Superchip 拥有四个 B200 GPU、两个 Grace CPU》的评论


暂无评论

发表评论

摘要

Nvidia 推出了两款新产品:GB200 NVL4,这是一款带有两个 Grace CPU 的四核 B200 GPU 模块,专为高性能计算 (HPC) 和 AI 工作负载而设计;以及 H200 NVL PCIe GPU,这是一种适用于需要较低功耗的数据中心的风冷解决方案。GB200 NVL4 拥有 1.3TB 相干内存,预计多家供应商将于 2024 年末上市。H200 NVL 的性能优于其前身,具有更高的内存容量和带宽,并针对企业环境中常见的风冷服务器机架进行了优化。