英语轻松读发新版了,欢迎下载、更新

NVIDIA首次部署的最新顶级AI超级计算机 - Grace Blackwell Ultra SuperChip系统部署在CoreWeave

2025-07-03 18:53:56 英文原文

作者:Anton ShilovSocial Links NavigationContributing Writer

Dell's GB300 NVL72 servers running at CoreWeave/Switch.
(图片来源:CoreWeave,Switch)

戴尔周四表示,它已经交付了行业的第一个系统,建立在NVIDIA的GB300 NVL72平台上,为领先的AI云服务提供商(CSP)CoreWeave。CoreWeave表示,它已通过其数据中心托管提供商开关部署了Blackwell Ultra的集群。 

戴尔(Dell's)和Coreweave的最初推出涉及配备72个NVIDIA Blackwell Ultra GPU,36个基于ARM的72核Grace CPU和36 Bluefield DPU的Dell Integrated架子。每个GB300 NVL72机架均可提供1.1个浓密的FP4推理和0.36 FP8训练性能的Exaflops,与GB200 NVL相比,它高出50%。此外,每个GB300 NVL72机架都具有20 TB的HBM3E和40 TB的总RAM。最后,新的机架规模解决方案依赖于NVIDIA的Quantum-X800 Infiniband开关和ConnectX-8超级渠道,用于扩展连接,最多为14.4 GB/s,是以前的两倍。 

这些用于最大化训练和推理性能的密集配置的系统由于极端的功耗(每GPU高达1,400W)而被液体冷却。 

该公司的一份声明说:“戴尔(Dell)的NVIDIA GB300驱动解决方案不仅仅是一个里程碑。”"It reflects the trust our customers and partners continue to place in our expertise. By seamlessly engineering the compute, the network and the storage under one roof and fine-tuning with integration and deployment services, we help our customers move at unprecedented speed and scale. It is the continued innovation and speed that only we can execute that is allowing us to empower incredibly cool customers and accelerate work with partners like CoreWeave, Nvidia and many其他。” 

戴尔指出,机架尺度系统进行了组装和测试,并设计用于快速安装和部署用于生产使用。这是戴尔(Dell)和CoreWeave第二次在该行业之前部署NVIDIA最新的AI GPU平台。这项成就是由NVIDIA的紧密工作造成的,将硬件,软件和服务结合到可以快速部署的集成产品中。 

部署将使CoreWeave能够增强其云平台,以处理更高级的大型语言模型培训,推理过程和推断。随着CoreWeave采用更多基于GB300 NVL72的机架,其客户可用的总绩效将提高。 

值得注意的一件有趣的事情是,Dell和CoreWeave部署GB300 NVL72机架他们部署第一个GB200 NVL72机器后约七个月这就提出了一个关于原始GB200平台的寿命的问题(该平台的延迟有点延迟,但仍然如此)。从CSP的角度来看,与原始的Blackwell Systems相比,投资更高的Blackwell Ultra机器更有意义。因此,也许,对Nvidia的Blackwell Ultra有很多要求的需求,因此Nvidia的销售量比上半年的销售量更高。

获取汤姆(Tom)的硬件的最佳新闻和深入的评论,直接进入收件箱。

跟随 汤姆在Google新闻上的硬件``在您的提要中获取最新的新闻,分析和评论。确保单击“关注”按钮。

安东·希洛夫(Anton Shilov)是汤姆(Tom)硬件的撰稿人。在过去的几十年中,他涵盖了从CPU和GPU到超级计算机的所有内容,从现代流程技术和最新工厂工具到高科技行业的趋势。

关于《NVIDIA首次部署的最新顶级AI超级计算机 - Grace Blackwell Ultra SuperChip系统部署在CoreWeave》的评论


暂无评论

发表评论

摘要

戴尔(Dell)基于NVIDIA的GB300 NVL72平台提供了系统,并向AI Cloud Service提供商CoreWeave提供了系统。CoreWeave用开关数据中心托管服务部署了一个基于Blackwell Ultra的集群。每个戴尔集成的架子包括72个NVIDIA Blackwell Ultra GPU,36 ARM GRACE CPU和36 Bluefield DPU,提供1.1个推理性能和0.36埃克拉弗洛普的训练性能 - 比GB200 NVL平台高出50%。该系统具有高功耗而具有高级冷却,并使用NVIDIA的Quantum-X800 Infiniband开关来更快地进行扩展连接。这种部署使CoreWeave能够增强其云平台,以实现更复杂的AI任务,随着部署更多的机架,可能会提高客户可用的性能。