英语轻松读发新版了,欢迎下载、更新

Oracle云基础架构部署成千上万的NVIDIA BLACKWELL GPU用于代理AI和推理模型

2025-04-28 13:04:24 英文原文

作者:Ian Buck

Oracle站起来并优化了其第一波液冷NVIDIA GB200 NVL72数据中心的架子。现在正在部署成千上万的Nvidia Blackwell GPU,并准备在客户使用NVIDIA DGX云Oracle云基础架构(OCI)开发和运行下一代推理模型和AI代理。

Oracle的最新GB200部署包括高速NVIDIA Quantum-2 Infiniband和NVIDIA Spectrum-X以太网联网以实现可扩展的低延迟性能,以及一大堆软件和数据库集成来自NVIDIA和OCI。OCI是世界上最大,增长最快的云服务提供商之一,是最早部署NVIDIA GB200 NVL72系统的人之一。

该公司有雄心勃勃的计划,计划建立世界上最大的布莱克韦尔集群之一。OCI超级流行器将扩展超过100,000个NVIDIA Blackwell GPU,以满足全球对推理令牌和加速计算的飞速需求。随着包括OpenAI在内的几家公司在过去的几周中发布了新的推理模型,AI创新的蓬松速度一直在继续。

OCI的安装是Nvidia Grace Blackwell系统在全球范围内进行在线的最新示例,将云数据中心转变为AI工厂,以规模生产智能。这些新的AI工厂利用了NVIDIA GB200 NVL72平台,这是一个结合了36个Nvidia Grace CPU和72 NVIDIA Blackwell GPU的机架规模系统,为代理AI提供了出色的性能和能源效率,该代理AI由高级AI AI推理模型供电。

OCI提供了灵活的部署选项,将布莱克威尔带给公众,政府和主权云以及客户拥有的数据中心的布莱克威尔OCI专用区域OCI合金任何规模。

许多客户计划在OCI GB200系统中立即部署工作负载,包括主要技术公司,企业客户,政府机构和承包商以及区域云提供商。

这些新机架是第一个可用的系统NVIDIA DGX云这是一个具有软件,服务和技术支持的优化平台,以在OCI等领先的云上开发和部署AI工作负载。NVIDIA将使用架子进行各种项目,包括培训推理模型,自动驾驶汽车开发,加速芯片设计和制造以及开发AI工具。

GB200 NVL72机架已直播,现在可从DGX Cloud和OCI获得。

关于《Oracle云基础架构部署成千上万的NVIDIA BLACKWELL GPU用于代理AI和推理模型》的评论


暂无评论

发表评论

摘要

Oracle在数据中心部署了第一个液冷NVIDIA GB200 NVL72机架,配备了数千个NVIDIA Blackwell GPU,可用于Oracle Cloud Infrastructure(OCI)和NVIDIA DGX Cloud。部署包括NVIDIA和OCI的高速网络和完整的软件集成,旨在建立世界上最大的Blackwell群集之一,超过100,000 GPU。OCI在各种云类型和数据中心提供了灵活的部署选项。主要的技术公司,企业,政府机构和区域云提供商正在计划有关AI开发系统,自动驾驶汽车项目,芯片设计等的这些系统的立即工作量。