日本 NVIDIA AI 峰会 –NVIDIA 今天宣布与软银公司开展一系列合作,旨在加速日本主权 AI 计划并进一步巩固其全球技术领先地位,同时为全球电信提供商释放数十亿美元的 AI 收入机会。
NVIDIA 创始人兼首席执行官黄仁勋在 NVIDIA 日本人工智能峰会上发表主题演讲时宣布,软银正在利用英伟达布莱克威尔平台,并计划在其下一代超级计算机中使用 NVIDIA Grace Blackwell 平台。
此外,NVIDIA 透露软银正在使用NVIDIA AI 航拍加速计算平台已成功试运行世界上第一个人工智能和 5G 相结合的电信网络,这是计算领域的一项突破,为电信运营商打开了潜在价值数十亿美元的人工智能收入流。
NVIDIA 和 SoftBank 还宣布,使用NVIDIA 人工智能企业软件方面,软银的目标是创建一个能够满足本地、安全人工智能计算需求的人工智能市场。这项新服务支持人工智能训练和边缘人工智能推理,使软银成为日本的人工智能网格,为日本各行业、消费者和企业创建、分发和使用人工智能服务创造新的商机。
“日本在具有全球影响力的技术创新方面有着悠久的历史,”黄说。– 随着软银对 NVIDIA 全栈 AI、Omniverse 和 5G AI-RAN 平台的巨额投资,日本正在跃入 AI 产业革命,成为全球领导者,推动全球经济增长进入新时代电信、交通、机器人和医疗保健行业将在人工智能时代极大地造福人类。”
“世界各国和地区正在加速采用人工智能促进社会和经济增长,社会正在经历重大变革。”软银总裁兼首席执行官宫川淳一表示。– 通过与 NVIDIA 的长期合作,软银正在引领这一变革。凭借我们极其强大的人工智能基础设施以及为人工智能重塑 5G 网络的新型分布式 AI-RAN 解决方案“AITRAS”,我们将加速全国乃至全世界的创新。”
软银率先接收布莱克威尔,格蕾丝·布莱克威尔的计划
软银预计将获得全球首个NVIDIA DGX™ B200 系统,这将作为其新的构建块NVIDIA DGX SuperPOD™超级计算机。
软银计划将其由 Blackwell 驱动的 DGX SuperPOD 用于自己的生成式人工智能开发和人工智能相关业务,以及日本各地的大学、研究机构和企业。
完成后,软银的 DGX SuperPOD 预计将成为日本迄今为止性能最好的产品。配备 NVIDIA AI Enterprise 软件和NVIDIA Quantum-2 InfiniBand 网络,它也非常适合大型语言模型的开发。
除了 DGX SuperPOD 之外,软银还计划建造另一台 NVIDIA 加速的超级计算机来运行计算极其密集的工作负载。该超级计算机的初步计划基于 NVIDIA Grace Blackwell 平台设计,该平台具有以下特点:NVIDIA GB200 NVL72多节点、液冷、机架级系统,将 NVIDIA Blackwell GPU 与基于 Arm 的高能效 NVIDIA Grace™ CPU 相结合。
AI-RAN达到新里程碑
软银与 NVIDIA 密切合作,实现了一个技术里程碑——开发了一种可以同时运行 AI 和 5G 工作负载的新型电信网络,被业界称为人工智能无线接入网络,或者人工智能无线接入网。
这种新型基础设施得到了电信行业广泛的生态系统支持,因为它使运营商能够将基站从成本中心转变为人工智能创收资产。
通过在神奈川县进行的户外试验,软银证明其 NVIDIA 加速的 AI-RAN 解决方案已实现运营商级 5G 性能,并且能够在利用网络过剩容量同时运行 AI 推理工作负载的同时实现这一目标。
传统的电信网络旨在处理峰值负载,但平均而言仅使用了该容量的三分之一。借助 AI-RAN 提供的通用计算能力,预计电信公司现在有机会将人工智能推理服务的剩余三分之二容量货币化。
NVIDIA 和 SoftBank 估计,电信运营商每投资 1 美元新的 AI-RAN 基础设施,就能获得大约 5 美元的人工智能推理收入。(1)考虑到运营支出和资本支出成本,软银估计其基础设施中添加的每台 AI-RAN 服务器均可实现高达 219% 的回报。(2)
在 AI-RAN 上运行真实世界推理
在此次试验中,软银使用 NVIDIA AI Enterprise 构建真实世界的 AI 推理应用程序,包括自动驾驶车辆远程支持、机器人控制和边缘多模态检索自动生成。所有推理工作负载都能够在 SoftBank 的 AI-RAN 网络上以最佳方式运行。
SoftBank 完全软件定义的 5G 无线电堆栈针对 NVIDIA 的 AI 计算平台进行了优化,并包括由 SoftBank 基于NVIDIA Aerial™ CUDA® 加速 RAN 库。软银计划合并NVIDIA 空中 RAN Computer-1据估计,该系统的能耗比传统 5G 网络基础设施少 40%,(3)进入其前进的解决方案。
为软银 AI-RAN 解决方案的试验做出贡献的 NVIDIA 和软银合作伙伴包括富士通和红帽。
供应与需求相匹配
由于 AI-RAN 解决方案需要根据需求和供应动态地提高或降低计算速度,同时又不影响实时运营商级性能,因此软银旨在通过使用 NVIDIA AI Enterprise Serverless 构建一个连接 AI 技术需求和供应的生态系统应用程序编程接口及其内部开发的协调器。这使得 SoftBank 能够在计算资源可用于提供本地化、低延迟、安全的推理服务时将外部 AI 推理作业分派到 AI-RAN 服务器。
NVIDIA 电信高级副总裁 Ronnie Vasishta 表示:“从单一用途 AI-RAN 网络转变为多用途 AI-RAN 网络可能意味着每投资一美元资本支出就能获得 5 倍的收入。”“软银的现场试验标志着 AI-RAN 商业化迈出了一大步,验证了技术可行性、性能和经济性。”
SoftBank 的“AITRAS”是与 NVIDIA 历时五年合作开发的首个 AI-RAN 解决方案。它通过 SoftBank 开发的协调器集成和协调 AI 和 RAN 工作负载,通过在单个 NVIDIA 加速 GPU 服务器上运行密集单元来提高通信效率。”软银。“我们相信,AI 驱动的创新 AITRAS 将为电信领域的新商业模式铺平道路,成为移动运营商转型的关键因素。”
了解有关 NVIDIA 解决方案的更多信息人工智能无线接入网。