英国基于 Arm 的 Isambard 2 超级计算机永久关闭 - The Register

2024-10-02 08:27:00 英文原文

英国基于 Arm 的 Isambard 2 超级计算机永久关闭

Isambard 3 和 AI 兄弟姐妹将接过火炬

英国的 Isambard 2,其中之一早期基于 Arm 的超级计算机在运行了短短几年后就正式退役了。它被更强大的 Isambard 3 和 Isambard-AI 取代,正如英国超级计算进入资金不确定期一样。

Isambard 2 于 9 月 30 日上午 9 点结束服务,但提前几天开始逐渐耗尽资源布里斯托大学高性能计算教授 Simon McIntosh-Smith 宣布了这一举措,他表示:“Isambard 3 今天将使用 Nvidia Grace Arm 来接管 -”

根据 McIntosh-Smith 的说法,Isambard 2 将在服役六年后退役,但他似乎指的是 Isambard 第一个版本上线的日期。

他告诉 The Register:“Isambard 3 早期访问使用已于上周开始,并将在未来几个月内逐步增加。一旦系统成功运行几个月,我们将通过验收并投入全面生产该系统早在 2017 年就作为世界上第一台基于 Arm 的生产超级计算机亮相。它基于 Cray XC50 架构,由 10,496 个 ThunderX2 核心提供支持。

基于该系统的成功,由巴斯大学、布​​里斯托大学、埃克塞特大学和卡迪夫大学组成的 GW4 联盟获得了资金2020 年 2 月,工程与物理科学研究委员会 (EPSRC) 邀请他创建 Isambard 2,当时被誉为欧洲最大的基于 Arm 的超级计算机。

这位教授向 The Reg 提供了一些令人印象深刻的 Isambard 2 统计数据,指出“自 2018 年 5 月以来”该大学已跟踪:

所有工作的核心总工时:6.4 亿小时
执行的作业总数 = 321k
最大作业 = 20,992 个核心(基本上是整台机器)
每个作业的平均大小 = 345 个核心(每个节点为 64 个核心,为双路 ThunderX2,因此平均为 5.4 个节点)

他补充道:“对于一台中等大小的机器来说,640M 核心时间给我留下了深刻的印象!”

Isambard 2 是在现有集群的基础上构建的,但核心数量增加了一倍多,达到 21,504 个跨 336 个节点,并且还包含由富士通 A64FX CPU 提供支持的 72 个节点的分区,该 CPU 与为 Fugaku 超级计算机(以前是世界上最强大的系统)提供支持的芯片相同。

其继任者 Isambard 3 已发布去年,并将 ThunderX2 核心替换为 Nvidia 的 Grace 超级芯片,该芯片被描述为第一款基于 Arm 的服务器 CPU,专门针对顶级芯片供应商的 HPC 进行了优化。

安装在专门建造的设施中位于布里斯托尔巴斯科学园的 Isambard 3 配备 384 个 Nvidia Grace 芯片,每个芯片包含 144 个核心,总​​计 55,296 个计算核心,能够实现 2.7 petaFLOPS 双精度 64 位浮点性能,同时功耗不到 270 千瓦据 Nvidia 称,英国政府将在 2023 年晚些时候提供 2.25 亿美元(2.99 亿美元)用于建造一台名为 Isambard-AI 的独立人工智能超级计算机。它基于 Nvidia 的 Grace-Hopper 芯片,该芯片将 Arm CPU 与该公司的 GPU 芯片结合在一起。

  • 英特尔放弃了对英国 Dawn AI 超级计算机的关注
  • 英国押注于英特尔 CPU 和 GPU、Dell boxen、用于 Dawn 超级计算机的 OpenStack
  • 英国政府为由 Nvidia 提供支持的 Isambard-AI 超级计算机找到了 2.25 亿美元
  • HPE 签订了为英国和日本研究人员建造 HPC 巨兽的合同

正如我们的合作伙伴网站 The Next Platform 所详细介绍的那样,GW4 联盟本质上被全权委托建造最大的机器,主要限制因素是该网站的可用电力,这使得 Isambard-AI 能够包含 5,448 个 Nvidia GH200 Grace-Hopper 芯片,使其成为英国最强大的计算机。

Isambard-AI 部署的第一阶段已于 5 月完成,仅包含 168 个芯片Grace-Hopper 超级芯片的完整补充。然而,即使如此,也足以让该系统在 ISC 高性能 2024 活动上发布的高性能系统 TOP500 列表中排名第 128 位。

但是,英国其他高性能系统计算领域的进展并不那么顺利。8 月,宣布上届政府计划在爱丁堡建造的百亿亿次计算机已被即将上任的政府取消。

同一公告还为人工智能研究预留了 5 亿(6.64 亿美元)额外资金资源计划被放弃,这对另一个超级计算计划产生了连锁反应,即由英特尔、戴尔和剑桥大学构建的 Dawn 系统。

去年 11 月宣布的 Dawn 分两期构建阶段。第一阶段已经完成,并被认为与英国之前最快的超级计算机 Archer2 相当,正如 The Register 去年详细介绍的那样,Archer2 目前在 Top500 中排名第 39 位。第二阶段预计将性能提高 10 倍,但目前尚不清楚现在是否会为此提供资金。

据英国《金融时报》报道,一位高级政府人士声称爱丁堡百亿亿次计算项目“没有什么战略意义”因为它并不专注于人工智能。

当美国的研究人员可以使用两个百亿亿级系统,欧盟正在准备一个,而中国可能已经有几个时,这种想法很难理解。也许,正如 The Next Platform 所暗示的那样,英国科学家将不得不希望升级后的 Isambard 4 能够成为该国第一台真正的百亿亿次计算机。

关于《英国基于 Arm 的 Isambard 2 超级计算机永久关闭 - The Register》
暂无评论

摘要

英国基于 Arm 的 Isambard 2 超级计算机永久关闭 Isambard 3 和 AI 兄弟将接过火炬英国的 Isambard 2 是早期基于 Arm 的超级计算机之一,在运行了几年后已正式退役。布里斯托大学高性能计算教授 Simon McIntosh-Smith 宣布了这一举措,他表示:“Isambard 3 今天将使用 HPE 提供的基于 Nvidia Grace Arm 的 CPU 来接管。”根据 McIntosh-Smith 的说法,Isambard 2 是服役六年后退休,但他似乎指的是伊桑巴德第一世上线的日期。它的继任者 Isambard 3 于去年发布,将 ThunderX2 核心替换为 Nvidia 的 Grace 超级芯片,该芯片被描述为第一款基于 Arm 的服务器 CPU,专门针对顶级芯片供应商的 HPC 进行了优化。Dawn于去年11月宣布,分两期建设。第一阶段已经完成,并被认为与英国之前最快的超级计算机 Archer2 相当,正如 The Register 去年详细介绍的那样,Archer2 目前在 Top500 中排名第 39 位。