OSC 通过增强 GPU 能力扩展 Ascend 集群,用于人工智能和医学研究 - HPCwire

2024-09-27 18:13:39 英文原文

与 OSU 的新联盟将为所有客户提供用于高性能计算的先进人工智能资源

俄亥俄州哥伦布,2024 年 9 月 27 日俄亥俄州超级计算机中心 (OSC) 将提供扩展的高性能计算服务与俄亥俄州立大学韦克斯纳医学中心和俄亥俄州立大学医学院合作,将于 2025 年初在其 Ascend 集群上提供性能计算 (HPC) 资源。

俄亥俄州立大学韦克斯纳医学中心已转让了一个研究计算集群迁移至 OSC,这将为所有 OSC 学术和商业客户的 Ascends 当前配置的 HPC 能力提高六倍。

OSC 与俄亥俄州立大学医学院有着密切的关系,并且超过OSC 副主任道格拉斯·约翰逊 (Douglas Johnson) 表示,过去十年来,我们提供了专门的资源来支持其教职员工的工作。当该学院向 OSC 寻求利用其硬件进行研究计算的机会时,我们知道我们必须找到一种方法来实现这一目标。如此庞大的资源的增加将为俄亥俄州立大学和我们的其他客户社区带来巨大的好处。

通过增强的 Ascend 资源,所有 OSC 客户,包括俄亥俄州立大学 Wexner Medical 的教职员工中心和医学院将获得更强大的计算硬件,受益于更短的等待时间,并可以在一个环境中简化其工作流程。改造后的集群将有助于培训下一代医学研究人员,并帮助俄亥俄州立大学进一步开展医学研究。

俄亥俄州立大学医学院和 OSC 合作扩展我们的数据分析能力的能力是一个胜利俄亥俄州立大学医学院院长卡罗尔·R·布拉德福德 (Carol R. Bradford) 表示:“我们致力于推动生物医学界的发展,并推进我们变革医学教育、研究和患者护理的使命。”Timothy R. Huerta 表示,现有 Ascend 集群的容量提高了六到七倍,并且它将硬件的日常管理交给了最有能力帮助我们有效利用投资的主题专家手中。俄亥俄州立大学医学院首席研究信息官。对于管理我们的资源以支持我们的共享发现任务而言,这种方法是最具成本效益的方法。

Ascend 集群上的附加图形处理单元 (GPU) 也将有助于适应不断增长的数量OSC 客户端使用 HPC 集群进行人工智能和机器学习工作。

OSC 最近的系统升级侧重于提供新的、先进的高性能计算资源,可以处理与人工智能、机器学习和机器学习相关的密集工作负载。数据分析研究,约翰逊说。我们看到了从医学和工程到社会科学和艺术等广泛学科的需求。

下一代版本的 Ascend 将是一个 ~14 PetaFLOP 系统,将具有额外 274 个戴尔节点,每个节点:

  • 两个 AMD EPYC 7H12 2.60GHz,每个 64 个内核,每台服务器 128 个内核。
  • 两个 NVIDIA Ampere A100、PCIe、250W、40GBGPU。
  • HDR100 Infiniband。

俄亥俄州立大学集群位于克利夫兰的一个设施中,配备价值 800 万美元的硬件,与当前的 Ascend 兼容集群,于 2022 年底推出。OSC 投资超过 100 万美元,将设备转移到位于哥伦布的俄亥俄州计算机中心的数据中心,并将其与 Ascend 集群集成。下一代系统预计将于 2025 年初全面上线。

OSC 正在监督下一代 Ascend 项目,同时完成其数据中心 Cardinal 集群的另一项重大扩建,预计于 11 月初推出。Cardinal 是一个基于 Dell Technologies 的集群,旨在支持俄亥俄州研究、教育和行业创新(特别是人工智能领域)对 HPC 资源日益增长的需求。

OSC 带来了这两个集群在接下来的几个月里,它将与客户密切合作,帮助他们过渡到新资源。Cardinal 将在今年秋天取代自 2016 年以来一直运行的 Owens 集群。此外,增强的 Ascend 集群将允许 OSC 将自 2018 年以来一直运行的 Pitzer 集群的部分用户迁移到高级资源。

我们将在OSC 的 HPC 客户服务经理 Brian Guilfoos 表示,未来几个月,Owens 将逐步退休,以便将工作负载适度转移到新资源。新的 Ascend 将像我们现有的集群一样进行配置,这将使迁移变得更加容易。OSC 将识别具有独特需求的客户,并帮助他们迁移项目和工作流程。

除了直接的客户沟通之外,OSC 还将在今年秋季举办有关其 HPC 集群发展的社区简报。如需了解更多信息,请访问 www.osc.edu。

OSC

俄亥俄州超级计算机中心 (OSC) 通过提供强大的共享基础设施来满足学术和工业研究社区不断增长的计算需求以及在高级建模、仿真和分析方面经过验证的专业知识。OSC 为科学家提供做出非凡发现和创新所必需的服务,与企业和工业界合作,利用计算科学作为全球知识经济的竞争力量,并努力为劳动力配备 21 世纪工作所需的关键技术技能。

来源:OSC

关于《OSC 通过增强 GPU 能力扩展 Ascend 集群,用于人工智能和医学研究 - HPCwire》的评论


暂无评论

发表评论

摘要

与 OSU 的新联盟将为所有客户提供用于高性能计算的先进人工智能资源俄亥俄州哥伦布,2024 年 9 月 27 日俄亥俄州超级计算机中心 (OSC) 将于 2025 年初在其 Ascend 集群上提供扩展的高性能计算 (HPC) 资源,与俄亥俄州立大学韦克斯纳医学中心和俄亥俄州立大学医学院合作。借助增强的升腾资源,所有 OSC 客户,包括俄亥俄州立韦克斯纳医疗中心和医学院的教职员工,都将获得更强大的计算硬件,受益于更短的等待时间,并可以在一个环境中简化工作流程。俄亥俄州立大学医学院院长卡罗尔·R·布拉德福德 (Carol R. Bradford) 表示,俄亥俄州立大学医学院和 OSC 能够合作扩展我们的数据分析能力,这对生物医学界来说是一场胜利,并推进了我们变革医学教育、研究和患者护理的使命。医学院。俄亥俄州立大学集群位于克利夫兰的一个设施中,配备价值 800 万美元的硬件,与 2022 年底启动的当前 Ascend 集群兼容。OSC 俄亥俄超级计算机中心 (OSC) 满足了学术界和学术界不断增长的计算需求。工业研究社区提供强大的共享基础设施和先进建模、模拟和分析方面经过验证的专业知识。