合作将推动以太网进入 HPC 和人工智能的未来

2024-11-12 18:27:51 英文原文

作者:Timothy Prickett Morgan

任何时候,只要你能让很多公司拥有技术娴熟且固执己见的人员,共同解决一个或一组问题,那么你就知道确实存在问题。大规模以太网网络的许多问题去年夏天促成了超以太网联盟的成立,现在有超过一百个组织参与,并且正在努力交付其第一个规范。

UEC 的创始成员都参与了网络游戏、HPC 和 AI 系统领域,其中以太网需要得到支持和扩展,以弥补当前以太网和 InfiniBand 结构的局限性,这些结构通常用于功能-过去十年的阶级制度。

创始人包括 AMD、Arista Networks、Broadcom、Cisco Systems、Atos 的 Eviden 分拆公司、Hewlett Packard Enterprise、Intel、Meta Platforms 和 Microsoft。Nvidia 最初不是成员,但最近加入,以支持一些关于如何创建每个端口具有多个太比特且可扩展到超过 100 万个端点的以太网的想法。在大多数情况下,所讨论的端点是用于进行人工智能训练计算的矢量和张量加速器。

为了了解 UEC 的全部内容以及工作进展情况,我们与该联盟指导委员会主席 J Metz 进行了交谈。在加入 AMD 担任系统设计技术总监之前,Metz 曾在 Apple、QLogic、Cisco Systems 和 Rockport Networks 从事工程工作。他还是光纤通道行业协会、NVM-Express 联盟和存储网络行业协会的董事会成员,并且了解标准机构的运作方式,其中包括来自不同参与者和专家的意见。

在本系列的第一部分中,我们讨论了 UEC 的使命,即打破 OSI 模型中的障碍以及维护该模型不同层中的技术的人员,以及就以下问题达成共识的过程:如何发展以太网以及何时设定不同的里程碑。我们还讨论了 UEC 没有试图做的事情,至少最初没有,因为在不破坏与过去兼容性的情况下创建一个更具可扩展性的以太网是一项非常艰巨的任务。

我们希望您喜欢本次对话的第一部分,您所需要做的就是点击上面的视频链接,您就可以听到梅斯所说的话。

订阅我们的时事通讯

我们将本周的亮点、分析和故事直接发送到您的收件箱,中间没有任何中间环节。
立即订阅

关于《合作将推动以太网进入 HPC 和人工智能的未来》的评论


暂无评论

发表评论

摘要

去年夏天,超以太网联盟 (UEC) 的成立解决了大规模以太网网络的重大问题。UEC 由 AMD、Arista Networks、Broadcom、Cisco Systems、Intel、Meta Platforms 和 Microsoft 等 100 多个组织组成,旨在开发更强大的以太网规范,能够每个端口处理多个太比特并扩展到超过 100 万个端点,特别是在 HPC 和 AI 系统中。UEC 指导委员会主席 J Metz 讨论了该联盟的使命、其标准化方法以及其最初对与现有技术兼容性的关注。