英语轻松读发新版了,欢迎下载、更新

IBM 在消耗电力的同时实现光速 AI 训练

2024-12-10 23:11:19 英文原文

作者:By David Szondy

IBM 提出了一种方法,通过将铜线换成光束来连接数据中心组件,使训练和运行生成式 AI 模型的速度提高五倍,并且更加节能。

我们数字时代的悖论是,随着计算机变得越来越小,问题却变得越来越大。随着芯片中塞满更多的晶体管,直至数量达到数十亿,它们使得大规模数据中心和现代生成人工智能模型所需的处理能力成为可能。然而,随着这些模型的发展,它们需要越来越多的处理能力,数据中心已成为主要的能源消耗者,芯片本身不仅在挑战其技术的极限,而且也在挑战物理定律。

这些数据中心的两个技术和物理瓶颈是简单的铜线和电子沿着铜线流动的速度。这是电子产品如此紧凑的主要原因之一。这不仅仅是为了方便。这是因为随着计算机变得更快、更强大,数据从一个组件传输到另一个组件所需的时间成为一个主要的性能因素。

事实上,电子形式的数据已经成为一个瓶颈,大多数 CPU 大部分时间都处于闲置状态,在等待下一个数据包到达时消耗能量。

为了加快速度,IBM 开发了据称是下一代光学技术。使用光学来转移数据并不是什么新鲜事。几十年来,它一直被用来通过光缆将信息从一个地方传输到另一个地方。然而,这主要是针对长距离。一旦数据到达并进入计算机本身,它就会返回到铜线。

为了克服这个问题,IBM 正在转向一种新工艺,以聚合物光波导 (PWG) 的形式创建共封装光学 (CPO),该工艺可在光子集成电路 (PIC) 和单模等外部连接之间路由光信号纤维(SMF)。该公司表示,PWG 的测试表明,如果将其用于数据中心,所需的电力将比传统版本少五倍,并允许电缆连接从一米延伸到数百米,从而实现更灵活的架构,同时每传输太比特数据。第二。

IBM 声称,训练一个 AI 模型所减少的功耗足以运行 5,000 个美国家庭一年,并且由于具有 80 倍的带宽,使用光可以将训练 AI 大型语言模型的时间从三个月减少到三周的传统系统。

IBM 高级副总裁兼研究总监 Dario Gil 表示:“由于生成式 AI 需要更多的能源和处理能力,数据中心必须不断发展,而共同封装的光学器件可以使这些数据中心面向未来。”“凭借这一突破,明天的芯片将像光纤电缆将数据传入和传出数据中心一样进行通信,从而开创一个更快、更可持续的通信新时代,可以处理未来的人工智能工作负载。”

来源:国际商业机器公司

关于《IBM 在消耗电力的同时实现光速 AI 训练》的评论


暂无评论

发表评论

摘要

IBM 开发了一种新的光学技术,通过使用光束而不是铜线来连接数据中心组件,使生成式 AI 模型的速度提高五倍,并显着提高能源效率。这项创新解决了与数据传输速度和能耗相关的瓶颈,允许在数百米范围内实现每秒太比特的数据传输,同时降低功耗。IBM声称,这项技术训练AI模型的速度比传统系统快80倍,并且在训练过程中节省的能源足以为5000个美国家庭供电一年。