作者:Dina Genkina
正在改变一切数据中心:新AI特定筹码, 新的冷却技术和新的存储驱动器。现在even保留时间的方法开始改变,公告从公司开发的现场针对AI工作负载进行了优化的新时钟。该公司表示,该开发项目将带来大量节能,并降低了AI培训和推理的成本。
Sitime能够通过使用微机电系统((mems)作为核心计时组件,而不是传统石英晶体。
计算机的几乎每个部分都有某种时钟。CPU,GPU,网络接口卡,开关,有时甚至是活动互连包含自己的计时部分。更传统计算工作负载,这些时钟通常分为两类:快速,精确的定时时钟或时钟,这些时钟或时钟在多个GPU(或CPU)中均具有很好的同步。伊恩·切尔斯,比摩尔的首席分析师以及与Sitime合作的人。
AI的问题是,这两者都在做。您希望您的芯片尽可能快地进行,但是您也想在100,000芯片上同步。
Sitime的Super-TCXO时钟将超稳定和同步时钟的功能结合到单个设备中,提供的同步是基于可比的石英的3倍成分每秒的带宽为800千兆位,在芯片中,大小的四分之一。
AI是渴望数据的野兽。然而,昂贵且耗能的gpus闲置到57%的时间等待他们的下一个数据。如果可以更快地提供数据,则可以以较小的量和更有效地使用GPU。
您需要更快的带宽。因为您需要更快的带宽,所以您需要更好的时机。Piyush Sevalia,现场营销执行副总裁。
Cutress说,此外,如果可以将GPU放入睡眠模式时,则可以节省大量功率。这也需要更精确的时机,以便可以迅速发生睡眠效果周期以跟上数据流。
对于AI,时钟不仅需要更精确,而且在许多GPU中也完美地同步。大的AI模型将他们的任务分开在许多GPU中,每个GPU都进行了一小部分计算。然后,他们的结果将其缝合在一起。如果一个GPU滞后于其他人,整个计算将必须等待该节点。换句话说,计算仅与最弱的链接一样快。所有GPU在等待时仍保持打开状态,因此任何此类延迟都会导致能量损失。
时间必须精确,同步良好,并且必须补偿任何机械振动或温度波动的鲁棒,以确保它们不会抛弃计算。Sitime的Super-TCXO旨在将所有三个要求结合在单个设备中。
塞瓦利亚说,使用MEMS振荡器而不是传统的石英使该组合成为可能。石英振荡器使用精确加工的石英晶体的振动,类似于调谐叉。相反,MEMS振荡器是在特定频率上产生的,而不是加工的。MEMS设备可能更小,这使其对机械应变敏感。它们也可以更精确。
自从计算是一件事情以来,水晶振荡器就已经存在了戴夫·阿尔塔维拉(Dave Altavilla),总裁兼首席分析师Hottech愿景与分析谁也与现场合作。自从其成立以来,我们会极大地改进该技术。但是MEMS将其远远超出了晶体能力的范围。因此,这是我认为这项新技术在市场上流离失所的是旧的做事方式。
Siteme的基于MEMS的解决方案已经在NVIDIA的Spectrum-X开关硅已经取得了一些成功已经包含了现场设备。
塞瓦利亚说,他希望需要基于MEMS的时机设备继续进行。该公司已经在计划更高的带宽设备,他们希望自己的创新能够节省更多的能源。我们只是在弄清楚多少能源效率塞瓦利亚说,我们可以带来。