作者:by David Danelski, University of California - Riverside
在技术中探索了一种新型的计算机芯片,可以重塑人工智能的未来并更加环保评论论文由UC Riverside工程师发表在《期刊》上设备。
这些由脑力尺寸的加速器称为晶圆尺度的加速器,脑部制造的大规模芯片建在餐盘大小的硅晶片上,与传统的图形处理单元或GPU形成鲜明对比,而GPU并不大于邮票。
跨学科UCR团队的论文得出的结论是,随着AI模型的增长越来越大,需求越来越大,晶圆规模的处理器可以提供更多的计算能力。
UCR伯恩斯工程学院的电气和计算机工程教授Mihri Ozkan说:“晶圆规模的技术代表了一个重大飞跃。”“它使具有数万亿个参数的AI模型比传统系统更快,更有效。”
除奥兹坎外,合着者还包括UCR研究生Lily Pompa,MD Shaihan Bin Iqbal,Yiu Chan,Daniel Morales,Zixun Chen,Handing Wang,Lusha Gao和Sandra Hernandez Gonzalez。
GPU成为AI开发的重要工具,因为它们可以一次执行许多计算,非常适合处理图像,语言和数据流并联。同时执行数千个并行操作,使无人驾驶汽车可以解释周围的世界,以避免碰撞,以便从文本中生成图像,并为chatgpt提出来自特定成分清单的数十种餐食食谱。
但是,随着AI模型的复杂性的增加,即使高端GPU也开始遇到性能和能量限制。
Ozkan说:“ AI计算不仅仅是速度。”“这是关于设计系统可以移动大量数据而不会过热或消耗过多的电力的系统。”
UCR分析将当今的标准GPU芯片与晶圆尺度系统(如脑晶圆尺度发动机3(WSE-3))进行了比较,该系统在单个晶圆上包含4万亿晶体管和900,000个AI特异性核心。特斯拉的Dojo D1是另一个例子,包括每个模块的1.25万亿晶体管和近9,000个核心。这些系统经过精心设计,以消除在必须在多个较小芯片之间传播数据时发生的性能瓶颈。
Ozkan说:“通过将所有内容保持在一个晶圆上,您可以避免筹码到芯片交流所带来的延误和权力损失。”
该论文还突出了诸如片芯片式包装等技术,这些技术可能会使晶圆规模的设计更加紧凑,更易于扩展,并有可能增加40倍的计算密度。
尽管这些系统具有可观的优势,但它们并不适合每个应用程序。晶圆规模的处理器的制造成本很高,对于较小规模的任务而言,较小的处理器。传统的GPU具有模块化和可负担性,在许多情况下仍然至关重要。
奥兹坎说:“单芯片GPU不会消失。”“但是晶圆尺度的加速器对于培训最先进的AI型号是必不可少的。”
该论文还解决了AI:可持续性的日益关注。GPU驱动的数据中心使用大量的电力和水保持冷静。通过减少内部数据流量,晶圆规模的处理器消耗的每项任务能量要少得多。
例如,使用可比GPU系统所需的功率的一小部分,小脑WSE-3可以执行高达125亿亿美元的操作。它的体系结构可保持本地数据,从而降低能量抽取和热量输出。
同时,NVIDIA的H100 GPU是许多现代数据中心的骨干,具有灵活性和高吞吐量,但以更高的能源成本。每瓦的效率约为每秒7.9万亿美元的效率,它也需要广泛的冷却基础设施,通常涉及大量水。
奥兹坎说:“将GPU视为繁忙的高速公路有效,但交通拥堵浪费能源。”“晶圆尺度的发动机更像是单轨:直接,高效且污染更少。”
小脑报告说,其WSE-3系统上的推理工作负载使用六分之一的功率基于等效的GPU云设置。该技术已经用于气候模拟,可持续工程和碳捕获建模。
奥兹坎说:“我们看到晶圆规模的系统可以加速可持续性研究本身。”“这是计算机的胜利,是地球的胜利。”
但是,热量仍然是一个挑战。随着热设计功率达到10,000瓦,晶圆尺度芯片需要先进的冷却。小脑采用芯片包装中内置的基于乙二醇的环,而特斯拉则使用冷却液系统,该冷却液系统将液体均匀分布在整个芯片表面上。
作者还强调,系统总碳足迹的86%可以来自制造和供应链,而不仅仅是能源使用。他们倡导可回收材料和低排放合金,以及完整的生命周期设计实践。
奥兹坎说:“效率始于工厂。”“为了真正降低计算的影响,我们需要重新考虑整个过程从晶圆到浪费。这篇评论是深层跨学科合作的结果。我们希望它可以作为研究人员,工程师和政策制定者的路线图,浏览AI硬件的未来。”
更多信息:Mihrimah Ozkan等人,晶圆尺度AI加速器的性能,效率和成本分析与单芯片GPU,设备(2025)。doi:10.1016/j.device.2025.100834
引用:晶圆尺度加速器可以重新定义AI(2025年,6月17日)检索2025年6月18日来自https://techxplore.com/news/2025-06-wafer-scale-redefine-ai.html
该文档具有版权。除了为私人研究或研究目的的任何公平交易外,没有未经书面许可,可以复制部分。内容仅用于信息目的。