为即将到来的人工智能芯片短缺做好准备 - Bain

2024-09-25 04:12:06 英文原文

技术报告

概览
  • 仅人工智能驱动的图形处理单元需求激增就可能使某些上游组件的总需求增加 30%到 2026 年,这一数字将增加 % 或更多。
  • 正如疫情导致 PC 需求激增一样,即将到来的人工智能设备浪潮可能会加速智能手机和 PC 升级购买。
  • 这两种产品趋势,加上持续的地缘政治紧张局势和其他供应风险,可能会引发下一次半导体短缺。
  • 包括长期采购协议和供应链多元化在内的积极措施对于缓解迫在眉睫的风险至关重要。
  • li>

本文是贝恩公司 2024 年技术报告的一部分。

半导体的供需是一种微妙的平衡,很快就会被动摇,行业及其客户都知道过去几年之后太好了。尽管大流行引发的芯片短缺已经过去,但高管们已开始为(你猜对了)人工智能引起的下一次潜在危机做好准备。

各行业加速采用人工智能将对图形处理的供应造成压力数据中心的单元(GPU),因为训练和操作大型语言模型(LLM)对计算资源的看似永无止境的需求与供应链限制相冲突。此外,即将到来的人工智能设备的激增似乎将引发新个人电脑 (PC) 和智能手机的购买浪潮,这对更广泛的半导体供应链产生重大影响。

半导体供应供应链极其复杂,需求增长约 20% 或以上很可能会打破平衡并导致芯片短缺。大型终端市场交汇处的人工智能爆炸很容易超过这一阈值,从而在整个供应链中造成脆弱的阻塞点(见图 1)。

对人工智能计算能力的需求激增将使数据供应链紧张考虑到该行业技术的快速发展、资本需求量大以及增加产能的周期长,平衡半导体供需一直很困难。但芯片供应商和买家必须迅速采取行动,以应对下一次可能出现的大规模紧缩。让我们来分析一下在潜在的需求和供应冲击下情况会如何发展。

数据中心需求

2022 年末生成式人工智能的突破迄今为止为半导体行业带来了福音。芯片制造商的销售额和估值大幅增长,从 Nvidia 等领先的 GPU 销售商到向数据中心供应其他芯片的供应商,包括 Broadcom(交换机)和 SK Hynix(高带宽内存)。在数据中心和为其供电的专用芯片上的支出没有显示出放缓的迹象。预计到 2024 年,主要云服务提供商的资本支出将同比增长 36%,这在很大程度上受到人工智能和加速计算投资的推动。随着大语言模型扩展同时处理多种数据类型(文本、图像和音频)的能力,以及风险投资家向人工智能初创企业投入更多资金,GPU 需求将继续增长。

如果数据中心需要到 2026 年,当前一代 GPU 数量将翻一番,这是一个合理的假设,考虑到当前的发展轨迹,根据贝恩斯预测模型(该模型考虑了多级半导体供应链的复杂性),在某些情况下,关键组件的供应商需要将产量增加 30% 或更多(参见上图 1)。这种拉动需求将集中在先进封装和存储器领域。在上述场景中,到 2026 年,晶圆上芯片 (CoWoS) 封装组件的制造商需要将产能几乎增加两倍。

为了实现人工智能的增长,需要一个复杂的供应链要素网络从建设数据中心和晶圆厂到确保获得先进封装和充足的电力,所有这些都必须齐心协力。获得许多这些关键要素需要较长的交付时间,这可能导致无法满足需求(参见图 2)。

必须将一组复杂的组件、资源和服务结合在一起才能满足以下需求:人工智能计算能力

重要的是,其中许多供应链要素与技术生态系统的其他部分共享,并且它们都受到资本、地缘政治和时机风险的影响。缺少一个芯片可能会破坏整个系统,就像上次短缺时,新车因为缺少关键芯片而大量滞销。

PC 和智能手机需求

个人设备制造商已经迅速将人工智能功能直接嵌入到他们的产品中。根据我们的基准测试,为了适应设备上 AI 的神经处理引擎,笔记本电脑核心处理单元 (CPU) 和智能手机处理器的平均硅表面积分别增加了约 5% 和 16%。

更多重要的是,随着人工智能应用程序的实用性不断增强,希望升级的买家可能会加速购买新设备,从而导致需求上升,类似于大流行刺激个人电脑需求的短期激增(见图 3)。

人工智能可能会大幅加速个人电脑和智能手机的销售,类似于大流行导致个人电脑需求激增的方式

与 GPU 相比,考虑到人工智能的需求将对智能手机和个人电脑的半导体供应链产生更广泛的影响与这些设备相关的一长串组件。这些设备供应链中最脆弱的环节将是制造最先进芯片的尖端晶圆厂。在人工智能的快速采用场景中,2023 年至 2026 年间,个人电脑销量将增长 31%,智能手机销量将增长 15%,尖端晶圆厂预计需要将产量提高 25% 至 35%。这将需要建造四到五个额外的尖端晶圆厂,成本估计为 400 亿至 750 亿美元,这将有助于证明主要代工厂已经建造的许多晶圆厂的合理性。

不要忘记供应风险

过去十年的极端天气、自然灾害、地缘政治冲突、流行病和其他重大破坏已经充分表明供应冲击如何严重限制该行业满足需求的能力。过去 18 个月 GPU 供应面临的压力大部分是由供应链中不太明显的要素中断造成的,例如 CoWoS 先进的封装能力。

地缘政治紧张局势、贸易限制以及跨国科技公司脱钩来自中国的供应链继续对半导体供应构成严重风险。工厂建设的延误、材料短缺和其他不可预测的因素也可能造成困境。如果不考虑这些不确定性,我们预计最大的供应风险将来自对高带宽内存组件、先进封装工厂和工具建设以及基板工厂建设的更大需求。

高管要点

对于各行业的半导体买家来说,应对这些错综复杂的供应链首先要深入了解所采购的组件。高效的领导者会特别关注与人工智能数据中心交叉的组件,例如交换机、收发器和电源管理集成电路。他们将密切监控 PC 和智能手机的更新周期,以及 Wi-Fi 路由器和网络设备等相关外围设备。这些领域的激增将对整个供应链产生连锁效应,必须密切跟踪。

领先公司将吸取最近芯片危机的教训,以保持库存在短缺和过剩之间安全平衡。他们将签署长期采购协议,以确保根据预期的未来需求获得芯片和制造能力(并且他们将与供应商分享这种可见性)。过去几十年占主导地位的即时库存策略将继续让位于成本更高但更具弹性的以防万一方法。更多公司将设计产品,尽可能使用行业标准半导体,而不是专用芯片。他们还将继续投资于供应链抵御关税或法规等地缘政治不确定性的弹性。最后,他们将像监控前端半导体制造能力一样密切监控硅先进封装和基板供应。

高管们可能仍对大流行引发的半导体供应中断感到疲倦,但没有时间休息因为下一次巨大的供应冲击即将到来。然而,这一次,迹象很明显,行业有机会做好准备。前进的道路需要保持警惕、战略远见和迅速采取行动来加强供应链。通过采取积极主动的措施,企业领导者可以确保他们在人工智能日益普及的世界中保持弹性并取得成功。

关于《为即将到来的人工智能芯片短缺做好准备 - Bain》
暂无评论

摘要

技术报告概览 到 2026 年,仅人工智能驱动的图形处理单元需求激增就可能使某些上游组件的总需求增加 30% 或更多。正如疫情导致 PC 需求激增一样,即将到来的人工智能设备浪潮可能会加速智能手机和个人电脑升级购买。随着大语言模型扩大同时处理多种数据类型(文本、图像和音频)的能力,以及风险投资家向人工智能初创企业投入更多资金,GPU 需求将继续增长。在上述场景中,到 2026 年,晶圆上芯片 (CoWoS) 封装组件的制造商需要将产能增加近两倍。为了实现人工智能的增长,必须将一个复杂的供应链元素网络结合在一起,从构建数据开始中心和晶圆厂,以确保获得先进的封装和充足的电力。不要忘记供应风险过去十年的极端天气、自然灾害、地缘政治冲突、流行病和其他重大干扰已经充分表明供应冲击如何严重限制该行业满足需求的能力。过去 18 个月,GPU 供应面临的大部分压力是由供应链中不太明显的要素(例如 CoWoS 先进封装能力)的中断造成的。