GTC 预览:AI 工厂内部——AI 经济背后的 1T 美元基础设施战争 - SiliconANGLE
作者:by John Furrier
GTC 预览:AI 工厂内部——AI 经济背后的 1T 美元基础设施战争
每年,人工智能行业都会聚集在 Nvidia 公司的 GPU 技术大会上,期待看到更快的图形处理单元、更大的模型和下一波人工智能软件创新。
是的,这一切都会在那里。
但如果您过去几年一直在观看我们在 CUBE 上进行的对话,您就会知道真正的故事不仅仅发生在舞台上,而是正在发生在引擎盖下。
目前正在展开的是自云诞生以来科技行业最大规模的基础设施建设。但与云时代主要是一场软件革命不同,人工智能时代正在迅速变成完全不同的时代。
它正在工业化。
竞相引领这个新时代的公司不仅仅是编写代码。他们正在确保电力供应、预订半导体产能、锁定内存供应并部署旨在大规模产生情报的大规模集群。
我们称这个系统为人工智能工厂。
当我们进入 GTC 时,更深入的叙述不仅仅是关于下一个 GPU 架构。这是一场全球基础设施竞赛——一场耗资数万亿美元的供应链壕沟战——旨在建造未来十年生产智能的工厂。
更有趣的是,这家工厂不再局限于超大规模数据中心。它开始向外延伸到我们所说的超融合边缘,人工智能更接近数据创建和决策制定的地方。
这种转变——从集中式人工智能到分布式智能工厂网络——可能最终定义该行业的下一阶段。
人工智能工厂:智能制造
在过去的几年里,我们一直在描述计算基础设施设计方式的转变。
传统数据中心存储数据并运行应用程序。
人工智能基础设施做了一些根本不同的事情:我制造情报。人工智能工厂是一个垂直集成的系统,旨在将原始输入(电力、芯片、内存和数据)转换为人工智能模型、推理服务、自动化和推理系统等输出。
引领这一转型的公司包括 Nvidia、Amazon.com Inc.、Microsoft Corp.、Google LLC、Meta Platforms Inc. 等。这些公司总共在 AI 基础设施上投资了数千亿美元。我们报告的一些估计表明,这一周期的下一阶段的资本投资可能接近 1 万亿美元。
GTC 将展示该架构的最新部分,但最重要的故事位于供应链的更深处。
GPU升值悖论
这个周期中最奇怪的经济动态之一就是我所说的 GPU 升值悖论。在传统技术市场,硬件贬值很快。
但在人工智能时代,情况似乎恰恰相反。以广泛部署的 Nvidia H100 GPU 为例。随着时间的推移,这些芯片的生产力并没有随着时间的推移而失去经济价值,而是随着它们所服务的模型变得更加强大而不断提高。
随着前沿模型的改进,为这些模型提供服务的计算所产生的价值也会增加。这就是为什么一些人工智能实验室以每小时约 2.40 美元的价格锁定多年 GPU 合同,远高于估计的构建成本。
人工智能计算已成为数字经济中最受限的资源。这将 GPU 转变为比传统信息技术硬件更接近生产性资本资产的东西。
主要限制:内存
GPU 可能会成为 GTC 的头条新闻,但人工智能工厂的真正瓶颈可能是内存。
现代人工智能系统严重依赖长上下文推理,这意味着模型可以处理大量的文本、代码和多模式数据序列。 这种能力需要大量的 h高带宽内存或 HBM。
HBM 的物理成本很高:
- 它消耗晶圆面积增加三到四倍比标准动态随机存取存储器或 DRAM。
- 它需要先进的封装技术。
- 它与消费电子产品供应链直接竞争。
我们的数据表明,到 2026 年,多达 30% 的超大规模资本支出可能会单独用于内存(鼓声:等待系统价格上涨)。
这种转变已经在重塑整个行业的半导体配置,人工智能基础设施越来越优先考虑内存供应。
我们密切关注的关键限制之一是半导体制造能力。
数据中心加速器现在消耗台积电越来越多的制造能力。NVIDIA(GPU)、Broadcom(TPU 和定制 AI 芯片)等供应商正致力于比传统消费芯片设计商更加积极地实现销量增长。
从较高层面来看,半导体制造工艺存在两个对人工智能基础设施至关重要的主要限制:
1. 前端产能:上游晶圆制造阶段,先进逻辑工艺节点在晶圆上生产硅和逻辑电路。
2. 后端容量:有时称为中端,其中 CoWoS(晶圆上芯片芯片)等先进封装技术将芯片与高带宽存储器 (HBM)、基板和其他组件集成,以创建最终的加速器封装。
像台积电这样的制造商必须仔细平衡工艺的两个阶段。去年后端封装阶段,尤其是 CoWoS,是最大的瓶颈。尽管仍然紧张,但限制正在日益转向前端晶圆制造能力。
底线是:人工智能需求正在爆炸式增长,但硅生产却难以跟上步伐。
光刻天花板
要了解人工智能扩展的最终极限,您必须进一步向上游走。
半导体生态系统中真正的看门人是荷兰极紫外光刻机制造商 ASML Holding NV。生产最先进的芯片需要这些工具。
每台机器的成本超过 3.5 亿美元,包含数十万个组件,并依赖于数千家专业供应商的供应链。更重要的是,产量有限。到本世纪末,ASML 每年可生产大约 70 至 100 个极紫外工具。
这一产量有效地限制了世界扩大先进半导体生产的速度。您可以以指数速度创新软件。但你无法轻易扩展生产硅的工业制造系统。
权力:付费限制
人工智能工厂的另一个关键输入是能源。前沿人工智能集群现在需要大量电力——通常以千兆瓦为单位。然而,功率不一定是硬性限制。
这是一个成本问题. . . 为了绕过电网限制和多年的许可时间表,超大规模企业和人工智能实验室正在越来越多地部署用户侧电力系统。其中包括天然气涡轮机、模块化微电网、燃料电池和工厂建造的数据中心模块。
即使能源成本增加,经济学仍然倾向于早期部署,因为前沿人工智能模型的边际价值是如此之高。 在人工智能竞赛中,速度往往比效率更重要。
超融合边缘的兴起
虽然超大规模人工智能工厂成为头条新闻,但基础设施堆栈中正在发生另一个重要转变。人工智能工厂正在向边缘扩展。
企业越来越多地部署本地化人工智能系统,以支持工厂、医院、零售店、物流中心和智慧城市等环境中的实时决策。 即使云连接有限,这些环境也需要低延迟、数据主权和连续运行。
这就是超融合边缘发挥作用的地方。超融合边缘平台将网络、计算、存储、安全和人工智能推理整合到统一的边缘基础设施中。
组织部署的不是孤立的设备,而是能够运行本地推理并与集中式人工智能集群同步的分布式迷你人工智能工厂。在这种架构中,超大规模人工智能工厂训练模型,而超融合边缘系统在现实世界中运行这些模型。
这种情报生产的分布式模型可能会成为 GTC 讨论中出现的一个主要主题。
人工智能主权和地缘政治维度
人工智能基础设施竞赛也变得越来越深入地缘政治。
世界各国政府越来越将人工智能能力视为国家主权问题。对人工智能基础设施的控制意味着对经济竞争力、工业自动化、国防系统和国家创新能力的控制
美国目前在几个关键领域处于领先地位,包括人工智能软件生态系统以及通过台积电等合作伙伴获得先进制造。但其他地区正在迅速采取行动。
中国正在通过华为等公司追求全栈垂直整合,大力投资国内芯片设计、内存生产和主权人工智能基础设施。欧洲和中东国家也在投资主权计算能力,以确保它们不依赖外国云提供商。
在许多方面,人工智能工厂正在成为数字时代的战略基础设施,类似于电网或电信网络。
从软件产业到产业基础设施
也许对人工智能热潮的最大误解是它的分类方式。许多投资者仍然将人工智能公司视为传统软件公司。
但引领人工智能工厂建设的公司越来越像重工业运营商。他们正在部署千兆瓦级数据中心、全球半导体供应链、大规模资本投资计划和垂直集成基础设施堆栈
这不仅仅是另一个软件周期。 这是工业规模智能生产的出现。
GTC 的看点
当我们进入另一款 Nvidia GTC 时,我们很容易被诸如下一代 GPU、下一个型号、下一个软件框架等产品公告所吸引。
但表面之下正在展开的更大的故事是关于基础设施电力的。
在人工智能领域赢得未来四到五年的公司将不仅仅是那些拥有最好算法的公司。他们将是尽早确保供应链安全的人: 那些被锁定在光刻能力中的。那些预订了存储晶圆的人。那些建造发电厂的人。那些将人工智能工厂一直延伸到边缘的人。
因为人工智能的未来不再只是训练更大的模型。 这是关于建立运行它们的全球系统。
人工智能工厂正在迅速成为数字经济的工业支柱——一个由超大规模集群和超融合边缘基础设施组成的分布式网络,共同生产和运营智能。
如果过去的十年属于云计算,那么下一个十年将属于建造和控制这些工厂的公司。 这就是我本周将在 GTC 上密切关注的故事。
因为建造人工智能工厂的竞赛才刚刚开始。
图片:theCUBE
通过与 CUBE 社区互动,支持我们保持内容开放和免费的使命。加入 CUBE 校友信任网络,技术领导者相互联系、分享智慧并创造机会。
- theCUBE 视频的观看人数超过 1500 万,推动人工智能、云、网络安全等方面的对话
- 11.4k+ theCUBE 校友– 通过独特的可信网络与 11,400 多名技术和商业领袖联系,塑造未来。
关于SiliconANGLE Media
SiliconANGLE Media 是数字媒体创新领域公认的领导者,将突破性技术、战略洞察力和实时受众参与结合在一起。作为母公司硅角,theCUBE网络,CUBE研究中心,魔方365,theCUBE AI以及 CUBE SuperStudios – 在硅谷和纽约证券交易所设有旗舰店 – SiliconANGLE Media 致力于媒体、技术和人工智能的交叉领域。SiliconANGLE Media 由科技梦想家 John Furrier 和 Dave Vellante 创立,建立了一个由行业领先的数字媒体品牌组成的动态生态系统,覆盖超过 1500 万精英科技专业人士。我们全新专有的 theCUBE AI 视频云在观众互动方面取得了突破性进展,利用 CUBEai.com 神经网络帮助科技公司做出数据驱动的决策并保持行业对话的前沿。
Founded by tech visionaries John Furrier and Dave Vellante, SiliconANGLE Media has built a dynamic ecosystem of industry-leading digital media brands that reach 15+ million elite tech professionals. Our new proprietary theCUBE AI Video Cloud is breaking ground in audience interaction, leveraging theCUBEai.com neural network to help technology companies make data-driven decisions and stay at the forefront of industry conversations.