作者:By Victor Menaldo Feb. 6, 2025 3 AM PT
上周,纳斯达克证券交易所列出了大量的美国科技股,经历了很大的下跌。这是由于中国初创公司DeepSeek宣布它已经开发了一种人工智能模型,该模型的性能以及OpenAI和Meta的AI技术,但其成本的一小部分和较少的计算能力。
AI芯片设计师NVIDIA损失了近6000亿美元其市值(其股票流通股的总价值)是一家公司在美国市场历史上经历的最大的单日下降。尽管NVIDIA的股价已经恢复了一些基础,但分析师仍继续采取雄心勃勃的AI基础设施计划,包括该公司的专业图形处理单元以及大量的数据中心,例如由亚马逊建造和经营的数据中心。
DeepSeek的创作者声称通过使用特殊零件找到了一种更好的方法来训练他们的AI,改善了AI的学习规则并部署策略,以使AI保持平稳地运行而不会浪费资源。根据公司的说法报告,这些创新大大降低了开发和运行模型所需的计算能力,因此与芯片和服务器相关的成本。这种急剧的成本降低已经吸引了较小的AI开发人员,他们正在寻找更便宜的备受瞩目的AI实验室的替代品。
乍一看,以这种方式减少模型培训费用似乎会破坏涉及数据中心,半导体和云基础架构的数万亿美元的武器竞赛。但是正如历史所示,廉价的技术通常会助长使用更大的用法。使AI更容易获得的突破性不再损害资本支出,而是可以释放一波新的采用者,不仅包括技术初创公司,而且还可以释放传统的制造公司和服务提供商,例如医院和零售。
微软首席执行官萨蒂亚·纳德拉(Satya Nadella)称这种现象为杰文宗悖论对于人工智能。该概念归因于19世纪的英国经济学家威廉·斯坦利·杰文斯(William Stanley Jevons),他描述了使技术更有效而不是减少消费的方法。蒸汽和电力遵循了这种模式:一旦它们变得更高效,更实惠,它们便分布在更多的工厂,办公室和房屋上,最终使用。
纳德拉是对的:今天的生成AI的发展成本趋于趋势,有望产生类似的扩展。这意味着天空并不是供应AI基础架构和服务的大型科技公司。主要科技运动员是预计到2029年将投资超过1万亿美元的AI基础设施,DeepSeek的发展可能不会改变他们的计划。
尽管培训成本可能会下降,但大规模机器学习工作,数据处理和专业AI软件的长期硬件要求仍然很大。尽管随着模型培训的效率,芯片价格可能会下跌,但基于AI的应用程序,例如生成聊天机器人和自动化的工业控制 - 需求强大的服务器,高速网络,以传递大量数据流和可靠的数据中心,以处理数十亿个数据中心实时查询。监管,安全性和合规性要求进一步的实施复杂化,需要高级的,有时是昂贵的解决方案,这些解决方案可以负责任地存储和处理数据。
转变经济体通常分为两个阶段的通用技术。首先,在一个漫长的妊娠期,资金充足的组织实验,完善了原型和过程。后来,一旦标准稳定并出现了现成的解决方案,更加谨慎的公司就会加入。在电力的情况下,第一阶段的工厂会花费数年的时间重新组织生产地板并采用新的工作流程,然后在电气化广泛传播之前。就AI而言,它由大型银行,零售商和制造商组成,可以缓慢零散地使用该技术。
一个半世纪前,当Bessemer工艺引入使用热空气从熔融铁中爆炸杂质,而Mills弄清楚了如何生产标准化的钢铁产品时,制造商枢转。钢铁价格暴跌,消费飙升,尽管钢铁矿石使用了更有效的铁矿石,但最终增加了该行业的支出。
现在,DeepSeek和其他创新有望降低成本,更多的公司可能准备好接受或至少尝试AI,并且对AI基础设施的需求可能会增加。更实惠的尖端模型还可以鼓励行业,初创企业和企业家更广泛地使用AI,从而增加其在物流,客户服务等方面的采用。
想象一下,例如,一家专门从事商业房地产的200人律师事务所。最初,它有时会使用Chatgpt来制作快速合同摘要,但其合作伙伴对质量不一致和保密风险的不安变得不安。在测试了信誉良好的供应商提供的以合同为中心的模型后,该公司采用了直接与文档管理系统集成的技术。这使副律师可以在几秒钟内自动化数百页,依靠针对房地产量身定制的AI规定建议,并限制了从高级合作伙伴中寻求指导的需求。此外,系统设计可防止客户数据离开公司的域,从而提高安全性。
随着时间的流逝,该公司添加了用于高级诉讼研究和自动计费说明的AI模块,稳步减少行政任务,并让人类专家专注于战略法律洞察力。它看到合同周转,标准化计费以及合作伙伴之间的新意愿,以探索其他领域的基于AI的工具。
简而言之,由于DeepSeek,AI的资本需求不会收缩。它们将变得更广泛地分布。我们将看到电源网,冷却系统,数据中心,软件管道和基础架构的刺激扩展,使更多设备可以使用AI,包括机器人和无人驾驶汽车。数万亿美元的基础设施推动可能会持续数年。
Victor Menaldo是华盛顿大学的政治学教授,正在写一本书第四革命的政治经济学。