Mustafa Suleyman:微软人工智能首席执行官 Mustafa Suleyman:至少在接下来的几年里,整个人工智能行业将由……定义- 印度时报
作者:TOI Tech Desk / TIMESOFINDIA.COM / Updated: Mar 30, 2026, 15:53 IST
![]()
微软人工智能首席执行官穆斯塔法·苏莱曼 (Mustafa Suleyman) 断言,人工智能行业的未来取决于谁有能力大规模运行模型,而不仅仅是谁构建最聪明的模型。他认为,推理计算的稀缺性将决定未来几年的赢家,高利润产品通过数据驱动的改进飞轮获得显着优势。
微软人工智能首席执行官穆斯塔法·苏莱曼表示,人工智能行业的下一篇章不会由构建最智能模型的人来书写。它将由任何有能力大规模运行的人来编写。现在,这是一个非常短的清单。在 X 上的一篇文章中,苏莱曼提出了一个尖锐的、经济学优先的论点,认为推理计算稀缺性,而不是模型智能,将决定未来两到三年的赢家和输家。有利润购买代币的公司领先。其他人都得到配给。他写道:“至少在接下来的几年里,整个人工智能行业将由这样一个事实来定义:需求将大大超过供应,因此重要的是哪些公司/产品有足够的利润来支付代币。”他补充说,能够支付的产品将改进得最快,因为较低的延迟会推动保留,保留会生成数据,而这些数据会推动模型改进和采用的飞轮。
手表
微软首席执行官对印度不断增长的数据中心容量感到“兴奋”,并与莫迪总理会面详细介绍
为什么推理计算而不是AI模型训练 ,才是2026年真正的瓶颈
苏莱曼的论点颠覆了主流的人工智能叙事。多年来,该行业一直痴迷于训练更大的基础模型。但 2026 年的严重危机出现在服务端——为数百万用户实时运行这些模型。
根据德勤 2026 年 TMT 预测,推理工作负载目前约占所有人工智能计算支出的三分之二。GPU 交付时间已延长至近一年。主要供应商的高带宽内存到 2026 年都已售完。今年计划的 16 GW 全球数据中心容量中,实际上只有约 5 GW 正在建设中——其余的仍停留在纸面上。
Mustafa Suleyman 的人工智能“飞轮”如何为高利润产品提供复合优势
这种稀缺性正是苏莱曼的飞轮逻辑发挥作用的地方。毛利率较高的产品——企业法律工具、医疗保健 SaaS、Microsoft 365 Copilot——可以吸收额外的推理成本。这为他们带来了更低的延迟。较低的延迟可以让用户回访。返回的用户会生成丰富的专有工作流程数据。这些数据可以微调和改进模型。更好的模型可以推动更多的采用和收入。重复,每个周期更快。Suleyman 之前曾使用过这种精确的框架——在 2024 年 10 月的 IA 峰会上,他表示垂直人工智能的赢家将是那些“锁定微调循环”并让数据飞轮旋转的人。微软自己的数据也证实了这一点:2026 财年第二季度付费 Copilot 席位达到 1500 万,同比增长 160%,但仍仅占 4.5 亿 M365 商业用户群的 3.3%。
消费者人工智能应用程序和低利润人工智能初创公司面临着代币配给问题
令人不安的推论是消费者人工智能应用程序和资金短缺的初创公司面临着压力。如果没有足够的利润来购买高级推理,他们的反应速度就会变慢,保留能力就会变弱,而且飞轮永远不会开始旋转。
民意调查
您认为哪种类型的人工智能应用程序将因代币配给而陷入困境?
帖子中的一些人反驳道,他们认为每美元的智能更重要,或者开源和设备上的模型可能会完全降低推理成本。但苏莱曼的赌注是明确的,而且资金充足。随着微软每年在人工智能基础设施上投入超过 800 亿美元,他相信在未来几年里,能够支付代币的企业将首先赢得智能竞赛。