作者:Edd Gent
在过去几年的人工智能淘金热中,英伟达占据了铲子(即训练模型所需的芯片)市场的主导地位。但许多领先的人工智能开发商的策略转变为竞争对手提供了机会。
Nvidia 老板黄仁勋 (Jensen Huang) 向人工智能硬件倾斜的呼吁将被视为有史以来最好的商业决策之一。在短短十年内,他将一家价值 100 亿美元、主要向游戏玩家销售显卡的企业转变为一家拥有全球最强大科技 CEO 的价值 3 万亿美元的庞然大物从字面上乞求为了他的产品。
自从 2012 年发现该公司的图形处理单元 (GPU)可以加速人工智能训练,Nvidia 一直主导着人工智能专用硬件市场。但竞争对手也紧随其后,其中既有 AMD 和英特尔等老对手,也有一批资金雄厚的芯片初创公司。最近,最大的人工智能开发商的优先事项发生了变化,可能会撼动整个行业。
近年来,开发人员专注于训练更大的模型,而 Nvidia 的芯片在这方面表现出色。但随着这种方法的收益逐渐枯竭,公司反而增加了查询模型的次数,以挤出更多的性能。这是竞争对手更容易竞争的领域。
“随着人工智能从训练模型转向推理,越来越多的芯片公司将获得对 Nvidia 的优势,”Great Hill Capital 董事长兼管理成员 Thomas Hayes,告诉路透社有消息称,由于人工智能芯片的需求,定制半导体供应商博通的估值达到了万亿美元。
推动这一转变的原因是获得英伟达最强大芯片的成本和绝对难度,以及人工智能行业领导者希望在如此重要的成分方面不完全依赖于单一供应商。
竞争来自多个方面。
尽管英伟达的传统竞争对手在进入人工智能竞赛方面进展缓慢,但这种情况正在发生变化。去年年底,AMD 推出了 MI300 芯片,该公司首席执行官声称在训练方面可以与 Nvidia 的芯片正面交锋,但在推理方面却能提供 1.4 倍的提升。包括 Meta、OpenAI 和 Microsoft 在内的行业领导者宣布不久之后,他们将使用这些芯片进行推理。
英特尔还投入了大量资源,利用其 Gaudi 系列芯片开发专业人工智能硬件,尽管订单尚未到来。不负众望。但试图削弱英伟达主导地位的不仅仅是其他芯片制造商。该公司在人工智能行业的许多最大客户也在积极开发自己的定制人工智能硬件。
谷歌是这一领域明显的领导者,早在 2015 年就开发出了第一代张量处理单元 (TPU)。该公司最初开发这些芯片供内部使用,但本月早些时候该公司宣布其云客户现在可以使用最新的 Trillium 处理器来训练和服务他们自己的模型。
虽然 OpenAI、Meta 和微软都在进行人工智能芯片项目,但亚马逊最近做出了重大努力,试图在一场通常被认为落后的竞赛中迎头赶上。上个月,该公司推出了第二代 Trainium 芯片,它们的速度是前代产品的四倍,并且已经由亚马逊投资 40 亿美元的人工智能初创公司 Anthropic 进行测试。
该公司计划向数据中心客户提供该芯片的访问权限。AI初创公司Poolside首席技术官Eiso Kant,告诉这纽约时报与 Nvidia 芯片相比,Trainium 2 的性价比可以提高 40%。
据称,苹果也加入了这场游戏。根据一个最近的报告通过科技出版物信息,该公司正在与长期合作伙伴博通共同开发一款人工智能芯片。
除了大型科技公司之外,还有许多初创公司希望打破英伟达对市场的束缚。投资者显然认为存在一个机会——根据 PitchBook 的数据,他们在 2023 年向人工智能半导体公司注资 60 亿美元。
公司喜欢桑巴诺瓦和格罗克承诺大幅加速人工智能推理工作,同时大脑系统公司以其餐盘大小的薯条专门针对最大的AI计算任务。
然而,对于那些想要放弃 Nvidia 芯片的人来说,软件是一个主要障碍。2006 年,该公司创建了名为 CUDA 的专有软件,帮助开发人员设计可在多个并行处理核心上高效运行的程序,这是人工智能领域的一项关键功能。
“他们确保每个从大学毕业的计算机科学专业学生都接受过培训并知道如何编程 CUDA,”Moor Insights & Strategy 首席数据中心分析师 Matt Kimball,告诉 IEEE Spectrum。– 他们提供工具和培训,并在研究上花费大量资金。 –
因此,大多数人工智能研究人员都对 CUDA 感到满意,而不愿意学习其他公司的软件。为了解决这个问题,AMD、英特尔和谷歌加入了 UXL 基金会,这是一个创建开源替代方案到 CUDA。然而,他们的努力仍处于起步阶段。
不管怎样,英伟达对人工智能硬件行业的虎钳般的控制力似乎正在减弱。虽然在可预见的未来,人工智能公司可能仍将保持市场领先地位,但随着人工智能公司继续建设基础设施,到 2025 年它们可能会有更多选择。
Edd 是一位居住在印度班加罗尔的自由科技作家。他的主要兴趣领域是工程、计算和生物学,特别关注三者之间的交叉点。