作者:Kyle Chan, Ray Wang
中国在AI中取得的惊人成就具有一个明显的弱点:获得供应AI并依靠大量先进半导体的原始处理能力的访问权限。美国目前有一个十倍优势在中国的总计算能力上,这一差距可能会随着时间的流逝而扩大。美国科技公司正在倾泻新数据中心数十亿美元并可以从NVIDIA和AMD或他们自己的自我开发的AI芯片中获得最新芯片进步的好处。
同时,由于越来越严格的美国出口控制,中国公司可以获得的外国AI芯片的性能和数量随着时间的流逝而下降。中国科技领导者,例如腾讯,,,,百度, 和DeepSeek已将计算约束作为关键瓶颈,以更快的AI开发。
华为在国内生产的AI芯片(称为Ascend系列)似乎是解决中国计算挑战的明显解决方案。但是有一个吸引力:中国科技公司不想使用落后于外国同行的华为芯片来训练他们的AI模型。2024年,中国公司购买了大约100万个NVIDIA H20芯片估计的运输450,000华为上升910b芯片。
中国只有少数由国有支持的公司使用华为筹码来培训其模型,包括iflytek,,,,感觉时间和中国移动。尽管中国公司正在拖着脚,尽管中国中央政府机构的压力这样做。
中国人工智能开发人员压倒性地更喜欢使用NVIDIA芯片,甚至降低了性能的芯片,并竭尽全力访问它们。如今,中国的许多AI模型中的许多模型仍接受过Nvidia的硬件的培训,包括DeepSeek的V3模型和Moonshot的Kimi K2型号。期望美国禁止NVIDIA S H20芯片,拜访,阿里巴巴和腾讯急于花费160亿美元储存约130万至160万h20单位。
在2024年底,Bytedance计划花费70亿美元在中国以外的服务器上访问NVIDIA芯片。中国科技公司一直在搜寻黑市在亚洲和电子商务网站收购被禁止的NVIDIA芯片的他们的正常价格加倍价格加倍。中国买家甚至诉诸于购买NVIDIA的RTX游戏芯片作为替代品,即使它们不是为AI工作负载而设计的,并且走私硬盘驱动器,到达全国的数据在中国以外的服务器上培训模型。
为什么中国的AI开发人员如此不愿从NVIDIA转移到华为,即使他们获得Nvidia芯片的访问受到越来越限制?
首先,在某些重要方面,NVIDIA降低了出售给中国的筹码仍然超过了华为的筹码。华为上升910B芯片使用较旧的HBM2E内存技术,仅提供记忆容量的三分之二和NVIDIA S H20芯片带宽的40%。
华为的较新上升910c芯片,今年正在加大生产,提供H20的80%的带宽,但仍在使用较旧的HBM2E内存标准那是最先进的AI芯片落后两代。鉴于推理模型和推理的兴起,记忆性能的这种差距尤其重要,其中记忆带宽起着至关重要的作用。
中国科技公司很容易退出NVIDIA的第二个关键原因是美国科技公司也是如此:库达。NVIDIA的并行计算平台于2006年启动,已积累了用户,并与Pytorch(主要的AI框架)紧密集成,创建了一个成熟的软件生态系统,该系统将开发人员锁定到NVIDIA的AI系统中。
对于中国科技公司而言,远离NVIDIA意味着重写代码,放弃这个行业领先的基础架构,并失去了全球开发人员多年来CUDA图书馆中应用程序的访问权限。华为的替代品的Cann平台和思维镜框架,启动了2018和2019````新的''错误,崩溃,然后过热。
与NVIDIA的系统相比,AI硬件用户群要小得多,华为缺少来自主要客户的大型现实世界反馈,需要快速完善其芯片和软件。结果,华为的AI解决方案无法利用使中国成为其他行业全球领导者的迭代优化。
尽管进入NVIDIA芯片的访问越来越困难,但华为芯片的供应仍然受到限制和不确定。美国领导的半导体制造设备的出口控制限制了该国的芯片制造能力。
特别是,华为和SMIC一直在努力在7纳米的工艺水平或更低的情况下增加高级芯片的生产。ASML和美国用于蚀刻和沉积等关键任务的工具无法获得极端紫外线光刻(EUV)机器,这使得Smic难以生产高级芯片精确,可靠,保持其生产的产量远低于行业领导者TSMC。
虽然Smic正在稳步进步,而华为正轨销售百万上升今年,华为也非法采购超过200万个TSMC的逻辑死亡,这是核心芯片组件,其上升的910b和910c芯片在2024年。具有讽刺意味的是,由于华为已经受到严重制裁,因此以这种方式对滑雪出口控制的惩罚几乎没有受到惩罚。
中国公司还对华为涉及的其他商业和地缘政治风险保持警惕,华为多年来一直是美国政府的常见目标。例如,美国商务部在5月警告说,使用华为筹码世界上任何地方在以后调整公告之前,将违反美国出口控制规则。
华为不仅是中国科技公司的芯片供应商,而且还是强大的竞争对手。华为是中国第二大云服务提供商并开发了自己的AI模型的开源Pangu家族。其他中国科技公司正在与华为争夺不仅在中国提供云服务但在全球也对于在同一空间中竞争的公司,使华为成为不受欢迎的选择。
但是,如果美国做出错误的决定,这一切都可能会改变。
华为芯片的带宽记忆性能低于NVIDIA的H20芯片,而华为910B和910C芯片已经提供了比H20更高的总处理性能(TPP)和更好的能源效率(TPP/WATT)。不是一个强大的芯片正如某些人所说的那样,H20实际上的计算性能和能源效率要比NVIDIA年龄较大A100筹码,于2020年推出。此外,华为已经能够改善其上升芯片的计算性能,即使在美国出口控制措施之后,即使将生产从台湾芯片制造商TSMC转换为中国自己的SMIC。
也许更重要的是,华为一直在AI计算系统的水平上取得了重大进展。华为最近公布了CloudMatrix 384系统,由华为最新910c芯片和一种新颖的全光网络方法组成。根据半分析,华为的新CloudMatrix系统优于NVIDIA在关键尺寸上的最先进的GB200 NVL72系统,例如计算功率(芯片可以处理大量数据),内存带宽和集成网络。
尽管华为的新系统比NVIDIA的同行更为昂贵和能源密集,这可能会限制客户采用的采用,但它标志着系统级绩效的惊人进步,这可能比单个芯片性能更重要,以扩大大型AI计算簇。
在最近的技术论文,华为已经证明了其新的CloudMatrix系统可以成功地用于训练高级AI模型。由于华为继续在研发上投资并获得大量国家支持,因此价格和能源问题可能是可以管理的。
随着华为的AI系统继续改善,必须仔细校准美国的出口控制政策,以免推动中国的AI行业过高。如果中国的国内AI芯片继续改善,而在中国可用的美国筹码则被出口控制进一步降级,则将有一个跨界点,中国芯片的性能显然超过了中国可用的美国芯片。
至关重要的转折点可能是,如果中国最大的科技公司,例如阿里巴巴,腾讯和野兽,将其强大的资源投入到与中国AI芯片制造商合作的情况下。这将为中国的AI芯片制造商,尤其是华为的积极反馈循环,以建立软件库和工具,以创建完整的中国AI硬件软件生态系统。一旦这一过程开始,它也将标志着中国市场中Nvidia这样的美国AI芯片制造商的回报。
已经有一些潜在转变的迹象。DeepSeek和兽正在尝试使用华为AI芯片运行其AI模型。蚂蚁组,阿里巴巴的衍生产品甚至正在测试使用华为芯片进行模型训练的使用。华为的上升开发人员社区拥有近十倍在过去的四年中,尽管它仍然远小于Nvidia。
除华为外,其他中国人工智能制造商也在取得进步,包括剑桥,伯伦,摩尔线,Enflame和Hygon。剑桥的第一季度收入激增超过四十倍去年并收到了AI芯片的大订单来自野兽,剑桥的收入是预测根据高盛(Goldman Sachs)的说法,今年增长了3.7倍至55亿元人民币。NVIDIA的首席执行官Jensen Huang表示,NVIDIA在中国的市场份额已有拒绝从95%到50%的索赔支持通过其他可靠的分析。
美国需要一种更复杂的出口控制方法。这逆转在特朗普政府的H20筹码禁令中,朝着正确的方向迈出了一步。同时,白宫的新之家人工智能行动计划正确地认识到,与中国赢得AI竞赛取决于制作美国技术堆栈,包括其AI芯片,这是全球AI开发的主要平台。
半导体导出控件并不像拧紧水龙头上的阀门那样简单。中国的AI芯片困境不仅是一个硬件问题,而且是一个生态系统。华为现在可以访问开发高级AI芯片(包括融资和人才)所需的许多关键资源。但是,它缺少一个庞大而专门的客户群,该客户群致力于联合软件和硬件华为提供。
出口控制的聪明方法将集中于为AI芯片设定性能阈值,该芯片可以根据美国和中国硬件功能之间的窗口出售给中国。性能阈值应足够高,以胜过中国的国内硬件选项,以确保中国开发商仍在美国平台上。同时,它应该足够低,以维持美国开发人员可用的硬件系统的巨大性能差距。
理想情况下,该性能阈值将包括一个缓冲区,例如,在中国硬件产品方面的改善,例如中国硬件系统的性能优势比中国硬件系统在关键指标上具有50%的优势。随着意外发展的临时更改,定期的年度更新可能足以适应中国人工智能筹码的进步,同时为行业参与者提供足够的政策稳定性。
总体政策目标是明确的:确保美国继续以AI领先于世界。通过限制中国进入尖端筹码的机会,而不必推动中国人工智能开发商飞向中国自己的国内筹码,美国可以使用出口控制措施来帮助实现这一目标。
作者表达的观点并不代表其附属机构的观点。