英语轻松读发新版了,欢迎下载、更新

尽管美国芯片限制,中国如何在人工智能领域取得进展

2025-01-08 17:46:13 英文原文

作者:Harry Booth

2017年,北京揭幕制定了主导人工智能发展的雄心勃勃的路线图,旨在到 2030 年确保全球领先地位。到 2020 年,该计划呼吁人工智能领域取得“标志性进展”以展示其进步。然后在 2022 年末,OpenAI 发布的 ChatGPT 让世界大吃一惊,也让中国措手不及。

当时,中国领先的科技公司还没有摆脱长达 18 个月的困境。政府镇压这使中国科技行业损失了约 1 万亿美元。近一年后,少数中国人工智能聊天机器人才获得政府批准公开发布。一些人质疑中国在审查制度上的立场是否会影响阻碍国家的人工智能雄心。与此同时,拜登政府在 ChatGPT 首次亮相前一个月公布了出口管制措施,旨在切断中国与训练大规模人工智能模型所必需的先进半导体的联系。如果没有尖端芯片,北京到 2030 年实现人工智能霸主的目标似乎越来越遥不可及。

但快进到今天,一系列令人印象深刻的中国发布表明美国在人工智能方面的领先地位已经缩小。十一月,阿里巴巴和中国人工智能开发商深度搜索发布的推理模型在某些方面可与 OpenAI 的 o1-preview 相媲美。同月,中国视频游戏巨头腾讯推出了混元大版,这是一个开源模型,公司测试发现在多个基准测试中均优于美国开发的顶级开源模型。 然后,在 2024 年的最后几天,DeepSeek 发布了 DeepSeek-v3,它现在在流行的在线排行榜上在开源 AI 中排名最高,并且坚持自己的立场来自 OpenAI 和 Anthropic 的顶级性能封闭系统。

阅读更多: 2024 年人工智能的好处和坏处如何增长

DeepSeek-v3发布之前,这一趋势就已经引起了人们的关注埃里克·施密特谷歌前首席执行官,也是美国人工智能政策最有影响力的声音之一。2024 年 5 月,施密特自信地宣称,美国维持了人工智能领域领先两到三年,——这在我的书中是永恒的。——然而到了 11 月,在讲话在哈佛大学肯尼迪学院,施密特改变了态度。他引用阿里巴巴和腾讯的进步作为中国正在缩小差距的证据。“这让我感到震惊,”他说。“我认为我们对芯片施加的限制会让它们望而却步。” 

除了国家威望的来源之外,谁在人工智能领域处于领先地位还可能对全球力量平衡产生影响。如果人工智能代理如果可以使大部分劳动力实现自动化,它们可能会促进国家经济的发展。未来的系统,能够引导武器或黑客攻击对手,可以提供决定性的军事优势。随着夹在两个超级大国之间的国家被迫在中国或美国的人工智能系统之间做出选择,人工智能可能会成为影响全球的强大工具。中国的快速发展引发了人们的疑问:美国对半导体的出口管制是否足以维持美国的优势。

阅读更多: 以色列如何在加沙使用人工智能——以及这对未来战争可能意味着什么

构建更强大的人工智能取决于三个基本要素:数据、创新算法和原始计算能力或计算能力。GPT-4o 等大型语言模型的训练数据通常从互联网上删除,这意味着世界各地的开发人员都可以使用这些数据。同样,算法或如何改进人工智能系统的新想法可以轻松跨越国界,因为新技术经常在学术论文中分享。即使不是——中国也拥有丰富的人工智能人才,更多顶尖人工智能研究人员相比之下,先进芯片的制造极其困难,而且与算法或数据不同,它们是一种物理商品,可以在边境被拦截。

先进半导体的供应链由美国及其盟国主导。美国公司 Nvidia 和 AMD 在用于人工智能的数据中心 GPU 方面拥有有效的双头垄断地位。他们的设计非常复杂——晶体管的测量单位是个位数纳米——目前只有这家台湾公司台积电 制成品这些顶级芯片。为此,台积电依靠价值数百万美元的机器,仅荷兰ASML公司可以建造。 

美国一直试图利用这一点来发挥自己的优势。2022年,拜登政府出台了出口管制法律,禁止向中国出售尖端芯片。此举是在一系列措施之后开始的特朗普第一届政府,旨在限制中国获取芯片制造技术。这些行为不仅限制了先进芯片流入中国,而且阻碍了国家的发展国内芯片产业。美国商务部长称中国芯片落后“数年”吉娜雷蒙多告诉60分钟四月。

阅读更多: 研究发现全球在强大的人工智能芯片的拥有方面存在明显差距

然而,2022 年的出口管制在宣布之前就遇到了第一个障碍,据报道,中国开发商囤积了即将受到限制的芯片。DeepSeek 是一家名为 R1 的人工智能推理模型背后的中国开发商,该模型竞争对手 OpenAI 的 O1 预览版,组装的一群10,000在出口管制实施前一年,Nvidia A100 GPU 即将被禁止。

走私也可能削弱了出口管制的有效性。十月,路透社报道在中国公司华为生产的产品上发现了受限制的台积电芯片。据报道,中国公司还利用以下方式获取了受限制的芯片:空壳公司中国境外。其他人有规避出口管制通过从离岸云提供商租用 GPU 访问权限。十二月,华尔街日报 报道美国正在准备新措施,限制中国通过其他国家获取芯片的能力。 

阅读更多: 人工智能进步真的放缓了吗?

尽管美国的出口管制限制了中国获得最尖端半导体的机会,但仍然允许销售性能较差的芯片。事实证明,决定哪些芯片应该被允许、哪些芯片不应该被允许具有挑战性。2022 年,英伟达调整了旗舰产品的设计芯片,为中国市场创建一个符合限制阈值的版本。该芯片对于人工智能开发仍然有用,促使美国收紧限制兰德公司技术与安全政策中心的人工智能和计算主管 Lennart Heim 表示,“在 2023 年 10 月,我们(中国)可以购买基本上同样好的芯片”。他说,这个漏洞,加上新芯片进入人工智能开发商基础设施的时间,是我们尚未看到出口管制对中国人工智能发展产生全面影响的原因。

目前的门槛是否达到了适当的平衡还有待观察。11月,腾讯发布了名为Hunyuan-Large的语言模型,表现优于Meta 在多个基准测试中是 Llama 3.1 最强大的变体。尽管基准是一个不完美的衡量标准据介绍,在比较 AI 模型的整体智能时,Hunyuan-Large 的性能令人印象深刻,因为它是使用功能较弱、不受限制的 Nvidia H20 GPU 进行训练的研究由伯克利风险与安全实验室提供。“由于有了更好的软件,他们显然可以更好地利用硬件,”该研究的作者、国防部国防创新部门的顾问 Ritwik Gupta 说。竞争对手中国实验室的 DeepSeek-v3,被认为是可用的最强开放模型,也使用令人惊讶的很少的计算进行训练。尽管当选总统唐纳德·特朗普将如何处理人工智能政策存在很大的不确定性,但几位专家在 11 月向《时代》杂志表示,他们预计将实施出口管制坚持——甚至还可以扩大。

新的限制12月,中国企业再次推出储存的即将被封锁的芯片。“整个策略需要重新考虑,”古普塔说。“停止用这些硬件芯片玩打地鼠游戏。”他建议,美国不应试图通过限制芯片的使用来减缓大型语言模型的开发,而应集中精力阻止军事人工智能系统的开发,他说通常需要更少的计算能力来训练。不过他承认,对芯片供应链其他部分(例如用于制造芯片的 ASML 机器)的限制是中国国内芯片行业放缓的关键。

海姆表示,去年美国的领先优势已经缩小,不过他指出,虽然中国现在可能可以与美国最好的开源模式相媲美,但这些模式仍然落后大约一年位于顶部封闭模型的后面。他补充说,差距缩小并不一定意味着出口管制失败。“让我们摆脱这种出口管制有效或无效的二元论,”他说,并补充说中国可能需要更长的时间才能感受到它们的影响。 

过去十年,用于训练人工智能模型的计算量出现了令人眼花缭乱的增长。例如,OpenAI 于 2023 年发布的 GPT-4,估计训练时使用的计算量比 2019 年发布的 GPT-2 多大约 10,000 倍。有迹象表明,这一趋势将持续下去,因为美国公司喜欢X亚马逊建造拥有数十万个 GPU 的大型超级计算机,远远超过用于训练当今领先人工智能模型的计算能力。海姆预测,如果确实如此,美国芯片出口限制将阻碍中国跟上人工智能发展步伐的能力。“出口管制主要是在数量上打击你,”海姆说,他补充说,即使一些受限制的芯片落入中国开发商手中,但通过减少数量,出口管制也会使训练和部署模型变得更加困难。规模。“我确实预计,只要计算仍然重要,随着时间的推移,出口管制通常会受到更严厉的打击,”他说。

卡内基国际和平基金会技术与国际事务项目访问学者斯科特·辛格表示,在华盛顿内部,“目前,人们对于是否要把中国拉到谈判桌前犹豫不决”。隐含的推理:“[如果美国领先],我们为什么要分享任何东西?” 

但他指出,与中国就人工智能进行谈判有令人信服的理由。“中国不一定会成为灾难性风险的来源,”他说,并补充说,尽管存在计算限制,但中国的持续进步意味着有一天它可能会生产出具有危险能力的人工智能。“如果中国关系更近,请考虑您希望与他们进行哪些类型的对话,以确保双方系统的安全,”辛格说。

关于《尽管美国芯片限制,中国如何在人工智能领域取得进展》的评论


暂无评论

发表评论

摘要

文章讨论了美国出口管制对中国开发先进人工智能(AI)技术能力的影响,并建议当前的战略可能需要修改,以提高有效性。以下是一些要点:1. **出口管制的影响**:- 虽然美国对向中国出口高端半导体实施了限制,但这些措施并没有完全阻止中国在人工智能发展方面的进步。- 根据现行法规,向中国公司出售功能较弱但仍然有用的芯片时存在一些漏洞。2. **中国尽管受到限制仍取得进步**:- 腾讯发布了 Hunyuan-Large,这是一种语言模型,在使用功能较弱的 GPU 的多项基准测试中,其性能优于 Meta 的 Llama 3.1。- DeepSeek 的 DeepSeek-v3 被认为是可用的最强大的开源 AI 模型,它是使用相对较低的计算资源进行训练的。3. **需要更好的策略**:- 专家建议更多地关注防止军事人工智能系统的发展,与大型语言模型相比,军事人工智能系统通常需要更少的计算资源。- 有必要重新考虑当前的策略,而不仅仅是限制芯片销售,并考虑限制供应链其他部分(例如制造设备)等替代措施。4. **人工智能发展的未来趋势**:- 使用更多计算能力来训练人工智能模型的趋势仍在继续,美国公司正在建造能够处理前所未有的海量数据的超级计算机。- 如果这种趋势持续下去,随着时间的推移,出口管制可能会通过限制中国开发者训练和部署先进模型的规模和速度而变得更加有效。5. **潜在的谈判需求**:- 由于担心失去技术优势,华盛顿内部对于与中国就人工智能进行谈判犹豫不决。- 然而,专家认为,与中国就人工智能开发的安全和伦理影响进行讨论很重要,即使它们并不处于最前沿。6. **当前差距和未来展望**:- 虽然中国的进步缩小了开源模型的差距,但它们仍然落后于美国公司开发的闭源模型。- 出口管制的全面影响可能需要更长的时间才能感受到,因为新的芯片设计需要时间才能融入人工智能开发基础设施。总之,虽然当前的出口管制减缓了中国获得尖端技术的速度,但可以通过更具战略性的方法以及可能参与外交谈判来解决与人工智能安全相关的共同关切来提高有效性。我