作者:Kelsey Vlamis
美国政府多年来一直在积极试图遏制中国获得半导体芯片的访问,这是生成-AI模型中的关键组成部分。相反,这些出口限制可能加剧了导致的创新DeepSeekS R1的一种大型语言模型正在破坏美国人工智能行业及其蓬勃发展的经济。
Morningstar的技术分析师Brian Colello表示,这句话“限制会导致创造力”。
他告诉Business Insider:“这些中国模型受到处理器的约束,因此导致了一些培训中的创意技术,鉴于处理器已经接受了培训,DeepSeek模型的性能比预期的要好。”
上周,中国人工智能创业公司DeepSeek放弃了其应用程序的版本。R1模型。该模型似乎与来自美国主要科技公司(例如Meta)的人竞争Openai和Google的成本要低得多。
这家中国公司表示,它花了近600万美元用于计算能力来训练其新系统,这仅占什么美国科技公司花在了他们的模型上。
DeepSeek表示,与通常使用的竞争对手相比,其模型的训练训练较少,强大的半导体芯片。
自2022年以来,美国的制裁使AI-Chip制造领导人非法Nvidia将其一些硬件出售给中国,包括最先进的筹码。这些制裁旨在限制中国在人工智能和军事技术方面的进步。
Moor Insights&Strategy的首席执行官Patrick Moorhead告诉NVIDIA DeepSeek所使用的Nvidia Chipseek使用。
他补充说:“以回旋处的方式,在拜登政府中发起的制裁促使DeepSeek在训练和运行模型方面更具创造力。”“没有人应该感到惊讶,因为'必要性是发明的母亲。'”
尽管制裁了《中国科技巨头华为》,但DeepSeek的成功呼应了。华为失去了对高级的访问权限 近年来筹码,它推出了一系列智能手机 在很大程度上用国内硬件取代了西方科技和软件令人惊叹的美国决策者。
与BI交谈的一些专家和分析师对DeepSeek关于模型成本的主张以及筹码的数量和类型表示怀疑。目前尚不清楚哪些半导体用于训练和部署DeepSeek。
仍然,有些 分析师说,这家初创公司表明,在AI方面,可以做更多的事情。
德意志银行分析师Adrian Cox和Galina Pozdnyakova在周一发表的一份研究报告中写道:“他们不得不从软件和方法(例如经过思考的推理)中挤出更多的价值,并立即使用多种模型,而是只是在问题上投入更多的计算能力。”
克里斯·米勒(Chris Miller),《 2022年》的作者”芯片战争”告诉BI,DeepSeek模型令人印象深刻,但自2023年以来,AI的成本急剧下降,因此他没有发现该公司的R1研究论文尤其令人惊讶。
他补充说,DeepSeek正在努力制定“板鞋预算”的想法是不正确的,称该公司使用了“非常狭义的培训成本定义”。米勒说,“很明显,培训成本比DeepSeek建议的要高的数量级”。
AI Safor AI首席执行官Alexandr Wang在周日的CNBC采访中说,DeepSeek拥有50,000 H800,Miller说这将是“大量数字”。米勒说,虽然这个数字仍然比美国公司所要低得多,但它可能比美国出口官员希望一家中国公司积累的可能性要多得多。
外交关系委员会中国研究高级研究员Zongyuan Zoe Liu告诉BI,DeepSeek的发展建议中国的人工智能发展“似乎至少与美国相当。”
但是她说“我们仍处于比赛的开始”,以实现AI的统治地位。
她补充说:“对于美国决策者来说,这无疑是一个很好的提醒,根据最终目标,技术限制可能行不通。”
几位专家说,他们认为与DeepSeek的最新发展可能会导致对中国的半导体制裁,但这不一定会阻止进一步的创新。
科雷洛说:“美国可以整天对中国进行制裁,但总会有威胁:如果中国到底有一些突破,该怎么办?”
汤姆·卡特(Tom Carter)贡献了报告。