作者:Jay Peters
杰伊·彼得斯 是涵盖技术,游戏等的新闻编辑。在Techmeme工作了将近两年后,他于2019年加入了The Verge。
Nvidia正在吹捧DeepSeek的开源AI模型在其刚刚推出的RTX 50系GPU上的性能,声称这一点他们可以比PC市场上任何事情都更快地运行DeepSeek的蒸馏型模型。但是,Nvidia的这一消息可能会在某种程度上忽略这一点。
本周,NVIDIA的市值遭受了一日最大的市值损失对于美国公司,损失广泛归因于DeepSeek。DeepSeek说,其新的R1推理模型没有需要强大的NVIDIA硬件,以实现与OpenAi S O1型号相当的性能,让中国公司以较低的成本训练它。DeepSeek用R1取得的成就似乎表明,NVIDIA的最佳筹码可能并不需要在AI中取得进步,这可能会影响公司的命运。
也就是说,DeepSeek确实使用了NVIDIA GPU训练其模型,仅是美国政府允许NVIDIA出口到中国的模型(H800)。今天的NVIDIA博客文章希望证明其新的50系RTX GPU对R1很有用推理或AI模型实际生成的内容是,GPU是建立在同一NVIDIA BLACKWELL GPU架构上的,该体系结构为数据中心提供了世界领先的AI创新,并且RTX完全加速了。DeepSeek,在PC上提供最大的推理性能。
但是它做了多么深训练是这么大的一部分。(值得注意的是,中国正在获得功能较低的版本RTX 5090。)
其他科技公司也在试图乘坐DeepSeek Wave。R1也是现在在AWS上可用,Microsoft在其Azure AI Foundry平台和GitHub上提供了可用本星期。但是,据报道,Microsoft和Openai正在调查DeepSeek是否获取OpenAI数据,彭博报告。