英语轻松读发新版了,欢迎下载、更新

NVIDIA说,其新的GPU是DeepSeek AI最快的GPU,这错过了重点

2025-01-31 20:22:44 英文原文

作者:Jay Peters

Jay Peters

杰伊·彼得斯 是涵盖技术,游戏等的新闻编辑。在Techmeme工作了将近两年后,他于2019年加入了The Verge。

Nvidia正在吹捧DeepSeek的开源AI模型在其刚刚推出的RTX 50系GPU上的性能,声称这一点他们可以比PC市场上任何事情都更快地运行DeepSeek的蒸馏型模型。但是,Nvidia的这一消息可能会在某种程度上忽略这一点。

本周,NVIDIA的市值遭受了一日最大的市值损失对于美国公司,损失广泛归因于DeepSeek。DeepSeek说,其新的R1推理模型没有需要强大的NVIDIA硬件,以实现与OpenAi S O1型号相当的性能,让中国公司以较低的成本训练它。DeepSeek用R1取得的成就似乎表明,NVIDIA的最佳筹码可能并不需要在AI中取得进步,这可能会影响公司的命运。

也就是说,DeepSeek确实使用了NVIDIA GPU训练其模型,仅是美国政府允许NVIDIA出口到中国的模型(H800)。今天的NVIDIA博客文章希望证明其新的50系RTX GPU对R1很有用推理或AI模型实际生成的内容是,GPU是建立在同一NVIDIA BLACKWELL GPU架构上的,该体系结构为数据中心提供了世界领先的AI创新,并且RTX完全加速了。DeepSeek,在PC上提供最大的推理性能。

但是它做了多么深训练是这么大的一部分。(值得注意的是,中国正在获得功能较低的版本RTX 5090。)

其他科技公司也在试图乘坐DeepSeek Wave。R1也是现在在AWS上可用,Microsoft在其Azure AI Foundry平台和GitHub上提供了可用本星期。但是,据报道,Microsoft和Openai正在调查DeepSeek是否获取OpenAI数据,彭博报告

关于《NVIDIA说,其新的GPU是DeepSeek AI最快的GPU,这错过了重点》的评论


暂无评论

发表评论

摘要

NVIDIA强调了DeepSeek的开源AI模型在其新推出的RTX 50系GPU上的性能,但可能会缺少更大的局面。Nvidia最近经历了重大的市值损失,部分原因是DeepSeek宣布其R1推理模型可以在没有强大的NVIDIA硬件的情况下实现与OpenAI的O1模型相当的性能,这表明对NVIDIA对AI进步的最佳筹码的依赖减少了。尽管如此,DeepSeek使用美国政府允许出口到中国的NVIDIA GPU较弱训练了他们的模型。NVIDIA的目的是证明其新的RTX 50系列GPU用于R1推断的实用性,但训练方法仍然很重要。AWS和Microsoft等其他科技公司也在将R1集成到其平台中,同时调查了DeepSeek的潜在数据滥用。