英语轻松读发新版了,欢迎下载、更新

Mistral董事会成员和A16Z VC Anjney Midha说,DeepSeek不会阻止AI的GPU饥饿|TechCrunch

2025-01-31 23:03:45 英文原文

作者:Julie Bort

Andreessen Horowitz普通合伙人兼Mistral董事会成员Anjneyanjâmidha首次监视DeepSeek的令人垂涎的表演六个月前,他告诉TechCrunch。

当DeepSeek介绍编码器V2时,这与Openai的GPT4-Turbo媲美,以用于编码特定的任务它去年发布。他说,这使DeepSeek走上了每隔几个月就可以在R1上发布改进的模型的道路。R1是其新的开源推理颠覆科技行业的模型以一小部分成本提供行业标准绩效。

尽管有NVIDIA股票的抛售Midha说,R1并不意味着AI基础模型将停止花费数十亿美元来吞噬GPU芯片并尽可能快地建立更多的数据中心。” 

这意味着他们将通过获得的计算功率来做更多的事情。

他说,当人们喜欢,好吧,米斯特拉尔(Mistral)筹集了十亿美元。”DeepSeek是否意味着所有十亿美元是完全不必要的?不,实际上,能够查看DeepSeek的效率提高,内部化,然后付出十亿美元的效率,这对他们来说是非常有价值的。

他补充说,现在我们可以从同一计算中获得10倍的输出。

他认为,这并不意味着米斯特拉尔(Mistral)无可救药地落后于竞争对手和人类。他们每个人筹集了比Mistral的数十亿美元。据报道,Openai正在谈论另一个令人jaw目结舌的400亿美元。

他说,米斯特拉尔仍然与他们竞争,因为这是开源的。他的逻辑确实有优点。开源使公司可以从想要提供帮助的人那里获得基本的免费技术劳动,因为他们使用了该项目。封闭的源头竞争对手保护了他们的秘密,必须为所有劳动和计算权力付费。

您不需要200亿美元。您只需要比任何其他开源模型应用程序更多的计算。因此,米斯特拉尔(Mistral)定位[好]。关于他的投资组合公司,他们是任何开源提供商中最多的计算。

Facebook S Llama是Mistral的最大的西方开源AI模型竞争对手,也将获得更多的投资。首席执行官马克·扎克伯格(Mark Zuckerberg)周三表示仍计划花费数千亿美元总体而言。其中包括2025年的600亿美元用于资本支出,主要是数据中心。 

A16Z的氧气GPU共享计划

Midha,也是AI Image Generator Black Forest Labs的董事会成员3D模型制造商Luma(AI中的一个天使在拟人化,Elevenlabs等人)还有另一个原因,为什么他不愿意很快就会减轻AI的渴望。 

他是领导者A16Z的氧气程序。GPU,尤其是NVIDIA的最先进的H100,已成为一种稀缺的商品,以至于大约一年半以前,风险投资公司将事情掌握在自己的手中。它购买了其中一堆供投资组合公司使用。

氧气现在已被过多地预订。我可以分配足够的笑声。他的初创公司不仅需要GPU进行AI模型培训,而且还需要更多的时间来为客户运行正在进行的AI产品。

他解释说,现在对消费的这种不满意的需求。”他解释说。

这也是为什么他认为DeepSeek的工程突破会改变Stargate的原因。那是Openai的5000亿美元合伙企业本月初,AI数据中心的软银和Oracle宣布。 

DeepSeek ushers的主要变化是国家国家的认可,即AI是下一个基础基础设施,例如电力和互联网。Midha希望他们考虑基础设施独立性。他们是否想依靠中国模型以及其数据中的爪子?还是他们希望西方模式遵循西方法律和道德规范,并遵守北约协议? 

他显然会提倡使用西方模式,例如他的巴黎米斯特拉尔(Mistral)。数百家公司分享了这种关注和已经阻止了DeepSeek,这既是消费者应用服务,又是开源模型。

并非每个人都在购买对中国开源模型的恐惧。公司可以在自己的数据中心本地运行它们。DeepSeek已经可以作为美国公司的安全云服务提供Microsoft Azure Foundry,因此开发人员不必使用DeepSeek的云服务。

实际上,英特尔的前首席执行官帕特·盖辛格(Pat Gelsinger)熟悉中国告诉TechCrunch,他的创业Gloo正在建造AI聊天服务在他们自己的DeepSeek R1上而不是像骆驼或Openai这样的选择。

但是,如果有人想根据DeepSeek抛弃他们的数据中心计划,Midra笑着并有一个请求:如果您有额外的GPU,请将其发送给ANJ。

TechCrunch有一个以AI为重点的新闻通讯! 在这里注册每个星期三将其放入收件箱中。

关于《Mistral董事会成员和A16Z VC Anjney Midha说,DeepSeek不会阻止AI的GPU饥饿|TechCrunch》的评论


暂无评论

发表评论

摘要

Andreessen Horowitz普通合伙人Anjney“ Anj” Midha强调了DeepSeek的Coder V2模型令人印象深刻的表现,该模型与OpenAI的GPT4-Turbo竞争,用于编码任务。这导致了R1的发展,R1是一种开源推理模型,以较低的成本提供高性能,具有挑战性的行业规范。尽管NVIDIA股票抛售,MIDHA断言AI公司将继续在GPU和数据中心进行大量投资,但旨在提高效率。他还讨论了米斯特拉尔(Mistral)开源方法的战略优势,而不是诸如Openai和Anthropic的封闭源竞争对手,这强调了由于道德问题而与中国模型独立的重要性。此外,他还指出,通过A16Z的氧气计划对GPU的需求持续很高,这表明诸如DeepSeek之类的进步不会遏制AI公司的硬件食欲,而可能会将战略优先级转移到效率和独立性上。