作者:Peter Cohan
这证明了初创企业通常比大型公司更成功的基本原因:稀缺产生了创新。
一个很好的例子是中国AI模型DeepSeek R1 - 一种复杂的解决问题的模型,与Openai s O1竞争,该模型已缩放到全球前十名,但又建立了
速度更快,较少,功能较小的AI芯片,成本要低得多。华尔街日报。
R1的成功应该使企业受益。这是因为当公司可用时,公司没有理由为有效的AI模型支付更多费用,并且很可能会更快地改善。
Openai的模型是表现最好的,但我们也不想为我们不需要的能力付费。生成的AI预测财务回报,告诉杂志。
去年9月,Poo的公司从Anthropic的Claude转变为DeepSeek,在测试表明DeepSeek的表现相似。杂志。例如,开放AI为其服务收取20至200美元的费用,而DeepSeek将其平台免费提供给个人用户,而开发人员只收取每百万个令牌0.14美元的费用。”《新闻周刊》。
当我的书时,大脑急忙,去年夏天出版了,我担心美国生成AI的未来过于依赖最大的技术公司。我将其与美国初创公司的创造力形成鲜明对比的是,在互联网繁荣时期,它产生了2,888个首次公开产品(与美国生成AI初创公司的零IPO相比)。
DeepSeek的成功可以鼓励新的竞争对手进入美国的大型语言模型开发人员。如果这些初创公司建立具有更少芯片的强大AI模型并更快地进行市场改进,那么随着LLM开发人员复制DeepSeek的策略,即使用较少,更高级的AI芯片,NVIDIA收入的增长可能会慢得多。
我们将拒绝评论,” NVIDIA发言人在1月26日的电子邮件中写道。
DeepSeek给美国领先的风险投资家留下了深刻的印象。硅谷风险投资家马克·安德森(Marc Andreessen)在1月24日在X上发表的帖子中写道。
公平地说,DeepSeek的技术落后于Openai和Google等美国竞争对手。但是,尽管使用了较少和较少的筹码,但该公司的S R1模型是一个近距离竞争对手,在某些情况下会跳过美国开发人员认为必不可少的措施的步骤。注意到杂志。
由于部署生成AI的成本很高,因此企业越来越想知道是否有可能获得积极的投资回报。正如我上次写的四月,可以将超过1万亿美元用于该技术,而AI Chatbots的杀手级应用程序尚未出现。
因此,企业对降低所需投资的前景感到兴奋。由于R1的开源模型运作良好,并且比OpenAI和Google的开源模型便宜得多,因此企业非常感兴趣。
为何如此?R1是在Huggingface上下载的最佳趋势模型。VentureBeat,,,,和 匹配的openai s o1仅占成本的3%-5%。R1还提供了搜索功能用户法官的判断,要优于OpenAi和Clleplexity,并且仅与Google的竞争双子座的深入研究VentureBeat。
DeepSeek以低得多的成本开发了R1。DeepSeek表示,它在大约两个月内以560万美元的价格培训了其最新型号之一。CNBC 远远远远远远远远远远少于2024年引用的人类首席执行官达里奥·阿莫迪(Dario Amodei杂志报告。
为了训练其V3模型,DeepSeek使用了超过2,000个NVIDIA芯片的簇,而数万芯片用于相似大小的训练模型。杂志。
由加州大学伯克利分校研究人员主持的平台Chatbot Arena的独立分析师在1月25日在Chatbot Performance的前10名中对V3和R1模型的评分为杂志写。
DeepSeek背后的首席执行官是Liang Wenfeng,他管理了80亿美元的对冲基金。他的对冲基金(名为High-Flyer)使用AI芯片来构建算法来识别可能影响股票价格的模式。金融时报。
梁的局外人地位帮助他取得了成功。2023年,他推出了DeepSeek来发展人级AI。一家竞争对手LLM公司的创始人告诉The The The The The The The The The The The The The The The The The The The The The The The The The The The The The The The The The The The The Rival LLM公司的创始人告诉The The The The The The The The The The The The The The The The The,Liang建立了一个杰出的基础设施团队,该团队真正了解芯片的工作原理。金融时报。他从对冲基金会带走了他最好的人到DeepSeek。
当华盛顿禁止NVIDIA出口H100S时,DeepSeek受益于中国。这迫使本地人工智能公司围绕着稀有功能不力的本地芯片的有限计算能力来设计。CNBC。
H800芯片在芯片之间以H100 s 600 gigabits的一半为单位的芯片之间的数据传输数据,并且通常价格便宜。中等的Nscale首席商务官员Karl Havard发帖。Liang的团队已经知道如何解决这个问题。金融时报。
公平地说,DeepSeek表示,它在2022年10月在美国对它们实施出口控制之前已经储存了10,000 h100芯片。《新闻周刊》。目前尚不清楚DeepSeek是否使用这些H100芯片来开发其模型。
Microsoft对DeepSeek的成就印象深刻。•看到DeepSeek的新模型,就它们真正有效地完成了执行此推理时间计算的开源模型而言,这是非常令人印象深刻的,并且是超高效的,首席执行官萨蒂亚·纳德拉(Satya Nadella)在1月22日在世界经济论坛上说CNBC报告。我们应该非常非常重视中国的发展。
DeepSeek的成功应该刺激美国AI政策的改变,同时使NVIDIA投资者更加谨慎。
美国对NVIDIA的出口限制对DeepSeek等初创公司施加了压力,以优先考虑效率,资源筹款和协作。为了创建R1,DeepSeek重新设计了其使用NVIDIA H800较低的处理速度,前DeepSeek员工和现任西北大学计算机科学博士的培训过程。学生Zihan Wang告诉麻省理工学院技术评论。
一位NVIDIA研究人员对DeepSeek的成就充满热情。DeepSeek的论文报道了结果,这使人们回想起了开拓性AI计划的记忆,这些计划掌握了诸如棋子游戏的诸如从头开始建造的国际棋盘游戏,而没有首先模仿人类的大师,” NVIDIA研究科学家Jim Fan上的高级NVIDIA研究科学家Jim Fan表示由杂志。
DeepSeek的成功节流NVIDIA的增长率会吗?我不知道。但是,根据我的研究,企业显然希望有强大的生成AI模型来返回其投资。如果构建这些应用程序的成本和时间较低,企业将能够进行更多旨在发现高付款生成AI应用程序的实验。
这就是为什么R1的成本较低,表现较短的时间应该继续吸引更多的商业兴趣。提供企业想要的东西的关键是DeepSeek的技能,旨在优化功能较低的GPU。
如果更多的初创公司可以复制DeepSeek的成就,那么对Nvidia最昂贵的筹码的需求可能会更少。
我不知道如果发生这种情况,NVIDIA将如何做出回应。但是,在短期内,随着创业公司遵循DeepSeek战略的建立模型,其筹码较少,较低的筹码可能会减少收入增长。