作者:Harsh Chauhan, The Motley Fool Fri, Feb 7, 2025, 4:00 PM 5 min read
中国人工智能(AI)初创企业DeepSeek在其具有成本效益,开源,大语言模型(LLM)之后,通过美国技术领域发出了冲击波苹果美国的App Store超过了Openai的Chatgpt,该商店在其AI基础设施中倾注了数十亿美元,并通过现金燃烧。
这家中国公司声称,它培训了其DeepSeek-V3车型,该模型于1月10日推出,仅为600万美元。该公司上周推出了一种称为DeepSeek-R1的新推理模型,声称它可以与OpenAI的O1型号竞争,并且比后者便宜20至50倍。
DeepSeek模型的成本效率和质量使半导体公司的股票暴跌。投资者可能想知道,在DeepSeek所证明的效率之后,公司和政府是否花费大量资金来建设AI基础设施,该公司尽管制裁和资源有限,但据报道,该公司仍在建立该模型。
Broadcom (纳斯达克:AVGO)是那些在DeepSeek的启示之后被锤击的筹码巨头之一。该股票在1月27日下跌了17%以上。但是,DeepSeek取得的突破实际上可能是Broadcom的偏执。
DeepSeek关于培训模型所涉及的成本的主张仍在辩论。一些报告表明,该公司可以从Nvidia它可能低估了培训其模型所产生的实际支出。但是,毫无疑问,中国初创企业肯定已经将培训和部署AI模型所需的金钱和计算能力重点放在了这一事实中。
技术巨头,例如元平台,,,,亚马逊,Openai和字母已经通过减少对NVIDIA硬件的依赖来降低计算成本的努力。Broadcom一直从这种趋势中受益图形处理单元(GPU)。
与可以执行各种任务(包括AI模型培训和推断)的GPU相比,Broadcom设计是为执行特定任务的ASIC。但是,ASIC的具体性质意味着它们在执行设计的任务方面更快,并且成本较低,这解释了为什么许多公司都向Broadcom转向制造自定义AI处理器的原因。