作者:Kyle Wiggers
DeepSeek已经传播开来。
本周,中国人工智能实验室DeepSeek本周闯入了主流意识 它的聊天机器人应用程序升至Apple App Store图表的顶部((和Google Play,)。DeepSeek的AI模型是使用计算有效技术训练的, 领导了华尔街分析师 - 和技术人员质疑美国是否可以在AI种族中保持领先地位,以及对AI芯片的需求是否会维持。
但是,DeepSeek从何而来,它是如何如此迅速地升入国际名声的呢?
DeepSeek得到了高飞行资本管理的支持,这是中国定量对冲基金,该基金使用AI来告知其交易决策。
AI爱好者Liang Wenfeng据报道,据报道,据报道,在智人大学的一名学生开始涉足交易时,温芬(Wenfeng)于2019年开始涉足贸易,他于2019年推出了高飞行资本管理作为对冲基金,重点是开发和部署AI算法。
2023年,High-Flyer始于DeepSeek,是一个致力于研究AI工具与金融业务分开的实验室。该实验室以High-Flyer作为其投资者之一,旋转成自己的公司,也称为DeepSeek。
从第一天开始,DeepSeek构建了自己的数据中心群集进行模型培训。但是像中国的其他AI公司一样DeepSeek受到美国出口禁令的影响。为了培训其最新模型之一,该公司被迫使用NVIDIA H800芯片,这是美国公司可用的芯片,H100的功能较小的版本。
据说DeepSeek的技术团队偏向年轻。公司据报道,积极招募来自中国顶级大学的AI研究人员博士学位。DeepSeek还雇用没有任何计算机科学背景的人根据《纽约时报》,为了帮助其技术更好地了解广泛的科目。
DeepSeek于2023年11月发布了其第一组模型 - DeepSeek编码器DeepSeek LLM和DeepSeek Chat。
DeepSeek-V2是一种通用文本和图像分析系统,在各种AI基准测试中表现良好,并且运行远比当时可比的模型便宜得多。它迫使DeepSeek的国内竞争,包括Bytedance和Alibaba,降低了某些模型的使用价格,并使其他人完全自由。
DeepSeek-V3,于2024年12月推出,仅加入了DeepSeek的臭名昭著。
根据DeepSeek的内部基准测试,DeepSeek V3均优于可下载的,公开可用的模型 骆驼并且封闭的模型只能通过API访问,例如Openai的GPT-4O。
同样令人印象深刻的是DeepSeek的R1推理模型。DeepSeek声称在一月份发行R1在关键基准测试上的性能以及OpenAisâo1模型。
作为一个推理模型,R1有效地进行了事实检查,这有助于避免一些通常会绊倒模型的陷阱。与典型的非争议模型相比,推理模型通常需要更长的秒至几分钟才能达到解决方案。优势是它们在物理,科学和数学等领域中倾向于更可靠。
但是,R1,DeepSeek V3和DeepSeek的其他模型有一个缺点。被中文开发的人工智能,他们受到 基准测试中国的互联网监管机构确保其反应体现核心社会主义价值观。
三月,DeepSeek超过1650万次访问。[f]或3月,DeepSeek排在第二位,尽管根据每日访问,交通量比2月份的交通下降了25%,” SamelyWeb的编辑David Carr告诉TechCrunch。与Chatgpt相比,它仍然显得苍白,Chatgpt在三月份每周有5亿个活跃用户飙升。
5月,DeepSeek发布了其R1推理AI模型的更新版本在开发人员平台上拥抱面孔。
如果DeepSeek具有业务模型,则确切地说是该模型是什么。该公司将其产品和服务的价格远低于市场价值,并免费提供其他人。这也不是投资者的钱,尽管有很多风险兴趣。
DeepSeek讲述的方式是,效率突破使它能够保持极高的成本竞争力。一些专家争议但是,该公司提供的数字。
无论如何,开发人员都采用了DeepSeek的模型,该模型通常是为了理解该短语,但在允许商业用途的宽敞许可下可用。根据Hugging Face的首席执行官Clem Delangue的说法,Hugging Face是主持DeepSeek模型的平台之一,拥抱面孔的开发人员创建了R1的500多个衍生品模型总共有250万次下载。
DeepSeek对更大,更既定的竞争对手的成功一直是被描述为上升和过度宣传公司的成功至少部分负责导致NVIDIA的股价下跌18%在一月,为引起公众回应来自Openai首席执行官Sam Altman。3月,美国商务部局告诉工作人员DeepSeek将被禁止在其政府设备上,据路透社说。
微软宣布在其Azure AI Foundry服务上可用DeepSeek,Microsoft的平台将AI服务汇集在单个横幅下。当被问及DeepSeek对Meta的第一季度收益电话中的影响时,首席执行官马克·扎克伯格(Mark Zuckerberg)说在AI基础设施上的支出将继续成为战略优势用于元。三月,Openai称为DeepSeek的国家补贴和国家控制,并建议美国政府考虑禁止DeepSeek的模型。
在NVIDIA的第四季度收益电话会议期间首席执行官詹森·黄(Jensen Huang)强调了DeepSeek的出色创新,说它和其他推理模型对NVIDIA非常有用,因为它们需要更多的计算。
同时,一些公司正在禁止DeepSeek,整个国家和政府,,,,包括韩国。纽约州也禁止DeepSeek被用于政府设备。
5月,微软副主席兼总统布拉德·史密斯(Brad Smith)在参议院听证会上说Microsoft员工允许使用DeepSeek由于数据安全和宣传问题。
至于DeepSeek的未来可能会有什么,这还不清楚。改进的模型是给定的。但是美国政府似乎是人们对自己认为有害的外国影响的谨慎态度。3月,《华尔街日报》报道说美国可能会在政府设备上禁止DeepSeek。这个故事最初发表于2025年1月28日,并将定期更新。
Kyle Wiggers是TechCrunch的AI编辑。
他的写作出现在VentureBeat和数字趋势中,以及一系列小工具博客,包括Android警察,Android Authority,Droid-Life和XDA-Developers。他与他的伴侣,音乐治疗师一起住在曼哈顿。