作者:Hasan Chowdhury
唐纳德·特朗普宣布美国必须领导世界的新总统。他刚刚从中国的一支AI裂缝团队那里得到了警告,该警告准备表明我们的技术至高无上不是给定的。
见面DeepSeek,一家中国初创公司从一个十年历史的对冲基金中脱颖而出,该基金通过AI和算法计算精明的交易。它的最新发行版是在特朗普就职典礼那天,它使美国大部分行业研究人员惊呆了。
DeepSeek在周一发布的一篇论文中揭示了一种名为R1的新旗舰AI模型,该模型展示了新的“推理”水平。为什么它给美国的AI专家留下了如此巨大的印象。
硅谷一些资源最丰富的AI实验室越来越多地转向“推理“作为研究的领域,可以将他们的技术从类似学生的智力水平发展到完全黯然失色的人类智能的东西。
为此,OpenAI,Google,Anthropic和其他人都致力于确保模型在回复用户查询之前花更多的时间思考。这是一个昂贵,密集的过程,需要从下面的计算能力嗡嗡作响。
提醒您,Openai完全发布O1``旨在花更多时间在回应之前花费更多时间思考的模型”在9月首次发布后,在12月的一个发光招待会上。DeepSeek的R1显示了它可以缩小差距的速度。
R1到底做什么?首先,DeepSeek说R1实现了“跨数学,代码和推理任务的OpenAI O1相当的性能”。
它是研究论文说这要归功于NVIDIA的高级研究经理吉姆·范(Jim Fan模仿人类大师首先移动。”他在X上写道,这是“论文中最重要的收获”。
吉姆·范(@drjimfan)2025年1月20日我们居住在一个时间表中,一家非美国公司正在将OpenAi的原始任务保持活力 - 真正开放的边境研究赋予了所有人的能力。这没有道理。最有趣的结果是最有可能的。
DeepSeek-r1不仅开源了许多模型,还可以pic.twitter.com/m7eznemcoy
DeepSeek于2023年推出,在其论文中说,这样做是因为其目标是探索AI“在没有任何监督数据的情况下发展推理能力”的潜力。这是AI研究人员使用的一种常见技术。该公司还表示,较早的R1称为R1-Zero的版本给了他们一个“ AHA时刻”,在该时刻,AI“学会通过重新评估其初始方法来分配更多的思维时间来解决问题。”
最终结果提供了沃顿教授伊桑·莫利克(Ethan Mollick)被描述为R1的回答,这些响应“像人类的思想大声”。
值得注意的是,在释放类似能力的模型时,在诸如Openai之类的公司发表的笔记中,很难对AI发展的这种透明度。
艾伦AI研究所的研究科学家内森·兰伯特(Nathan Lambert)说替代R1的论文“是推理模型研究中不确定性的主要过渡点”,“直到现在,推理模型一直是工业研究的主要领域,而没有明确的开创性论文”。
忠于开放的精神,DeepSeek的R1模型非常开放,已经获得了MIT许可证 - 软件许可的行业标准。
R1的这些要素共同为美国玩家带来了复杂性,与中国与特朗普的主要地缘政治竞争对手陷入了AI武器竞赛。
首先,它表明中国可以与行业中的一些顶级AI模型相匹配,并与硅谷的前沿发展保持同步。
其次,开源高级AI还可以挑战那些通过出售技术来赚取巨额利润的公司。
例如,Openai引入了Chatgpt Pro计划12月,每月花费200美元。它的卖点是,当时它包括对最聪明的车型的“无限访问”,O1。如果开源模型免费提供类似的功能,那么从理论上讲,购买昂贵的付费订阅的动机可能会减少。
NVIDIA的粉丝在X上描述了这样的情况:“我们生活在一个非美国公司的时间表中,将Openai的原始任务保留为Openai的原始任务 - 真正的开放,边境研究使一切都赋予了所有权。”
DeepSeek展示了以前的推理知识。11月,该公司发布了一个“ R1-Lite-preiview”,显示其“实时透明思维过程”。在十二月发布了一个称为V3的模型作为模型未来推理的新的,更大的基础。
这是美国研究人员在最新模型R1中看到有意义的改进的重要原因。
西奥·布朗(Theo Browne),流行背后的软件开发人员YouTube频道对于科技界来说,“新的DeepSeek R1模型令人难以置信”。在硅谷翼VC上投资AI的合伙人Tanay Jaipuria也称其为“令人难以置信的”。
Tanay Jaipuria(@tanayj)2025年1月20日DeepSeek R-1令人难以置信。
- OpenAI O-1级别推理,费用为1/25
- 带有MIT许可证的完全开源
- API输出可用于蒸馏pic.twitter.com/yjhbylnuh8
AWNI HANNUN苹果公司的一名机器学习研究人员说,R1的关键优势在于它的密集程度较低,表明该行业“接近开源O1,在家里,消费者硬件上,指的是OpenAI的推理模型。去年。
该模型可以被“蒸馏”,这意味着较小但功能强大的版本可以在硬件上运行,该硬件的密集程度要远不远,远比加载到数据中心的服务器中的计算能力要少得多,许多科技公司都依靠运行其AI模型。
汉农通过在两个Apple M2 Ultra Chips上运行6710亿个参数版本的R1的X剪辑来证明了这一点,并以及时的原因做出了响应,询问在德克萨斯州Hold'em的游戏中,直线还是冲洗是否更好。汉农说,其反应“比阅读速度快”。
R1似乎有一个关键问题。前Openai董事会成员Helen Toner在X上指出有R1的演示“当被问到CCP不喜欢的主题时,请关闭自己。”
但是,碳粉确实表明,“显然是由顶部的一层而不是模型本身完成的审查制度。”DeepSeek没有立即回应置评请求。
当然,值得注意的是,Openai推出了一种名为O3的新模型,该模型本来是O1 Model DeepSeek的继任者,这是与众不同的。兰伯特在他的博客文章中说,Openai“可能在技术上可能是领先”,但他补充说,O3模型“通常不可用”的关键警告,也不会尽快提供基本信息,例如其“权重”。
鉴于DeepSeek到目前为止的记录,如果其下一个模型显示出与O3的均等,请不要感到惊讶。美国的科技领导者可能在中国举行了比赛。