英语轻松读发新版了,欢迎下载、更新

研究人员为Openai的O1“推理”模型创建了一个公开的竞争对手,价格低于$ 50 |TechCrunch

2025-02-05 23:38:07 英文原文

作者:Maxwell Zeff

根据新的一项新,斯坦福大学的AI研究人员和华盛顿大学能够以低于50美元的云计算学分培训AI推理模型。研究论文上周五发布。

该模型称为S1,其性能类似于尖端推理模型,例如OpenAi S O1和DeepSeek S R1,在测量数学和编码能力的测试上。S1模型是在Github上可用,以及用于训练它的数据和代码。

S1背后的团队说,他们从现成的基础模型开始,然后通过蒸馏进行微调,这是通过培训其答案来从另一个AI模型中提取推理功能的过程。

研究人员说,S1是从Google的推理模型之一,Gemini 2.0 Flash思考实验中蒸馏出来的。蒸馏是伯克利研究人员相同的方法上个月创建一个大约450美元的AI推理模型

对某些人来说,几个没有数百万美元后面的研究人员仍然可以在AI领域进行创新的想法令人兴奋。但是S1对AI模型的商品化提出了真正的问题。

如果某人可以密切复制具有相对口袋的数百万美元模型,则在哪里?

毫不奇怪,大型AI实验室很高兴。Openai指责DeepSeek出于目的型号蒸馏

S1背后的研究人员希望找到实现强大推理性能和测试时间扩展的最简单方法,或者允许AI模型在回答问题之前进行更多思考。这些是Openai S O1中的一些突破,DeepSeek和其他AI实验室试图通过各种技术复制。

S1论文表明,可以使用称为“监督微调(SFT)的过程相对较小的数据集对推理模型进行蒸馏,其中明确指示AI模型在数据集中模仿某些行为。

SFT往往比DeepSeek用来训练其竞争对手的Openai S O1模型R1的大规模增强学习方法便宜。

Google可以通过其Google AI Studio平台免费访问Gemini 2.0 Flash Thinking实验,尽管每日速率限制。

但是,Google的术语禁止其模型进行反向工程,以开发与公司自己的AI产品竞争的服务。我们与Google接触以进行评论。

S1基于阿里巴巴拥有的中国AI实验室QWEN的小型,现成的AI模型,该模型可免费下载。为了培训S1,研究人员创建了一个只有1,000个精心策划的问题的数据集,并与这些问题的答案以及Google的Gemini 2.0 Flash Thinky Thinking Triveimentiment的每个答案背后的思考过程相结合。

据研究人员称,在使用16个NVIDIA H100 GPU的训练S1训练S1不到30分钟之后,S1在某些AI基准测试中取得了强大的性能。斯坦福大学研究员尼克拉斯·穆尼基诺夫(Niklas Muennighoff)告诉TechCrunch,他今天可以租用必要的计算,售价约为20美元。

研究人员使用了一个漂亮的技巧来使S1仔细检查其作品并延长其思维时间:他们告诉它等待。根据论文,添加S1推理期间的等待一词有助于该模型得出更准确的答案。

2025年,Meta,Google和Microsoft计划在AI基础设施上投资数千亿美元,这将部分用于培训下一代AI模型。

推动AI创新的信封仍然可能需要这种投资水平。蒸馏已证明是廉价地重新创建AI Model的功能的好方法,但它并没有比今天可用的更好地创建新的AI模型。

Maxwell Zeff是TechCrunch的高级记者,专门研究AI和新兴技术。Zeff此前曾与Gizmodo,Bloomberg和MSNBC一起,涵盖了AI和Silicon Valley Bank危机的崛起。他总部位于旧金山。当不报告时,他可以找到他远足,骑自行车和探索海湾地区的美食现场。

关于《研究人员为Openai的O1“推理”模型创建了一个公开的竞争对手,价格低于$ 50 |TechCrunch》的评论


暂无评论

发表评论

摘要

斯坦福大学和华盛顿大学的研究人员培训了一种名为S1的AI推理模型,使用云计算学分低于50美元。该模型与OpenAI的O1和DeepSeek在数学和编码测试中的R1等领先模型相似。S1是通过称为蒸馏的过程开发的,该过程涉及使用最小数据的微调基础模型,特别是1000个策划的问题,以及Google的Gemini模型的答案。该项目强调了对AI模型的商品化的担忧,以及低成本训练的ai的大型实验室构成的挑战::斯坦福大学和华盛顿大学的研究人员使用云计算学分以低于50美元的价格开发了AI推理模型S1。S1匹配了OpenAI的O1和DeepSeek在数学和编码测试中的R1等顶级模型的性能。该团队使用蒸馏来微调基本型号,其中有1,000个策划的问题和Google双子座模型的答案。这一发展引起了人们对AI商品化和主要AI实验室挑战的担忧。