研究人员为Openai的O1“推理”模型创建了一个公开的竞争对手，价格低于$ 50 |TechCrunch

作者：Maxwell Zeff

根据新的一项新，斯坦福大学的AI研究人员和华盛顿大学能够以低于50美元的云计算学分培训AI推理模型。研究论文上周五发布。

该模型称为S1，其性能类似于尖端推理模型，例如OpenAi S O1和DeepSeek S R1，在测量数学和编码能力的测试上。S1模型是在Github上可用，以及用于训练它的数据和代码。

S1背后的团队说，他们从现成的基础模型开始，然后通过蒸馏进行微调，这是通过培训其答案来从另一个AI模型中提取推理功能的过程。

研究人员说，S1是从Google的推理模型之一，Gemini 2.0 Flash思考实验中蒸馏出来的。蒸馏是伯克利研究人员相同的方法上个月创建一个大约450美元的AI推理模型。

对某些人来说，几个没有数百万美元后面的研究人员仍然可以在AI领域进行创新的想法令人兴奋。但是S1对AI模型的商品化提出了真正的问题。

如果某人可以密切复制具有相对口袋的数百万美元模型，则在哪里？

毫不奇怪，大型AI实验室很高兴。Openai指责DeepSeek出于目的型号蒸馏。

S1背后的研究人员希望找到实现强大推理性能和测试时间扩展的最简单方法，或者允许AI模型在回答问题之前进行更多思考。这些是Openai S O1中的一些突破，DeepSeek和其他AI实验室试图通过各种技术复制。

S1论文表明，可以使用称为“监督微调（SFT）的过程相对较小的数据集对推理模型进行蒸馏，其中明确指示AI模型在数据集中模仿某些行为。

SFT往往比DeepSeek用来训练其竞争对手的Openai S O1模型R1的大规模增强学习方法便宜。

Google可以通过其Google AI Studio平台免费访问Gemini 2.0 Flash Thinking实验，尽管每日速率限制。

但是，Google的术语禁止其模型进行反向工程，以开发与公司自己的AI产品竞争的服务。我们与Google接触以进行评论。

S1基于阿里巴巴拥有的中国AI实验室QWEN的小型，现成的AI模型，该模型可免费下载。为了培训S1，研究人员创建了一个只有1,000个精心策划的问题的数据集，并与这些问题的答案以及Google的Gemini 2.0 Flash Thinky Thinking Triveimentiment的每个答案背后的思考过程相结合。

据研究人员称，在使用16个NVIDIA H100 GPU的训练S1训练S1不到30分钟之后，S1在某些AI基准测试中取得了强大的性能。斯坦福大学研究员尼克拉斯·穆尼基诺夫（Niklas Muennighoff）告诉TechCrunch，他今天可以租用必要的计算，售价约为20美元。

研究人员使用了一个漂亮的技巧来使S1仔细检查其作品并延长其思维时间：他们告诉它等待。根据论文，添加S1推理期间的等待一词有助于该模型得出更准确的答案。

2025年，Meta，Google和Microsoft计划在AI基础设施上投资数千亿美元，这将部分用于培训下一代AI模型。

推动AI创新的信封仍然可能需要这种投资水平。蒸馏已证明是廉价地重新创建AI Model的功能的好方法，但它并没有比今天可用的更好地创建新的AI模型。

Maxwell Zeff是TechCrunch的高级记者，专门研究AI和新兴技术。Zeff此前曾与Gizmodo，Bloomberg和MSNBC一起，涵盖了AI和Silicon Valley Bank危机的崛起。他总部位于旧金山。当不报告时，他可以找到他远足，骑自行车和探索海湾地区的美食现场。

OC

研究人员为Openai的O1“推理”模型创建了一个公开的竞争对手，价格低于$ 50 |TechCrunch

关于《研究人员为Openai的O1“推理”模型创建了一个公开的竞争对手，价格低于$ 50 |TechCrunch》的评论

发表评论

摘要

相关新闻

相关讨论