英语轻松读发新版了,欢迎下载、更新

拥抱的面部研究人员试图建立更开放的DeepSeek的AI“推理”模型|TechCrunch

2025-01-28 19:29:58 英文原文

作者:Kyle Wiggers

DeepSeek发行仅一周后r1 -推理AI模型哪个将市场送入tizzy``拥抱面孔的研究人员试图从头开始复制模型,以追求开放知识。”

拥抱脸部研究负责人Leandro von Werra和几位公司工程师 已经启动了Open-R1该项目旨在构建R1和开源的所有组件,包括用于训练它的数据。

工程师说,他们被DeepSeek的黑盒释放哲学迫使他们采取行动。从技术上讲,R1是开放的,因为该模型是允许的许可,这意味着它可以在很大程度上不受限制地部署。但是,R1不是开源通过广泛接受的定义,因为用于构建它的某些工具被神秘地笼罩着。像许多高空飞行的AI公司一样,DeepSeek不愿透露其秘密调味料。

R1模型令人印象深刻,但是没有开放的数据集,实验细节或中间模型,这使得复制和进一步的研究变得困难,” Elie Bakouch是Open-Open-Open-Open-face Face Engineers之一。R1项目告诉TechCrunch。完全开放的R1的完整架构与透明性无关 - 它释放其潜力。

不那么开放

DeepSeek是一家由定量对冲基金资助的中国人工智能实验室,上周发布了R1。在许多基准测试中,R1匹配甚至超过Openaisâs的表现 O1推理模型。

作为推理模型,R1有效地对自己进行了核对,这是 帮助它避免了一些通常会绊倒模型的陷阱。与典型的非争议模型相比,推理模型通常需要更长的秒至几分钟才能达到解决方案。优势是它们在物理,科学和数学等领域中倾向于更可靠。

R1在DeepSeek的聊天机器人应用程序后闯入主流意识,该应用程序可免费访问R1,上升到Apple App Store图表的顶部。开发R1的速度和效率 - 在Openai释放O1的几周后,DeepSeek发布了该模型已经领导了许多华尔街分析师一个 和技术人员质疑美国是否可以在AI种族中保持领先地位。

Bakouch告诉TechCrunch,Open-R1项目不太关心美国AI的主导地位,而是完全打开黑匣子的模型培训。他指出,由于R1没有通过培训代码或培训说明发布,因此深入研究该模型的行为的挑战。

Bakouch说:'对数据集的控制和流程对于在敏感领域负责任地部署模型至关重要。” Bakouch说。这也有助于理解和解决模型中的偏见。研究人员不仅需要碎片,以突破可能的界限。

复制步骤

Open-R1项目的目标是在几周内复制R1,部分依赖于拥抱Face的科学集群,这是一家专用研究服务器,具有768 NVIDIA H100 GPU。

拥抱的面部工程师计划利用科学群集,以生成类似于用于创建R1的DeepSeek的数据集。为了建立培训管道,该团队正在向AI和更广泛的科技社区寻求拥抱的Face和Github的帮助,而Open-R1项目正在托管。

我们需要确保我们实施算法和食谱[正确,von Werra告诉TechCrunch,但这是社区努力在解决方面的完美努力,在这里您可以得到尽可能多的眼睛关于问题。

已经引起了很多兴趣。Open-R1项目在Github短短三天内就获得了10,000颗星。星星是GitHub用户表明自己喜欢项目或发现其有用的一种方式。

Bakouch说,如果Open-R1项目成功,AI研究人员将能够在培训管道之上建立,并致力于开发下一代开源推理模型。他希望Open-R1项目不仅能够产生强大的R1开源复制,而且还能为更好的模型提供基础。

Bakouch说:“开源开发不是零和游戏,而是立即使包括Frontier Labs和模型提供商在内的所有人都受益,因为他们都可以使用相同的创新。”

尽管一些人工智能专家对开源AI滥用的可能性提出了担忧,但Bakouch认为,收益大于风险。

他说,当R1配方被复制时,任何可以租用一些GPU的人都可以使用自己的数据构建自己的R1变体,从而进一步扩散到各地的技术。”``我们对最近加强开放性在AI中的作用的开源发布感到非常兴奋。对于该领域而言,这是一个重要的转变,它改变了叙述,只有少数实验室才能取得进步,而开源却落后了。

凯尔·威格斯(Kyle Wiggers)是TechCrunch的高级记者,对人工智能特别感兴趣。他的写作出现在VentureBeat和数字趋势中,以及一系列小工具博客,包括Android警察,Android Authority,Droid-Life和XDA-Developers。他与他的伴侣,钢琴教育家一起住在布鲁克林,并在钢琴中牵涉。偶尔 - 如果大部分未成功。

关于《拥抱的面部研究人员试图建立更开放的DeepSeek的AI“推理”模型|TechCrunch》的评论


暂无评论

发表评论

摘要

拥抱Face的研究人员启动了Open-R1,这是为了复制DeepSeek的R1推理AI模型,并将其释放为开源,旨在实现完全透明度,并不受限制地访问所使用的培训数据和方法。该项目是由对DeepSeek的“黑匣子”方法的担忧驱动的,该方法限制了复制和进一步的研究。拥抱面对面的计划,将其科学群体与768个NVIDIA GPU和在Github上的社区合作一起使用,以在数周内实现这一目标,从而使AI开发民主化并促进开源推理模型的创新。