作者:Maxwell Zeff
在星期二,元主持人它是有史以来的第一个美洲狮AI开发人员会议在其Menlo Park总部举行,该公司将尝试使用其开放的Llama AI模型来构建应用程序。就在一年前,这不是一个艰难的销售。
但是,近几个月来,梅塔(Meta)一直在努力跟上诸如DeepSeek之类的开放式AI实验室和封闭的商业竞争对手,例如Openai在快速发展的AI竞赛中。Llamacon是Meta寻求建立一个庞大的骆驼生态系统的关键时刻。
赢得开发人员可能就像运输更好的开放型号一样简单。但这可能比听起来更难实现。
元本月早些时候推出Llama 4不知所措的开发人员,在DeepSeek S R1和V3等模型下进行了许多基准分数。与曾经的骆驼相去甚远:一个边界播种模型阵容。
去年夏天,梅塔(Meta)推出了Llama 3.1 405b型号时,首席执行官马克·扎克伯格(Mark Zuckerberg)吹捧它是一个巨大的胜利。在博客文章,Meta称为Llama 3.1 405B最公开可用的基础模型,其性能与Openai当时的最佳模型GPT-4O相媲美。
可以肯定的是,这是一个令人印象深刻的模式,而Meta S Llama 3家族中的其他模型也是如此。杰里米·尼克松(Jeremy Nixon)在过去的几年中在旧金山的Agi House接待了黑客马拉松,他称Llama 3发射了历史性时刻。
Llama 3可以说使Meta成为AI开发人员的宠儿,并提供了尖端的表演,可以自由地主持他们选择的模型。如今,Meta的Llama 3.3模型的下载频率比Llama 4更频繁,Hugging Face的产品和增长负责人Jeff Boudier在接受采访时说。
形成鲜明对比的是,与Meta的Llama 4家族接待,而差异很明显。但是,从一开始,美洲驼4就引起了争议。
Meta优化了其Llama 4型号之一Llama 4 Maverick的版本,以进行对话,这帮助它在众包基准LM竞技场上占据了最高位置。Meta从未发布过此模型,但是,Maverick的版本广泛推出最终表现更糟在LM竞技场。
LM Arena背后的小组说Meta应该很清楚关于差异。LM Arena联合创始人和加州大学伯克利分校教授Ion Stoica还与包括Anyscale和Databricks在内的共同创建公司告诉TechCrunch,该事件损害了开发人员社区对Meta的信任。
Stoica在接受采访时告诉TechCrunch,[Meta]应该更明确地表明[LM Arena]上的Maverick模型与发布的模型不同。”发生这种情况时,这有点失去了对社区的信任。当然,他们可以通过发布更好的模型来恢复它。
Llama 4家族的明显遗漏是AI推理模型。推理模型可以在回答问题之前仔细地通过问题进行工作。去年,大部分AI行业已发布推理模型,倾向于在特定基准上表现更好。
元取笑美洲驼4个推理模型,但该公司没有指出何时期望。
AI2的研究人员内森·兰伯特(Nathan Lambert)说,梅塔(Meta)没有与Llama 4发布推理模型的事实,这表明该公司可能急于发布。
兰伯特说:“每个人都在发布推理模型,这使他们的模型看起来如此出色。”为什么不能等待这样做?我对这个问题没有答案。似乎正常的公司很奇怪。
兰伯特(Lambert)指出,竞争对手的开放模型比以往任何时候都更靠近边境,现在它们的形状和大小更大,大大增加了对元的压力。例如,在星期一阿里巴巴发布了一系列模型,qwen3据称,在编程基准的CodeForces上,这表现优于Openai和Google最好的编码模型。
纽约大学数据科学中心的AI研究人员Ravid Shwartz-Ziv表示,为了重新获得开放模型的铅,梅塔只需要提供出色的模型。他告诉TechCrunch,这可能涉及承担更多风险,例如采用新技术。
现在尚不清楚元是否有能力承担大风险的能力。现任和以前的雇员以前告诉财富元研究实验室正在慢慢死亡。本月宣布她要离开。
Llamacon有机会展示击败Openai,Google,Xai等人的AI实验室发行的烹饪的机会。如果未能交付,该公司可能会在超竞争的空间中进一步落后。
Maxwell Zeff是TechCrunch的高级记者,专门研究AI和新兴技术。Zeff此前曾与Gizmodo,Bloomberg和MSNBC一起,涵盖了AI和Silicon Valley Bank危机的崛起。他总部位于旧金山。当不报告时,他可以找到他远足,骑自行车和探索海湾地区的美食现场。