作者:Kyle Wiggers
错过承诺发布时间的旗舰人工智能模型的名单还在不断增加。
去年夏天,亿万富翁、人工智能公司 xAI 的创始人兼首席执行官埃隆·马斯克 (Elon Musk) 表示,xAI 的下一个主要人工智能模型 Grok 3 将于 2024 年年底推出。格罗克,xAI 对 OpenAI 等模型的回答GPT-4o和 Google 的双子座,可以分析图像并回答问题,并支持马斯克社交网络 X 上的许多功能。– 在 10 万台 H100 上进行训练后,年底的 Grok 3 应该会很特别, – Musk
写了在 7 月份关于 X 的帖子中,提到了 xAI位于孟菲斯的庞大集群GPU 数量。“Grok 3 将是一次重大飞跃,”他说在十二月中旬的后续帖子中。
然而现在是 1 月 2 日,Grok 3 还没有到来,也没有迹象表明它即将推出。
事实上,人工智能专家 Tibor Blaho 在 xAI 网站上发现了一些代码建议中间模型“Grok 2.5”可能会首先登陆。
Grok[.]com 可能很快就会推出 Grok 2.5 模型(grok-2-latest — 我们最智能的模型 —) — 感谢您的提示,匿名!pic.twitter.com/emsvmZyaf7
– 蒂博尔·布拉霍 (@btibor91)2024 年 12 月 20 日
诚然,这并不是马斯克第一次设定崇高目标却未能实现。它是完善的马斯克关于产品发布时间的声明充其量也常常是不切实际的。
公平地说,马斯克在 8 月份接受播客莱克斯·弗里德曼 (Lex Fridman) 采访时表示说如果幸运的话,Grok 3“希望”会在 2024 年上市。”
但 Grok 3 的 MIA 状态很有趣,因为它是不断增长的趋势的一部分。
去年,人工智能初创公司 Anthropic 未能为其顶级产品提供继任者克劳德 3 作品模型。几个月后宣布Anthropic 预计下一代型号 Claude 3.5 Opus 将于 2024 年底发布报废该模型的所有提及均来自其开发人员文档。(根据据一份报告称,Anthropic 去年某个时候确实完成了 Claude 3.5 Opus 的训练,但认为发布它没有经济意义。)
据报道,谷歌和 OpenAI 也遭受 挫折近几个月来他们的旗舰机型。
这可能是局限性的证据当前人工智能缩放法则– 公司用来提高模型功能的方法。在不久的过去,通过使用大量计算能力和越来越大的数据集训练模型,可以实现显着的性能提升。但每一代模型的收益都开始萎缩,导致公司追求 替代技术。
Grok 3 的训练计算量是 Grok 2 的 10 倍,很快将达到 20 倍
– 埃隆·马斯克 (@elonmusk)2024 年 9 月 21 日
马斯克本人在弗里德曼的采访中也提到了这一点。
“您希望 [Grok 3] 成为最先进的吗?”弗里德曼问道。
“希望如此,”马斯克回答道。——我的意思是,这就是目标。我们可能无法实现这个目标。这就是我们的愿望。”
Grok 3 的延迟可能还有其他原因。一方面,xAI 的团队比许多竞争对手要小得多。尽管如此,推迟的发布时间进一步证明传统的人工智能训练方法已经陷入困境。
Kyle Wiggers 是 TechCrunch 的高级记者,对人工智能特别感兴趣。他的文章曾发表在 VentureBeat 和 Digital Trends 以及一系列小工具博客上,包括 Android Police、Android Authority、Droid-Life 和 XDA-Developers。他和他的伴侣(一位钢琴教育家)住在布鲁克林,他自己也涉足钢琴。偶尔——如果大多不成功的话。