作者:Rob Toews
去年的这个时候,我们发布了10 个预测的列表关于 2024 年人工智能世界会发生什么。
老实说,随着 2024 年即将结束,让我们重新审视这些预测,看看情况如何实际上发挥出来了。从这些关于当今人工智能状况的回顾中可以学到很多东西。
有趣的是,在线博彩市场关于我们的 10 个预测突然出现,并在 2024 年期间一直活跃。看看市场对我们的预测有何看法。
请留意我们的 2025 年人工智能预测,我们将于本月晚些时候发布!
英伟达投入巨资扩张2024 年推出 DGX 云产品,几乎三倍它在云服务上的季度支出,毫无疑问它认为这是一个主要的战略优先事项。现在它在兜售案例研究来自安进(Amgen)、德勤(Deloitte)和 ServiceNow 等众多对其以人工智能为中心的云产品感到满意的客户。
目前,Nvidia 与主要云提供商 Amazon Web Services、Google Cloud Platform、Microsoft Azure 和 Oracle Cloud Infrastructure 合作提供云服务。但请不要误会:虽然英伟达和云提供商如今彼此深深依赖,但这些巨头越来越发现自己处于竞争冲突的轨道上。
英伟达可能希望通过直接向最终客户提供芯片而不是依赖云供应商作为中介来消除中间商。与此同时,亚马逊、谷歌和微软都在开发自己的本土人工智能芯片,以减少对英伟达的依赖,并与英伟达进行更直接的竞争。
观看这种“亦敌亦友”的舞蹈在未来几年上演将会很有趣。
2024 年初,Stability AI 的情况每况愈下。首席执行官/创始人 Emad Mostaque 在 3 月份被赶出了公司。几位关键人员大约在同一时间离职,其中包括明星研究员罗宾·罗姆巴赫(Robin Rombach),这导致内部人士描述该公司“完全被掏空了”并且“陷入了死亡螺旋”。该公司在四月份经历了一轮裁员。
看来预言2一定会实现。
但该公司并未倒闭。今年夏天,它聘请了一位新首席执行官,并设法增加额外资金的生命线,并说服其云提供商原谅当前和未来数亿美元的债务。该公司甚至确信传奇电影制作人詹姆斯·卡梅隆加入其董事会。
今天存在的 Stability AI 可能只是其以前引人注目的自我的外壳,但该公司仍然是一家持续经营的公司。
至少安德烈·卡帕蒂同意我们在这里提出的观点。
在一条推文几个月前,卡帕蒂写道:
– “大型语言模型”与语言关系不大,这有点令人悲伤和困惑;这只是历史性的。它们是用于令牌流统计建模的高度通用技术。更好的名字是自回归变压器之类的。他们不关心这些标记是否恰好代表小文本块。它也可以是小图像块、音频块、动作选择、分子或其他任何东西。
我们同意。正如我们争论去年,我们仍然认为“大型语言模型”并不是当今前沿人工智能模型的最佳术语。
但现实情况是,到 2024 年,“大型语言模型”和“LLM”这两个术语的使用范围并没有减少。也许到 2025 年,这些术语将开始更好地与技术保持一致。
今年 Meta 的最先进的开放权重 Llama 3 模型的发布,加上 OpenAI 的 GPT-5 发布的持续延迟,可能让人很容易得出这样的结论:性能差距封闭模型和开放模型之间的关系就是封闭。
然后OpenAI下降了o1。
OpenAI 的全新推理模型 o1 为人工智能研究开辟了全新的前景。
在他 2019 年的开创性文章中惨痛的教训,Rich Sutton 强调了“通用方法的强大力量,即即使可用计算变得非常大,也能随着计算量的增加而继续扩展的方法”。 Sutton 假设“这两种方法似乎可以任意扩展”这样就是搜索和学习. –
在o1之前,前沿人工智能模型严重依赖第二种方法,而很大程度上忽略了第一种方法。o1 改变了这一点。而不是通过大规模扩展来改进人工智能学习期间训练, o1 引入了大规模扩展的新范式搜索期间推理。
因为它是最近才出现的,而且是新颖的,所以它的全部意义还没有得到广泛的认识。但它将深刻影响人工智能未来几年的发展轨迹。
确实,在 o1 推出几个月后,o1 的开放重量替代品已经出现,其中包括一些类似的产品阿里巴巴的 QwQ-32B-预览版– 在性能上似乎可以与 o1 相媲美。
这并不奇怪,也不会改变人工智能领域最重要的从零到一的创新继续来自封闭实验室的事实。正如我们去年所写的:
– 与许多其他领域一样,在另一个群体定义了前沿之后,作为快速追随者追赶前沿,比在其他人表明这是可能的之前建立新前沿更容易实现。例如,对于 OpenAI 来说,使用专家混合架构构建 GPT-4 的风险、挑战性和成本都更高,而这种方法之前并未被证明可以在如此规模上发挥作用,而 Mistral 则采用这种方法。几个月后,它追随 OpenAI 的脚步,推出了自己的专家混合模型。”
2024 年,来自的组织礼来公司到摩根士丹利到定性到埃森哲联邦服务宣布他们正在设立首席人工智能官(或同等职位),任命领导者来监督其组织的人工智能工作。
考虑到人工智能战略仍然是当今几乎每个企业的首要任务,预计 2025 年将有更多公司效仿。
到目前为止,Transformer 仍然是当今占主导地位的人工智能架构。但事实证明,正如去年的文章所言,2024 年“挑战者架构取得了突破并赢得了真正的采用,从纯粹的研究新颖性转变为生产中使用的可靠的替代人工智能方法。”
这种替代架构就是状态空间模型(SSM)。
曼巴是当今最著名的状态空间模型,自大约一年前发布以来,在 Hugging Face 上已被下载数十万次。曼巴舞启发了许多当今广泛使用的变体,从愿景曼巴到混合专家曼巴到曼巴字节。举个例子,资金雄厚的以色列初创公司 AI21 Labs 建立了其旗舰型号(名为 Jamba)关于 Mamba 架构。
Cartesia 是 Chris Ré 斯坦福实验室的一家年轻初创公司,专注于 SSM 的产品化和商业化,今年取得了显着增长。其基于 SSM 架构的生成音频模型已成为严重的挑战者凭借其卓越的效率、延迟和处理长输入的能力,赢得了行业领导者 ElevenLabs 和 OpenAI 的青睐。
(其他挑战者架构今年也取得了进展——例如液体神经网络——但还没有一个模型能够像状态空间模型那样在现实世界中得到采用。)
超大规模企业对人工智能初创公司的投资今年面临了大量的监管审查。
联邦贸易委员会是积极调查微软对 OpenAI 的投资。英国官员十月份宣布调查Google 对 Anthropic 投资 20 亿美元。
监管机构还对亚马逊对 Anthropic 甚至微软的投资提出了质疑适度的投资在米斯特拉尔,尽管后两者已经被清除。
这些监管调查更多地集中在反垄断问题上,而不是与“往返”相关的会计违规行为。
2024 年,不断有消息传出,表明 OpenAI 和微软之间的紧张关系和分歧日益加剧。(最近的一个纽约时报标题措辞几乎与我们的预测相同:“微软和 OpenAI 的密切合作关系出现了破裂的迹象。”)
OpenAI 和微软越来越多直接竞争向同一企业客户销售类似的人工智能产品。今年,他们各自达成了与对方竞争对手合作的协议,摆脱了曾经铁杆联盟的束缚,实现多元化发展。微软最近与以下公司建立了合作伙伴关系人择,米斯特拉尔和连贯;OpenAI 则宣布与苹果今年夏天。
2024 年公开的其他摩擦来源包括纠纷超过计算资源和预约备受争议的 DeepMind 联合创始人穆斯塔法·苏莱曼 (Mustafa Suleyman) 出任微软新任人工智能首席执行官。
我们在去年 12 月的预测文章中写道:
– 加密货币现在已经过时了,但毫无疑问,另一场大牛市将会到来。也许您没有注意到,在年初低于 17,000 美元之后,比特币的价格在过去几个月中大幅上涨,从 9 月份的 25,000 美元上涨到今天的 40,000 美元以上。比特币的大幅上涨可能正在酝酿之中,如果是这样,大量的加密货币活动和炒作将会随之而来。”
事实证明这是有先见之明的。近几个月来,比特币一直在飙升,每周都创下新的历史高点。三天前,比特币的价格首次突破 10 万美元,这是一个重要的里程碑。风险投资已经开始重新涌入加密货币领域。随着加密货币仇恨者加里·詹斯勒(Gary Gensler)离开美国证券交易委员会(SEC),以及对加密货币友好的特朗普政府即将上任,这场牛市可能才刚刚开始。
那么为什么我们将这个预测评为“错误”呢?尽管加密货币在 2024 年卷土重来,但自去年此时以来,围绕人工智能的炒作和从众心态丝毫没有减弱;它只会变得更加震耳欲聋。
如今,美国正在进行近三打诉讼,涉及基于互联网数据训练的生成式人工智能模型是否构成侵犯版权,或者是否受到合理使用原则的保护。从 OpenAI 到 Anthropic 再到 Meta,每一个主要的人工智能提供商都陷入了诉讼。
但尚未对其中任何一起案件做出有意义的裁决。
换句话说,预计这一预测将在 2024 年实现,反映出对美国法院行动速度的过度乐观评估。
但法院即将对这些案件做出实质性裁决。简易判决决定预计几个月内,就这个主题发生了两起不同的案件,一起针对 Nvidia,另一起针对合法的人工智能初创公司 ROSS Intelligence。到 2025 年第一季度或第二季度,我们将获得更多关于法院在这一关键问题上的立场的信号(尽管绝不是最终判决)。
看这里查看我们对 2024 年人工智能预测的原始文章。
看这里我们对 2023 年人工智能的预测,以及看这里我们对他们进行回顾。