作者:Will Knight
于是乎深度搜索一月份崭露头角,开源中文势头强劲人工智能模型。一些研究人员正在推动一种更加开放的人工智能构建方法,使模型制作能够在全球范围内进行分发。
原始智力一家专注于去中心化人工智能的初创公司,目前正在训练一种名为 INTELLECT-3 的前沿大型语言模型,使用一种新型的分布式强化学习进行微调。该公司首席执行官 Vincent Weisser 表示,该模型将展示一种新方法,可以使用不同地点的一系列硬件来构建有竞争力的开放人工智能模型,而无需依赖大型科技公司。
韦瑟表示,人工智能世界目前分为依赖封闭的美国模式和使用开放的中国产品的两派。Prime Intellect 正在开发的技术通过让更多的人为自己构建和修改先进的人工智能来实现人工智能的民主化。
改进人工智能模型不再只是增加训练数据和计算的问题。当今的前沿模型在预训练过程完成后使用强化学习进行改进。希望您的模型擅长数学、回答法律问题或玩数独吗?通过在可以衡量成功和失败的环境中练习来使其自我改进。
“这些强化学习环境现在是真正扩展能力的瓶颈,”Weisser 告诉我。
Prime Intellect 创建了一个框架,让任何人都可以创建针对特定任务定制的强化学习环境。该公司正在结合自己团队和社区创建的最佳环境来调整 INTELLECT-3。
我尝试运行一个由 Prime Intellect 研究员 Will Brown 创建的解决 Wordle 谜题的环境,观看一个小模型解决 Wordle 谜题(说实话,它比我更有条理)。如果我是一名试图改进模型的人工智能研究人员,我会启动一堆 GPU 并一遍又一遍地练习模型,同时强化学习算法会修改其权重,从而将模型变成 Wordle 大师。