作者:Edd Gent
人类是社交动物,但似乎存在一次能维持的社交关系数量的上限。新的研究显示,人工智能可能有能力在更大的群体中进行合作。
20世纪90年代,英国人类学家罗宾·邓巴提出,大多数人类只能维持大约150人的社交圈子。尽管对邓巴使用的方法可靠性的讨论很多,但这个数字已经成为商业管理中衡量人类群体最佳规模的一个流行标准。
人们对在各种环境中使用AI群体解决任务的兴趣日益增长,这促使研究人员询问是否当今的大规模语言模型当涉及到可以有效合作的个体数量时,大型语言模型也存在类似的限制。他们发现最强大的模型可以在至少1000人的团队中协同工作,这个数字比人类团队大一个量级。
“我非常惊讶,”德国康斯坦茨大学的吉奥达诺·德马尔佐说,告诉了新科学家杂志“基本上,凭借我们现有的计算资源和资金,我们能够模拟多达数千个代理,并且完全没有迹象表明形成社区的能力出现了瓶颈。”
为了测试大语言模型的社会能力,研究人员启动了许多同一模型的实例,并给每个实例分配了一个随机意见。然后,依次向每个副本展示所有其他副本的意见,并询问它是否想更新自己的意见。
研究团队发现,小组达成一致的可能性直接与底层模型的能力相关。较小或较旧的模型,如Claude 3 Haiku和GPT-3.5 Turbo无法达成共识,而参数量为700亿的Llama 3版本在实例不超过50个的情况下能够达成一致。
但对于GPT-4 Turbo来说,这是研究人员测试过的最强大的模型,最多可以有1,000个副本的群体达成共识。由于计算资源有限,研究人员没有测试更大的群体。
The 结果敦巴尔表示,建议更大的AI模型有可能在远远超出人类规模的情况下进行合作新科学家杂志他说:“他们能够迅速集结不同意见并达成共识,这一点看起来很有希望,而且他们的讨论范围似乎更广泛。”
这些结果增加了日益增长的研究积累中的内容。“多智能体系统”已经发现,一组AI协同工作可以在各种数学和语言任务上表现更好。然而,即使这些模型能够有效地在非常大的群体中运行,运行如此多实例的计算成本可能使这一想法不切实际。
此外,菲利普·费尔德曼在马里兰大学表示,达成一致并不意味着它是正确的。新科学家杂志或许不令人惊讶的是,相同的模型副本很快就会达成共识,但它们最终确定的解决方案很可能不是最优的。
然而,直观来看,AI代理很可能比人类具备更大规模合作的能力,因为它们不受速度和信息带宽等生物瓶颈的限制。目前的模型是否足够聪明以利用这一优势尚不清楚,但似乎未来的技术世代有可能做到这一点。
我是一名驻印度班加罗尔的自由职业科学和技术作家。我的主要兴趣领域是工程学、计算机和生物学,特别关注这三个领域的交叉点。