人工智能打破了旨在测试“一般智力”的程序的记录,取得了与普通人相同的分数。
历史上,研究人员一直关注图灵测试测量机器智能。为了通过测试,机器必须让人类相信它也是一个人。根据一些账户,技术已经完成了这一壮举。事实上,ChatGPT 可能已经破解了测试今年早些时候。然而,科学家质疑这是否可以确定真正的智力。
作为替代方案,软件工程师兼人工智能研究员 Francois Chollet 创建了ARC-AGI基准测试,旨在测量“通用人工智能”(或 AGI)的软件。Chollet 表示,“AGI 是一个可以在训练数据之外高效获取新技能的系统。”
以此衡量,ChatGPT 将失败。该技术依靠概率和大量数据来预测任何给定输出最可能的单词序列。它在内容创作方面具有非凡的天赋。然而,乔莱认为,真正的通用智能并不在于技能(在本例中是生成内容),而是在于无需大量输入就能首先获得该技能的能力。这是ChatGPT所缺乏的能力。
因此,要通过ARC-AGI基准测试中,人工智能必须根据网格中的彩色方块完成一系列推理问题。它的任务是识别将一个网格转变为另一个网格的模式,并且只提供了三个示例供学习。之前的记录(由 Jeremy Berman 保持)为 58.5%。Chollet 表示,OpenAI 的新 o3 系统打破了这一记录,该系统的得分高达 82.8%,可以说与人类相媲美。
在一个博客文章Chollet 将其描述为“一次重大飞跃”,代表着“适应性和泛化性方面的真正突破”。他说:“这不仅仅是渐进式的进步,而是渐进式的进步。”这是一个新领域,需要认真的科学关注。”
从某种角度来看,四年前,GPT-3 的得分为 0%,并不令人印象深刻。2024 年,GPT-4o 的表现也好不到哪儿去,仅为 5%。不用说,进步速度是惊人的。不过,没有必要操之过急。正如 Chollet 本人指出的那样,o3 系统在一些简单任务上仍然表现不佳。
尽管人工智能领域取得了一些令人印象深刻的发展,但人工智能研究人员对于我们何时应该看到真正的通用人工智能几乎没有达成共识。一些人认为我们可以在本世纪末看到这种情况。在最近的一次谈话,SingularityNET 创始人 Ben Goertzel 认为,到 2023 年,个人计算机的计算能力将相当于人类大脑。 – 然后再加上 10/15 年,个人计算机的计算能力将大致相当于整个人类社会的计算能力. –