《自然》杂志发表的一篇研究论文称,围绕“开放”人工智能的言论将权力集中在人工智能领域,而不是使其更加开放地接受竞争和审查。
该研究阐述了经常宣扬的“开放”人工智能概念如何误导公众和政策制定者,导致错误的安全感。
“围绕开放性提出的主张往往缺乏精确性,经常只关注人工智能系统从开发到部署生命周期的一个阶段,往往忽视大规模人工智能开发和部署的行业集中度,从而扭曲了对开放性的常识性理解,”报纸康奈尔大学博士后研究员 David Widder 表示。
该研究将免费开源软件的概念与开放人工智能的概念进行了比较,回顾了 IBM 与 Linux、Google 与 Android、Amazon 与 MongoDB 以及 Meta 与 PyTorch 的历史。
“开源使软件开发民主化,许多人关注开放代码可以确保其完整性和安全性,或者开源提供公平的竞争环境并允许创新者取得胜利,开源软件做了很多这样的事情,从学位,”该报称。
离开注册让读者准确地争论这些结果有多么不同,关键是开放人工智能的工作方式与开源软件不同。
“目前,强大的参与者正在寻求制定政策,声称‘开放’人工智能一方面有利于创新和民主,另一方面则不利于安全。在制定政策时,定义很重要,”它补充道。
该研究分析了人工智能是什么以及人工智能世界中的“开放性”意味着什么。它着眼于模型、数据、劳动力、框架和计算能力。
“正如许多传统的开源软件项目被大型科技公司以各种方式吸收一样,我们展示了围绕‘开放’人工智能的言论是如何频繁地以加剧而不是减少人工智能领域权力集中的方式运用的,”纸说。
研究发现开放人工智能系统可以“提供透明度、可重用性和可扩展性:它们可以在不同程度上被审查、重用和构建在‘之上’。”
该论文指出 Meta 的 LLaMA-3 缺乏常识上的开放性,因为它提供“只不过是一个 API 或下载受明显非开放使用限制的模型的能力......在这些情况下,这是‘开放式洗涤’系统,更好地理解为封闭式。”
登记册为 Meta 提供了发表评论的机会。
另一方面,EleutherAI 的 Pythia 是最开放的,“提供对源代码、底层训练数据和完整文档的访问,并根据与开源计划长期定义一致的条款授权 AI 模型进行广泛重用”开源的。”
然而,即使是对人工智能最开放的解释也不太可能对抗人工智能领域科技巨头的既得利益,因为构建实质性模型所需的数据、开发时间和计算能力为进入市场设置了障碍。
例如,就数据而言,构建当代人工智能系统所需的劳动力“对民主和开放地获取创建和部署大型人工智能模型所需的资源构成了另一个障碍”。
该研究认为,“开放人工智能”本身不足以打造一个更加“多样化、负责任或民主化”的行业。
论文指出:“我们还看到,与过去一样,争夺人工智能优势的大型科技公司正在利用开放人工智能来巩固市场优势,同时使用开放的言辞来转移对人工智能垄断和随之而来的监管的指责。”。
因此,有必要采取其他措施,包括反垄断执法和数据隐私保护,以创造一个更加公平的竞争环境。
“将我们的希望孤立地寄托在‘开放’人工智能上不会让我们走向那个世界,而且在许多方面可能会让事情变得更糟,因为政策制定者和公众将他们的希望和动力放在开放人工智能背后,假设它将带来在公司权力集中的情况下无法提供的好处,”研究人员总结道。®