作者:Ryan Browne
葡萄牙里斯本——科技巨头越来越多地投资于所谓“主权”人工智能模型的开发,因为他们寻求通过更多地关注当地基础设施来提高竞争力。
数据主权是指人们的数据应该存储在他们居住的国家或大陆的基础设施上。
IT 网络巨头思科驻布鲁塞尔的欧盟公共政策负责人 Chris Gow 告诉 CNBC:“主权人工智能是一个相对较新的术语,是在去年左右出现的。”
目前,许多最大的大型语言模型 (LLM),例如 OpenAI 的 ChatGPT 和 Anthropic 的 Claude,都使用位于美国的数据中心通过云存储数据和处理请求。
这引起了欧洲政治家和监管机构的担忧,他们认为对美国技术的依赖不利于欧洲大陆的竞争力,更令人担忧的是技术弹性。
的概念数据和技术主权这是此前欧洲议程上的事情。这在一定程度上是企业对新法规做出反应的结果。
例如,欧盟的《通用数据保护条例》要求公司以安全、合规的方式处理用户数据,尊重他们的隐私权。欧盟备受瞩目的案件也对欧洲公民的数据是否可以安全跨境传输提出质疑。
欧洲法院于 2020 年宣布欧盟与美国的协议无效。数据共享框架,理由是该协议没有提供与欧盟内部《通用数据保护条例》(GDPR) 所保证的相同水平的保护。去年的欧盟-美国数据隐私框架成立的目的是确保数据可以在欧盟和美国之间安全流动。
这些政治发展最终推动了云基础设施的本地化,其中为许多在线服务存储和处理数据。
OVHCloud 初创公司营销和运营全球主管 Filippo Sanesi 表示,这家法国云公司看到了对其位于欧洲的基础设施的大量需求,因为他们“了解将数据存放在欧洲的价值,这些数据受到欧洲立法的约束。”
Sanesi 告诉 CNBC:“随着数据主权这一概念变得更加成熟,人们也理解了它的含义,我们看到越来越多的公司认识到将数据存储在本地并处于特定管辖权和治理之下的重要性。”“我们拥有大量数据,”他补充道。“根据特定法规,这些数据在特定国家/地区具有主权。”
“现在,有了这些数据,你实际上可以为人工智能制造产品和服务,而这些服务应该是主权的,应该由当地人才在当地为当地人口或企业进行控制、部署和开发。”
思科的高表示,监管机构尚未推动人工智能主权的推动,至少目前还没有。相反,它来自私营公司,这些公司正在欧洲开设更多数据中心,这些设施包含大量计算设备,以支持基于云的人工智能工具,他说。
高表示,主权人工智能“更多地是由行业命名驱动的,而不是政策制定者方面的驱动”。“你还没有看到监管机构使用‘人工智能主权’术语。”
高说,各国正在推动人工智能主权的理念,因为他们认识到人工智能是“未来”和“大规模战略技术”。
各国政府正在重点发展国内科技公司和生态系统,以及支持人工智能服务的最重要的后端基础设施。
“人工智能工作负载使用的带宽是传统工作负载的 20 倍,”Gow 说。高表示,这还关系到为劳动力提供支持,因为公司需要熟练工人才能取得成功。
然而,最重要的是数据。“你看到的是,这方面有相当多的尝试考虑用语言对本地化数据进行法学硕士培训,”高说。
在意大利,第一个专门针对意大利语数据训练的法学硕士,名为 Italia 9B,于今年夏天推出。
意大利项目的目标是将结果存储在给定的管辖范围内,并依赖该地区公民的数据,以便人工智能系统产生的结果更加扎根于当地语言、文化和历史。
芯片制造巨头欧洲、中东和非洲地区企业销售主管 David Hogan 表示:“主权人工智能旨在反映一个组织的价值观,或者同样反映你所在国家的价值观和语言。”英伟达,告诉 CNBC。
霍根补充道:“核心挑战是,当今大多数前沿模型主要是根据西方数据进行训练的。”
霍根表示,例如在英伟达占据重要地位的丹麦,官员们担心人工智能系统提供的医疗保健和电信等重要服务无法“反映”丹麦当地文化和价值观。
周三,丹麦发布了一份具有里程碑意义的白皮书,概述了企业如何按照即将出台的欧盟人工智能法案(世界上第一部主要人工智能法律)使用人工智能。该文件旨在作为其他欧盟国家遵循和采用的蓝图。
霍根说:“如果你所在的欧洲国家不是国际上使用的主要语言国家之一,那么可能只有不到 2% 的数据是针对你的语言进行训练的,更不用说你的文化了。”
这并不是说法规没有被证明是促使科技巨头更多地考虑在欧洲建立本地化人工智能基础设施的重要因素。
OVHCloud 的 Sanesi 表示,欧盟 GDPR 等法规激起了人们对将数据处理外包到特定地区的兴趣。
人工智能主权的概念也得到了欧洲本土科技公司的认可。
本周早些时候,总部位于柏林的搜索引擎 Ecosia 与其总部位于巴黎的同行 Qwant 宣布成立合资企业从头开始开发欧洲搜索索引,旨在提供改进的法语和德语结果。
与此同时,法国电信运营商橙子表示正在与多家基础人工智能模型公司讨论为其客户构建基于智能手机的“主权人工智能”模型,以更准确地反映他们自己的语言和文化。
“建立我们自己的法学硕士是没有意义的。因此,现在有很多讨论,我们如何与现有的提供商合作,使其更本地化、更安全?”Orange 首席技术官 Bruno Zerbib 告诉 CNBC。
“在很多用例中,[人工智能数据]可以在本地[在手机上]处理,而不是在云端处理,”Zerbib 补充道。Orange 尚未为这些主权人工智能模型目标选择合作伙伴。