越来越多的学者对当前人工智能 (AI) 发展轨迹所带来的社会、政治和经济危害发出警告(Acemoglu et al. 2023、Frey 2019、Kasy 2022)。在焦虑的一代例如,社会心理学家乔纳森·海特(Jonathan Haidt)指出了社交媒体的使用与青少年抑郁症之间的联系,因为大型科技公司寻求最大限度地提高参与度,以收集个人数据用于有针对性的广告。本着类似的精神,Acemoglu 和 Restrepo(2020)认为这条道路会导致“错误的人工智能”,并强调开发优先考虑道德考虑和用户隐私的人工智能技术的必要性。
在一篇新论文中,我们探讨了人工智能发展的轨迹是否可以转向数据密集程度较低的方法(Frey et al. 2024)。在此过程中,我们将分析置于定向技术变革的文献中,该文献假设技术创新从稀缺或昂贵的生产要素转移(Acemoglu 1998,2002,Hanlon 2015)。著名的例子包括高工资和劳动力短缺促使对自动化技术的投资(Habakkuk 1962,Allen 2009,Hornbeck 和 Naidu 2014),以及石油价格冲击或碳税推动绿色技术的发展(Acemoglu 等人 2012,Hassler 等人)等2021)。
基于这一逻辑,我们假设《通用数据保护条例》(GDPR) 提高了存储和处理个人数据的成本(Frey 和 Presidente 2024),激励公司优先投资数据高效方法而不是数据密集型方法,从而改变了人工智能专利的构成。
人工智能专利趋势
借鉴现有文献和计算机科学家的建议,我们引入了一种新的框架,用于根据数据强度评估人工智能技术(Russell 和 Norvig 2016,Goodfellow 等人 2016)。基于深度学习方法的人工智能技术需要大型数据集来有效调整数百万个参数。相比之下,基于知识的系统依赖于结构化规则和专家知识,而不是广泛的数据。贝叶斯方法通过利用先验知识来提高效率。此外,已经出现了各种技术来减少数据需求:迁移学习(包括零样本和少样本学习)跨任务重新利用知识,而合成数据生成则创建人工训练示例。例如,DeepMind 的 AlphaFold 将自己的一些预测纳入其训练数据中(Jumper 等人,2021)。我们将这些方法归类为“数据保存”,而深度学习方法则归类为“数据密集型”。
接下来,我们对数据进行分类:我们通过在欧洲专利局的 PATSTAT 全球数据库(2024 年春季版)中对专利标题和摘要进行关键字搜索来识别相关专利,并在专利族级别进行分析,以避免重复- 计算不同司法管辖区的相同发明。使用该数据集,我们记录了有关全球人工智能专利趋势的一些典型事实。
首先,我们观察到整个 2010 年代从数据保存型人工智能到数据密集型深度学习的显着技术转变。2000 年至 2021 年间,数据密集型人工智能专利存量以每年 52% 的惊人速度增长,而数据节约型人工智能专利的年增长率则较为温和,为 19%。有趣的是,直到 2013 年,数据保存专利活动仍低于 2004 年的水平,但在 2018 年 GDPR 实施后出现显着复苏(图 1)。图1
每个申请人的平均人工智能专利族数量2018 年至 2021 年间,迁移学习专利激增 185%,而合成数据生成和贝叶斯方法则分别增长 86% 和 68%,尽管基线较低(图 2)。
图2
每年获得跨人工智能技术类别的专利人工智能专利活动和技术专业领域的巨大地理差异进一步凸显了监管环境对这一趋势的潜在影响。
自“中国制造2025”倡议启动以来,中国人工智能专利申请量激增(图3),大学和政府机构分别占全球人工智能专利的86%和54%,而美国仅为 3% 和 4%(图 4)。这种主导地位在数据密集型人工智能中尤为明显,并延伸到私营部门,并得到政府采购工作的支持,为商业用途生成有价值的培训数据(Beraja 等人,2021 年;Beraja 等人,2023 年)。图3
按国家/地区提交的 AI 专利族相比之下,美国公司在数据保存型人工智能创新方面处于领先地位,贡献了全球数据保存型专利的 45%。
尽管欧盟在整体人工智能专利申请方面明显落后,但其本土数据保存专利的比例相对较高,占私营部门人工智能专利的 13%,而中国仅为 5%。
图4按机构和国家划分的人工智能专利族
因此,虽然数据密集型人工智能在各个地区仍然占主导地位,但平衡情况有所不同:中国强烈支持数据密集型方法,美国保持更加平衡的投资组合,而欧盟则相对重视数据保存技术。我们注意到,这反映了数据隐私监管的模式。在中国,国家采购政策明确激励了数据密集型监控应用的人工智能开发(Beraja et al. 2021),而在美国,数据隐私依赖于特定部门法规的拼凑,而不是全面的联邦保护。相比之下,欧盟通过 GDPR 采取了独特的监管方法,强调个人隐私保护而不是数据积累。
隐私监管对人工智能创新的影响
根据有关定向技术变革的文献,我们假设 GDPR 通过增加存储和处理个人数据的成本(Frey 和 Presidente 2024),激励公司在数据保存方法上进行更多投资,并减少对数据密集型的依赖,从而改变人工智能技术变革的轨迹。
在我们的实证分析中,我们利用 GDPR 的影响范围(如果欧盟以外的专利申请人针对欧盟消费者)来衡量全球企业对欧盟市场的依赖程度。为了衡量一家公司对 GDPR 的暴露程度,我们使用了 OECD 国家间投入产出 (ICIO) 表中的行业间联系,捕获了 Frey 和 Presidente (2024) 概述的他们对欧盟市场的暴露程度。通过将 ICIO 表分解为中间商业用途和最终家庭消费,我们排除了受 GDPR 影响较小的企业对企业交易,从而使我们能够专注于消费者交易。
我们首先使用专利申请人的完整样本(包括公司、个人申请人、公共机构和大学)来呈现基线结果。接下来,我们将重点缩小到企业申请人,研究 GDPR 的影响如何根据公司特征(例如规模和年龄)而有所不同。利用 GDPR 出台的时机以及各公司对该法规的不同暴露程度,我们发现:
- 受 GDPR 影响的专利申请人(包括公司、大学、公共机构和个人)已将其发明努力转向数据密集度较低且更节省数据的人工智能方法。
- 这一转变的主要推动者是总部位于欧盟的老牌大型公司。
- 在改变人工智能技术轨迹的同时,GDPR 还减少了欧盟的整体人工智能专利申请,同时扩大了老牌企业的市场主导地位。
重定向人工智能
在过去的十年中,人工智能研究的压倒性焦点一直集中在数据密集型深度学习方法上,这种方法会激励公司积累个人数据,而这往往会以牺牲对数据依赖性较低、基于规则的系统的探索为代价。(克林格等人,2020)。这些系统也是生成人工智能最新进展的背后。然而,尽管有许多富有成效的用例,一些学者认为人工智能当前的发展方向可能会降低整体福利(Acemoglu and Johnson 2023)。
考虑一下电动汽车的历史轨迹。20世纪初,它们与汽油动力汽车一样具有竞争力。然而,电力基础设施投资的缺乏以及重大石油发现,决定性地改变了市场动态,有利于内燃机(Taalbi 和 Nielsen 2021)。这种转变导致了低效的技术锁定。一个世纪后的现在,随着人们加大力度纠正这种依赖于路径的技术轨迹,我们正在见证向电动汽车的新转变。想象一下,如果我们有远见,在 1900 年代初对碳征税,技术轨迹将会怎样。人们可以对数据征税提出类似的论点。
与此同时,老牌公司的强烈反应表明,隐私法规可能会无意中强化现有优势,同时抑制整体创新——我们的研究发现,这种模式在人工智能领域很明显。事实上,越来越多的研究强调了 GDPR 对小型企业和创新的负面影响,导致市场集中度增加(Frey 和 Presidente 2024、Peukert 等人 2022、Johnson 等人 2023)。即将出台的欧盟人工智能法案可能会给小公司带来更大的合规负担,并可能将技术发展转向数据密集程度较低的方法,从而加剧这一趋势。它对可解释性的强调给深度学习技术带来了特殊的挑战,而深度学习技术在过去十年中推动了该领域的大部分进展。
调查欧盟人工智能法案如何影响人工智能创新的数量和方向,为未来的研究提供了宝贵的机会。我们的研究表明,原则上可以通过政策干预来塑造人工智能的发展轨迹。
参考
Acemoglu, D (1998), – 为什么新技术可以补充技能?定向技术变革和工资不平等,经济学季刊113(4):1055-89。
Acemoglu, D (2002),“定向技术变革”,经济研究评论69(4):781—809。
Acemoglu、D、D Autor 和 S Johnson (2023),☀人工智能如何成为有利于工人的人—,VoxEU.org,10 月 4 日。
Acemoglu、D 和 P Restrepo (2020),《人工智能的类型错误?人工智能和劳动力需求的未来 —剑桥地区、经济与社会杂志13(1):25-35。
Acemoglu、D、P Aghion、L Bursztyn 和 D Hemous (2012),“环境和定向技术变革”,美国经济评论102(1):131-66。
艾伦,R C (2009),全球视野下的英国工业革命,剑桥大学出版社。
Beraja, M、A Kao、DY Yang 和 N Yuchtman (2021),“人工智能统治”,经济学季刊138:1349—402。
Beraja, M, A Kao, DY Yang 和 N Yuchtman (2023),“通过人工智能贸易导出监控状态”,NBER 工作论文 31676。
Frey, C B (2019),《技术陷阱》,普林斯顿大学出版社。
Frey, CB 和 G Presidente (2024),“隐私监管和公司绩效:估计 GDPR 在全球范围内的影响”,经济查询62:1074—89。
Frey, CB, G Presidente 和 Pia Andres (2024),“数据偏见的创新:定向技术变革和人工智能的未来”,牛津马丁技术和经济变革工作论文系列。
古德费罗、I、Y Bengio 和 A Courville (2016),深度学习,麻省理工学院出版社。
哈巴谷,HJ (1962),19世纪美国和英国的技术,剑桥大学出版社。
Hanlon, W W (2015),“需求是发明之母:投入供应和定向技术变革”,计量经济学83(1):67-100。
Hassler, J、P Krusell 和 C Olovsson (2021),“指导技术变革以应对自然资源稀缺”,政治经济学杂志129(11):3039—72。
Hornbeck, R 和 S Naidu (2014),“当堤坝决堤时:美国南部的黑人移民和经济发展”,美国经济评论104(3):963—90。
Johnson、G、S Shriver 和 S Goldberg (2023),“隐私和市场集中度:GDPR 的预期和非预期后果”,管理科学69(10):5695–721。
Jumper、J、R Evans、A Pritzel、T Green、M Figurnov、O Ronneberger、K Tunyasuvunakool、R Bates、A Ždek、A Potapenko 等。(2021),“利用 alphafold 进行高精度蛋白质结构预测”,自然596(7873): 583–89。
Kasy, M (2022),“人工智能监管的政治经济学:走向预测手段的民主控制”,劳动经济学研究所讨论论文 16948。
Klinger, J、J Mateos-Garcia 和 K Stathoulopoulos (2020),“人工智能研究的缩小?”,工作论文,可在 SSRN 获取。
Peukert、C、S Bechtold、M Batikas 和 T Kretschmer (2022),“监管溢出效应和数据治理:来自 GDPR 的证据”,营销科学41(4):746–68。
Russell、S J 和 P Norvig (2016),人工智能:现代方法,皮尔逊。
Taalbi, J 和 H Nielsen (2021),“能源基础设施在塑造电动汽车和汽油汽车早期采用方面的作用”,自然能源6(10):970–76。