世界知识产权组织发布关于生成式人工智能(GenAI)专利态势报告 - 专利 - 知识产权

2024-10-07 06:31:28 英文原文

作者:Authors

要打印这篇文章,您只需在Mondaq.com注册或登录。

专利-next 结论:WIPO发布了关于GenAI的专利景观报告。该专利景观报告讨论了GenAI的趋势,包括以下方面的趋势:GenAI科学出版物、GenAI专利、GenAI模型、用于GenAI的数据类型以及GenAI应用领域。

****

生成人工智能科研论文和专利族

过去十年专利族的数量大幅增加。具体来说,从2014年的733项增长到2023年超过14,000项。

1526956a.jpg

生成式人工智能的崛起主要由三个因素驱动:(i)更强大的计算机,(ii)大型数据集的可用性作为训练数据来源,以及(iii)改进了的人工智能/机器学习算法.

关于(iii),一个主要的进展是2017年开发了变压器。变压器是一种专门用于自然语言处理(NLP)任务的深度神经网络(DNN)架构。变压器允许研究人员在无需事先标记所有数据的情况下训练越来越复杂的AI模型。变压器基于自注意力机制;也就是说,变压器可以同时关注文本的不同部分。这使它们能够捕捉到文本中的长距离依赖关系,从而提高对复杂语言的理解和措辞能力。因此,基于LLM的聊天机器人能够生成连贯且语境相关的文本。

2017年引入Transformer之后,数量的生成式AI专利增长超过了800%。科学论文的数量增幅更大:从2014年的仅116篇增加到2023年超过34,000篇。然而,预计专利族出版物在2024年和2025年也会出现类似的加速增长,因为新专利的申请与公布之间通常有18个月的滞后期。

此外,2022年发布的流行生成式人工智能模型和工具,如ChatGPT, 稳定扩散, LlaMA,等等, 启动了一波新的生成式人工智能(GenAI)研究浪潮。最近的许多研究似乎都集中在减少大型生成模型的规模、更好地控制生成过程以及探索各种应用和领域上。这些趋势在2023年继续发展,而2023年本身也是破纪录的一年,这一年发布的所有GenAI专利中超过25%和所有GenAI科学论文中超过45%都是在此期间发表的。

相对于整个人工智能领域,生成式人工智能(GenAI)规模较小但正在增长。在2023年,总体上几乎有23万份人工智能专利族出版物,其中14,080份与生成式人工智能相关。专利族出版物然而,自2017年以来,GenAI在所有人工智能专利中的份额一直在增加(从2017年的4.2%增至2023年的6.1%,如下的图所示)。

生成人工智能在全部人工智能专利家族出版物中的占比, 2014–2023

1526956b.jpg

顶尖生成人工智能专利拥有者

公司是最大的生成式人工智能专利持有者,但一些研究机构仍然跻身前十二名。

2014年至2023年期间GenAI领域的主要专利持有者(包括公司和研究机构等所有实体),其中研究机构以粗体显示

1526956c.jpg

2014年至2023年在生成人工智能领域专利申请最多的研发机构

1526956d.jpg

顶尖生成人工智能科研出版机构

关于科学出版物,下图显示了2010年至2023年发表生成式人工智能(GenAI)科学出版物数量排名前二十的机构。唯一上榜的公司是 Alphabet/Google。

1526956e.jpg

然而,以发表论文的数量作为绩效指标存在局限性,因为它不能反映这些出版物的影响。因此,一篇文献收到的引用次数通常被认为是一个更可靠的指标。机构的引文数量显示公司在排名中占据更高的位置(见下图)。以此为标准,Alphabet/Google成为遥遥领先的第一机构,并且还有七家其他公司跻身前20名。OpenAI也值得一提。根据GenAI语料库的数据,OpenAI仅发表了48篇文章(按论文数量计排名第325位),但这些出版物从该语料库的其他出版物中总共收到了11,816次引用(总排名为第13位)。这一点尤为值得注意的是,许多OpenAI的出版物是预印本,并未在主要会议和期刊上发表。

2010年至2023年期间,排名前20的机构在GenAI科学出版物中的被引次数

1526956f.jpg

OpenAI,由于ChatGPT的成功,在公众眼中已成为GenAI的同义词,但也因其他原因而引人注目。在2023年初之前,OpenAI似乎没有为其研究活动申请任何专利。其中一个原因是OpenAI的非营利性质。最初,OpenAI作为一个非营利组织成立,鼓励其研究人员发布和分享他们的工作,以“最有可能惠及全人类的方式”促进数字智能的发展(Brockmann, G. 和 I. Sutskever (2015))。介绍OpenAI可供参考的网址: https://openai.com/blog/introducing-openai(访问日期:2024年5月18日)。 OpenAI最初将其技术的重要部分开源。该公司后来从非营利组织转变为“收益上限”的盈利模式(将OpenAI拆分为非营利性的OpenAI, Inc和以微软为主要投资者之一的盈利子公司OpenAI Global, LLC)。另一种解释可能是,OpenAI选择保留其知识产权作为商业秘密形式。

OpenAI似乎首先用商业秘密保护了其技术的部分内容(Keseris, D. 和 R. Kovarik (2023).)ChatGPT:AI领域的知识产权策略律商网数据 hub。网址为: https://www.lexology.com/library/detail.aspx?g=bed7b5f6-5e7a-49c5-a8fc-accb59f95819 (访问日期:2024年5月18日)。然而,OpenAI的六项美国专利在2024年的第一季度公布(三项已授权和三项正在申请),这些专利是在2023年初提交的,表明其知识产权策略发生了变化,并且正在建立专利组合。

国家层面

从国家角度来看,自2017年以来,中国每年发布的基因人工智能领域的专利族数量超过38,000个,超过了其他国家总和(基于已发布专利的发明人地址信息)。美国排名第二,在2014年至2023年间总共发布了大约6,300个专利族。

1526956g.jpg

2014年至2023年关键发明人所在地的生成人工智能专利族的发展

1526956h.jpg

2014年至2023年各国与生成式人工智能相关的专利族数量比较

1526956i.jpg

2014-2023年与GenAI相关的专利家族份额和增长率的国家对比

1526956j.jpg

关于生成式AI专利申请的司法管辖区,中国不仅是最大的发明人所在地,也是专利申请数量最多的国家。从2014年到2023年,在中国提交了超过40,000个生成式AI专利申请系列。在美国,过去十年中提交的专利家族数量增加到了超过10,700个。值得注意的是,《专利合作条约》(PCT)和《欧洲专利公约》(EP)也是重要的途径。在过去十年里,有超过7,700份PCT申请,以及超过3,100份EP申请。

2014年至2023年生成式人工智能领域关键专利申请地区

1526956k.jpg

生成式AI模型

最受欢迎的三种生成式AI模型是:

  1. 生成对抗网络(GANs)
  2. 变分自编码器(VAE)
  3. 基于解码器的大规模语言模型(LLM)

这是基于专利摘要、权利要求和标题。然而,并非所有生成式人工智能(GenAI)专利都可以根据这些信息分配到这三种模型中。更具体地说,许多GenAI专利并没有在专利摘要、权利要求或标题中包含关于所使用的特定模型的关键词,而是侧重于描述该主题的应用场景。这使得很难将这些专利与研究的五个核心GenAI模型进行匹配。此外,一些被研究的GenAI模型之间存在内容重叠。因此,自2014年以来所有GenAI专利族出版物中只有大约25%可以映射到这五个模型之一。

在排名前三的生成式AI模型中,大多数专利与GAN相关。从2014年到2023年,共有9700个GAN模型类型的专利族,其中仅2023年就发布了2400个专利族。VAE排名第二,在2014年至2023年间有大约1800个专利族。而LLM排名第三,在2014年至2023年间共有大约1300个新的专利族。

在增长方面,GAN专利在过去十年中增幅最大,但增速已经放缓。相比之下,扩散模型和大语言模型(LLMs)在过去三年中的增长率要高得多。扩散模型的专利家族数量从2020年的18个增加到2023年的441个,而大语言模型的专利家族数量则从2020年的53个增加到了2023年的881个。现代聊天机器人(如ChatGPT)引发的生成式AI热潮显然增加了对大语言模型的研究兴趣。

全球五大生成式人工智能核心模型专利族的发展,2014–2023年

1526956l.jpg

不同GenAI模型专利族的年均增长数

1526956m.jpg

大多数公司专注于为一种主导的生成式人工智能(GenAI)模型申请专利;然而,腾讯和Alphabet/Google等一些例外情况,在多种类型的模型中提交了专利。下表显示了2014年至2023年间公布的生成式人工智能专利家族数量。大量的生成式人工智能专利无法归类到任何特定的模型,因为这些专利在其摘要、权利要求或标题中不包含与所使用的具体模型相关的关键词。因此,生成式人工智能专利家族总数大于下图所示五个模型的总和。

1526956n.jpg

类似地,研究机构主要为一种类型的模型申请专利,其中生成对抗网络(GAN)是最受欢迎的类型。下表显示了2014年至2023年间发布的生成式AI专利族。大量的生成式AI专利无法归类到任何特定的模型中,因为这些专利在专利摘要、权利要求或标题中不包含与所使用的特定模型相关的关键词。因此,总的生成式AI专利族数量大于下图所示五种模型的数量之和。

1526956o.jpg

在国家层面上,中国在所有的五种生成式AI模型中申请的专利数量都是最多的。特别是在扩散模型方面,自2014年以来,中国的专利族数量是排名第二的发明地点美国的14倍以上——中国有500个专利族,而美国只有35个专利族。

1526956p.jpg

生成式AI数据类型

主要的数据类型(例如:用于GenAI的模式、输入/输出等包括:

  1. 图片
  2. 视频
  3. 演讲
  4. 声音
  5. 音乐

大多数专利属于图像/视频类别。图像/视频数据对于生成对抗网络(GAN)尤为重要。对于大型语言模型(LLM),涉及文本处理和语音/声音/音乐的专利更为常见。还有其他模式,如3D图像模型、化学分子/基因/蛋白质以及代码/软件等,但这些领域的专利数量相对较少。与通用人工智能核心模型相关的专利中,有些专利无法明确分配到特定的数据类型上。此外,由于某些生成式AI模型(例如多模态大型语言模型)可以克服仅使用一种数据输入或输出的限制,因此一些专利会被分配给多个模式。

1526956q.jpg

生成式人工智能应用领域

生成式人工智能专利的主要应用领域包括:

  1. 软件
  2. 生命科学
  3. 文档管理和发布
  4. 商务解决方案
  5. 工业和制造业
  6. 交通运输
  7. 安全
  8. 电信通信

生成式人工智能(GenAI)预计将对许多行业产生重要影响,因为它被应用于产品、服务和流程中。它很可能成为内容创作和生产力提升的技术推动力。例如,在生命科学领域(2014年至2023年间有5,346个专利家族),以及文档管理和出版领域(4,976个)出现了生成式人工智能的专利。在同一时期,业务解决方案、工业与制造业、交通运输、安全和电信等领域也有大量生成式人工智能的专利,数量从约2,000到约5,000不等。

关于生命科学,GenAI可以通过筛选和设计新药配方及个性化医疗所需的分子来加速药物开发。在文档管理和出版方面,GenAI可以自动化任务,节省时间和资金,并创建定制的营销材料。在商业解决方案中,GenAI可用于客户服务聊天机器人、零售辅助系统以及员工知识检索。在工业和制造业,GenAI能够实现新的功能,例如产品设计优化和数字孪生编程。在交通运输领域,GenAI在自动驾驶和公共交通优化方面发挥着关键作用。

下图显示了2014年至2023年全球GenAI应用专利族的发展情况。然而,许多专利族(在2014年至2023年间约为29,900个专利族)无法根据专利摘要、权利要求或标题分配到特定的应用程序中。这些专利则被纳入软件/其他应用程序类别中。

1526956r.jpg

在增长方面,能源管理GenAI专利的增长幅度最大,既从2018年以来,也在过去三年内如此。在过去三年中,农业领域的应用也有所增加。

生成人工智能领域专利族的年均增长量

1526956s.jpg

致谢:本文的内容(包括图片和文字)来源于世界知识产权组织(WIPO),尽管其中大部分内容已从其原始形式进行了修改。

本文的内容旨在提供一个主题的通用指南。对于您的特定情况,应寻求专业建议。

关于《世界知识产权组织发布关于生成式人工智能(GenAI)专利态势报告 - 专利 - 知识产权》
暂无评论

摘要

要打印本文,您需要在Mondaq.com上注册或登录。 从国家层面来看,自2017年以来,中国每年公布的与生成式人工智能(GenAI)相关的专利族数量超过38,000个,超过了所有其他国家的总和(基于已公布专利中发明人的地址信息)。下表显示了2014年至2023年间发布的GenAI专利族。与GenAI核心模型相关的专利中,有些专利无法明确归类为特定数据类型。在工业和制造业领域,GenAI能够实现诸如产品设计优化和数字孪生编程等新功能。