随着生成式人工智能的快速崛起,人工智能训练数据的新许可市场已经开始出现。
自 2023 年中期以来,人工智能公司一直在寻求与媒体版权持有者达成许可协议安全访问其内容,并将其用作高质量数据来训练任何形式的强大人工智能模型,特别是文本、图像、音乐和视频。
迄今为止,已有超过两打内容所有者达成了交易VIP 研究表明,与人工智能开发人员的合作已得到公开证实。现在,各种类型的出版商都在参与许可业务,新闻出版商、股票图片公司以及 Reddit 和 Stack Overflow 等平台之间的交易十分猖獗。
然而,生成式人工智能的许可市场正在于有争议且不确定的法律环境。在美国,出版商、作者、艺术家和创作者等权利人已分别提起诉讼,指控 OpenAI、微软、谷歌、Meta、Nvidia、Stability AI 和 Anthropic 等人工智能公司在未经许可的情况下对其内容训练模型侵犯版权。
与过去许可制度的发展方式不同,现在所有生成人工智能的许可都发生在法律的灰色地带。虽然合理使用和其他辩论双方都有定罪,但尚未有任何诉讼结果、立法或法规为内容许可的发生具体确立法律基础。
相反,这个新兴市场的进步并不是因为许可确实是必需的,但因为人工智能公司需要或想要获得许可。
媒体权利持有者仍然面临重大问题和挑战。鉴于新一代人工智能的快速发展和广泛的商业推广,许可、诉讼和政策制定实际上是同时进行的,并且在法律不确定性的阴霾中,信息有限。
在这份特别报告中,VIP 调查了用于生成人工智能培训的内容许可的新兴和快速发展的状态,以及有关每种类型媒体版权所有者(包括新闻出版商、音乐唱片公司、库存图片公司以及电影和电视工作室)许可的不同激励和风险组合的数据。
最后,报告对剩余的法律问题进行了全面分析,其结果将决定许可制度如何形成并最终解决。
所有人工智能许可交易以及与媒体权利持有者的活跃诉讼的综合指数
人工智能训练数据的新兴市场、早期交易和激励措施、许可人面临的挑战和风险
法律上的不确定性需要解决,并将影响 gen AI 许可的未来