
来宾专栏:音乐Ally出版了来宾专栏,这些专栏表达了著名作者的意见,这些作者提出了有关重要问题的特定观点。这些是在编辑团队的自由裁量权中选择的,而不是付费。您可以探索访客专栏档案馆 这里。
这是资深技术和音乐主管Virginie Berger的来宾帖子。这是一系列短帖子中的最新信息(这里第一个和第二个)Berger在高级AI开发方面以及她认为它们如何影响音乐行业。
概述:
- 许可AI输出遗漏了这一点;真正的问题是培训,该培训未经许可使用大量受版权保护的材料。
- 薪酬应基于在培训期间摄入的内容,而不是产出相似之处;像私人副本征税。
- 平台需要责任标记AI内容并开发可食用性工具;不采取行动的风险破坏音乐行业。
问题的错误层

音乐行业正在关注问题的错误层。围绕生成AI的中心辩论是根据拥有歌曲的输出来构建的,如果旋律听起来相似,他就会受到赞誉。但是生成的ai不会像人类的灵感那样起作用。这些系统不受单个歌曲的启发。他们在大型数据集上进行了训练,摄入了数千或数百万的曲目,以学习音乐模式,结构和样式。
这意味着每个输出都是一切该模型已经进行了培训,不是一个输入的直接副本,而是所有先前摄入的统计混音。在模型建立后,在这里和那里许可一首歌完全忽略了这一点。损坏发生在训练期间,不是在发布输出时。
这是现实:从技术上讲,刮擦数百万曲目不是必需的。戴维·休斯(David Hughes)(RIAA的前首席技术官和首席策略师AI:好的我在撰写本文时与之交谈的Initiative,对Genai Music Systems进行的实验表明,他们可以使用少于100,000个高质量的曲目在样式和流派上有效地表现。这些测试是由开发的模型进行的,以创建背景和环境音乐,以便在公共场所使用,证明了代表性的音乐样本而不是详尽的刮擦样本足以实现强大的性能。
正如休斯还提醒我的那样,潘多拉(Pandora)曾经在目录中只有160万条曲目,而在平台收入的90%以上的曲目中只有不到一半。现实是一个商业音乐的很小比例占绝大多数的聆听和收入,而生成的AI模型不需要访问所有这些。实际上,一小部分,曲调良好且标签良好的商业发行的音乐的一部分足以训练能够培训能力的系统。
那么,为什么生成的AI公司刮擦整个互联网呢?不改善模型性能,而是建立法律盾牌。如果他们承认他们只需要一小部分商业有价值的音乐,那么他们就被迫就该子集进行谈判。取而代之的是,他们声称他们需要这一切才能证明批量刮擦的合理性并避免为使用的东西付费。这是战略辩护,而不是技术要求。
•一小部分的商业发行的音乐可能足以培训AI模型
维京伯杰
为什么许可输出是死胡同
生成的AI模型不会忘记。一旦受过训练,他们就会无休止地重复使用吸收图案,从而大规模产生直接与人类创建的音乐竞争的输出。训练后的许可输出为时已晚,损坏已造成。
即使权利持有人收回了5000万美元的返还许可费,他们也可能会因流媒体,同步交易或粉丝参与而损失5亿美元的未来收入。Deezer已经成为案例研究:他们透露所有音乐的18%上传到流媒体是完全由AI生成的,蚕食艺术家的流,并将音乐减少到可支配的背景内容。
为什么音乐的价值崩溃了
音乐不是被视为艺术,而是将音乐视为数据源。一旦训练了模型,艺术家将面临无限的合成竞争。而现在,随着源分离工具的快速开发,AI系统不再需要孤立的词干来学习或生成。他们可以从完全混合的曲目中提取单个元素,人声,鼓,旋律,并用它们创建新作品。
这个过程无需检测而静静地发生,未经同意。可以从热门单曲中拉出声音线或节拍,并嵌入训练中,然后重新组合到没有可追溯起源的输出中。这使得传统的概念完全过时地许可单个录音或词干。源分离使每首混合歌曲成为潜在的数据集,可用于无声重复使用,混合和解构。而且,该行业在大多数情况下的行为就像它的到来一样。
â€的传统观念,即完全过时的单个录音或词干[可能是]
维京伯杰
真正的问题是在训练阶段
我们仍然陷入错误的框架。音乐行业一直在谈论作者身份,输出,旋律相似性,就好像价值传递发生在哪里一样。但是真正的转移发生在培训期间。
这些系统经过数十亿个令牌的培训。在AI中,令牌是最小的含义单元,例如音频中的音节或符号片段。如果这些代币中有15%来自受版权保护的音乐,那么这些作品就会塑造了模型的功能。这种影响是可以衡量的,它很有价值。
补偿不应基于输出听起来与特定歌曲相似还是使用特定歌曲。它应该基于给定工作对培训过程的贡献。这不是追溯旋律,而是要承认工业规模的摄入创意劳动。
一旦系统吸收了该劳动,它就会产生无尽的输出,无论它们是否类似于原件。这就是为什么归因模型(影响功能,嵌入,水印)的原因很短:他们追逐相似性或所有权而不是认识贡献。
更好的模型:通过摄入而赔偿,不相似
我们需要将培训数据视为一种资源,而不是免费的。这意味着构建反映Genai实际运作方式的框架,而不是我们希望它的工作方式。许可必须在摄入时进行,然后才对模型进行培训。基于令牌的会计应跟踪使用多少受保护内容,并且微付款应反映培训期间提取的价值和影响,而不仅仅是输出。
我们已经有一个先例:私人副本征税。当无法跟踪个人复制时,权利持有人根据数量和行为创建了一个薪酬系统,例如人们将音乐复制到磁带或CD上。根据行为或设备销售,收取固定费用,而不是追求每一本副本,并将其重新分配给创作者。
现在,相同的逻辑必须适用于AI。如果我们知道模型是对受保护内容的培训,那么我们不需要追踪所有旋律,他们应该根据摄入的东西付费。并且应将一部分与AI相关的收入重定向到支持真正的人类创造者的文化基金,而不仅仅是最大的权利持有人。
但是,即使我们创建了摄入的许可系统,也出现了一个新的挑战:我们有什么保证对许可作品进行培训的模型是否会悄悄地嵌入其他模型中?培训后的再利用是一个真正尚未解决的问题。一旦受过培训,模型知识就可以被导出,微调或用作新系统的基础层,而无需重新阐明原始数据。因此,除非执行强大的审计和透明度标准,否则即使是有执照的摄入风险,也可能成为无限下游剥削的一次性付款。
`如果我们知道模型受到受保护内容的培训,那么我们不需要追踪每一个旋律,他们应该根据自己的摄入来付款。
维京伯杰
我们还需要平台责任和结构改革
这意味着平台必须清楚地标记AI生成的内容。观众应该知道他们是在听一个人还是由机器产生的音乐。我们还应该使用现有工具ISCC(国际标准内容代码)创建可追溯性和透明度。ISCC是一种独特的数字指纹,它根据其实际数据而不是标题或创建者来标识一件内容,例如歌曲,视频或图像。它的工作方式就像智能ID一样可以在平台上跟踪和匹配内容,即使它已略有更改或重命名。
开发人员在自愿的基础上进行了有关内容相似性的当前研究,这令人惊讶的是,权利持有人没有更积极地投资于这些标准。与诸如工具一样HarmonyCloak,,由Mosis Lab的研究人员开发田纳西大学,诺克斯维尔并旨在使音乐文件本质上是无与伦比的AI模型。音乐行业应该大力投资于这些发展。
美国法律体系也开始醒来。在涉及元的版权诉讼,美国地方法院法官文斯·查布里亚(Vince Chhabria)表示,梅塔(Meta)是注定要失败如果原告可以证明接受受版权保护的工程培训的AI工具正在产生破坏这些作品市场的产出。正如他所说:您让公司使用受版权保护的材料来创建能够生产无限数量竞争产品的产品。”他直接挑战了元对公平用途的辩护,说,我只是不明白这是如何使用的。
这意味着很明显:法院开始认识到,核心伤害是在培训期间发生的,而不仅仅是在产出中。但是行业本身必须行动更快。
保护投入或失去行业
这不是关于人类意义上的影响或灵感。这是关于未经同意,薪酬或可见性的工业重用创造性劳动的工业重用。如果事实之后我们继续许可产出,我们不会对Genai进行监管,我们会认可它。有点像在未经选择退出的情况下认可AI培训。
音乐行业必须立即转移关注,以调节摄入,标记AI内容,并投资和创建反映影响力的支付系统,而不仅仅是表面级别的相似性。
如果我们无法保护训练阶段,每个艺术家最终都将与接受自己工作的训练的系统竞争。而且,无论有多强大,都没有创造性的经济。