作者:Kristin Robinson
on星期五(6月20日),法国流媒体服务Deezer推出了其最新工具,以打击所谓的AI生成的歌曲的垃圾邮件。现在,该服务将标记它发现的每张专辑,以便在其中拥有一首完全AI生成的歌曲,以便用户在使用服务时具有透明度。
标记工具是Deezer系列公告中有关AI生成的音乐的最新公告,其服务如何迅速增加并在此过程中造成伤害。根据Deezer的说法,在完全AI生成的轨道上产生的溪流中最多有70%是欺诈性的或人造的。
Deezer在一月份开始发出警报,当时它报告说其专有的AI检测工具确定10%的歌曲每天上传到Deezer每天都完全生成。虽然该公司表示,使用AI作为其创作过程的一部分,人类艺术家没有任何问题,但纯粹的AI生成的歌曲往往被用来垃圾邮件或从人类艺术家那里脱离平台或Siphon特许权使用费。为了打击这一问题,Deezer开始从他们的建议中删除AI歌曲。
然后,在四月,赛策声声称这一数字几乎翻了一番,报告说每日上传的18%完全由AI生成。在接受新的采访广告牌,研究主任Manuel Moussallam跳到两个关键原因的属性:进一步采用Suno和Udio等AI音乐工具;而且,简单地说,我们的数据变得更好。
我们不确定,我们在1月生成的AI生成的部分内容,因此我们对报道的数量非常保守。Moussallam解释说,我们不想要任何误报。我认为18%的[图]实际上更加准确,更接近我们从一月份开始的实际看到的东西,但是这个数字仍在增加。”
尽管大多数竞争对手尚未对AI生成的音乐采取公开立场,也没有创建任何专门解决它可能提出的问题的规则,但Deezer认为没有办法忽略正在发生的事情。在接受新的采访广告牌,首席创新官Aurelien Herault,与Moussallam一起解释说,时钟在滴答:在某个时候,该行业需要对此做出决定,因为AI音乐现在将永远存在。没有回去。
您俩都在说您的团队与音乐业务进行了很多对话,以了解您在启动迪尔之前在Deezer制定的规则。您是否与Suno或Udio等AI公司进行过相同的对话?
HERAULT:不是正式的。我们与一些在那里工作的研究人员保持联系,因为我们参加了同样的会议,但是我们没有联系。实际上,我认为他们不太在乎我们能够检测到他们的输出,因为问题在我们这边,因为人们大量使用这些工具来垃圾邮件。
您是否开始看到人们如何使用垃圾邮件的AI内容的模式?例如,大多数人是否在创建多个帐户并跳舞以分散大规模上传?他们是人为地运行溪流吗?
HERAULT:我可以说的是他们很有创造力。
Moussallam:好吧,在音乐方面不是创意,而是在垃圾邮件方面?非常有创造力
Herault:首先我们担心AI生成的音乐的原因是,这确实接近了我们已经看到的欺诈行为。您创建很多帐户。您每天发行大量专辑。
Moussallam:我认为也许我们从AI音乐中看到的唯一新现象也可以用于模仿。您会带一位流传量的艺术家,然后尝试创建类似于该艺术家风格的东西。这非常令人担忧。
HERAULT:他们甚至试图在官方艺术家页面上传递这些歌曲。这就是为什么将我们的AI努力与我们的欺诈检测系统相结合以避免这种行为的重要性。
带我回到您第一次发现AI生成的内容被上传到Deezer的时候,以及为什么您决定花那么多时间和很多资源来研究这个问题。
穆萨拉姆(Moussallam):我认为它可以追溯到2022年,当时第一个大型开源生成模型在科学界发布。在您有商业模型之前,我们有机会自己玩。随着时间的流逝,我们开始看到这些模型的动力。很快,他们就可以制作完整的歌曲,这是几年前不可能的。
显然,当Suno推出时,这是一个重要的时刻。我们要做的第一件事是在平台上下载人们在那儿分享的几首歌,然后使用指纹,我们能够检查人们是否也在将这些AI歌曲分发到我们的目录中。我们很快发现,是的,他们是。那时,我们不知道这笔钱,但是我们知道这正在发生。对我们来说,量化这一现象确实很重要,这是我们实际研究它的原因。
我们花了几个月的时间,我们终于找到了一个系统来识别规模。最终,我们有足够的信心在一月份分享这个数字。我们必须经常仔细检查很多,以确保我们没有太多的误报。我们知道这将是一个巨大的问题。一旦我们充满信心,我们才向公众沟通。
HERAULT:今天,我们正在谈论AI检测,但是我们看到了与Deezer上其他类型的内容相同的垃圾邮件和人工流式行为,例如公共领域的歌曲,噪音和雨水。因此,我们一直在开发工具来了解AI出现之前的平台上的内容。现在已经有12年的研究与开发了,所以这就是为什么我们可以在新发展时很快做出反应。
我经常听到有关目前市场上产品的评论混合的评论,声称他们可以检测到AI生成的音乐,甚至更具争议性,可以将AI生成的音乐归因于从培训数据中启发它的歌曲中。我想您有些人怀疑您的工具有多好。您如何确保他们的准确性?
HERAULT:我们向音乐界做了很多演讲,展示了我们的结果。我们还在科学界发表了一篇论文,因此每个人都可以访问它。
穆萨拉姆(Moussallam):在我们发表的第一篇论文中,我们指出,我们的工具无法完全解决这个问题。如果有的话,我们对自己的技术最有疑问,因为我们做了工作 - 我们确切知道它的限制有多有限。这仍然是一个空旷的问题,绕过我们的探测器仍然很容易。
HERAULT:这就是为什么我们共享数据。我们想开始讨论。我们向行业解释说我们无法解决一切,但是我们可以用这些工具解决部分问题。
AI音乐归因现在有多可行?
Moussallam:不可能知道我们是否能够做到这一点。这是一个非常快速而令人兴奋的领域,因此我们想深入研究。但这可能需要数年。我唯一确定的是,现在架子上没有什么能以令人满意的方式做到这一点。
我在音乐技术世界中听到的一场辩论是,就服务器和存储空间而言,这种AI生成的音乐泛滥是否将成为流媒体服务的严重负担。竞争对手的音乐彩带中的某人告诉我,他们认为这是一个真正的问题。其他人则认为是。你怎么了?
HERAULT:这对我们来说是一个严肃的话题,我们已经删除了一些使用太多空间的内容,因为这不仅是一个经济问题,而且是一个生态问题。我们是否需要存储所有这些内容,以便我们所有人都有相同的目录,并且都有相同内容的副本?这确实是一个值得一看的问题,我们已经进行了一些讨论来删除一些内容,尤其是因为根本没有听过很多内容。
那听起来像是流媒体服务将必须面对的问题。
HERAULT:我的意思是,音乐流媒体不仅是各种AI生成的内容,音频,视频。一切
Moussallam:在将其与电影或某些图像进行比较时,音频实际上并不是一个很大的文件。
我总是想知道年轻一代是否会在乎他们的音乐是来自AI模型还是一个人。我们很难围绕它缠住它,但是如果这些孩子在AI内容上长大,他们的听力习惯也与我们的习惯不同。在决定如何在Deezer上处理AI音乐时,您是否考虑到了这一点?
Moussallam:这是一个了不起的研究问题,但这还没有答案。我认为很多人都在想我们是否看到人们与音乐的关系有所转移。它还提出了一个问题,为什么人们首先喜欢音乐?您是否需要直接或间接建立人类的关系才能使音乐具有含义?我相信很多人都需要。但是我不确定人们将来会做什么。