作者:Brian Hiatt
Suno 可以根据文本提示或电话录音生成歌曲,其刚刚推出的新型号 V4 是迄今为止功能最强大的
即使像它面临诉讼来自唱片业的使用无数受版权保护的歌曲来训练其音乐生成人工智能模型,苏诺已成为世界上第五大最常用的生成人工智能服务,并且该公司仍在推动其技术向前发展。一种新的、更加现实的模型 V4 现已向付费订阅者开放,并且最终将覆盖所有用户。“我认为它已经成为我积极想听的东西,”Suno 联合创始人 Mikey 说道舒尔曼。“而不是我想要不断改进的东西。”
舒尔曼坐在公司同样全新的定制办公室中,该工作室占地两层楼,配备了真正的吉他、贝斯和高端音响系统。就在马萨诸塞州剑桥市哈佛大学校园附近的三号楼。“我们必须改进模型,以证明购买精美扬声器的合理性,”舒尔曼开玩笑说。截至2月份,该公司共有员工12人左右;现在他们已超过 50 个,而且还会有更多。“在真正有才华的研究人员方面,很难与 OpenAI 竞争,”Shulman 说,他指的是 ChatGPT 背后的人工智能巨头。“但我们竞争的方式是,如果您想学习使 [AI] 模型与人类品味保持一致,没有比这更好的地方了。”
与具有客观基准的大型语言模型不同,您可以比较 Claude 和 ChatGPT 在 LSAT 上的分数,例如,Suno 的工程师只能使用人类的偏好。记录过去用户对同一提示的不同结果之间的偏好对于改进新模型发挥了重要作用。“仅仅几个月后,我们就能更好地了解人类的偏好,”舒尔曼说。
AI 生成的音乐,无论是来自 Suno 还是其最直接的竞争对手,乌迪奥,往往有一定的声音——与低比特率 MP3 不同——这在人声中最为明显。当我们在工作室里花费几个小时创作出一首又一首歌曲时,V4 的作品比任何以前的 Suno 型号都更加清晰,具有更真实的歌手和乐器,以及更广泛的立体声场。舒尔曼说,该模型的构图技巧也得到了提高。“音乐变得越来越有趣,”他认为。“您会得到意想不到的和弦变化。”
在我们的一项努力中,您可以在上面听到,我们使用了一组我快速写的歌词,并搭配“有机国家”的提示,取得了相当令人印象深刻的结果——您几乎可以看到磨损的痕迹。给不存在的歌手戴上帽子。这位歌手的声音确实经过了自动调音,这可能反映了 Suno 训练数据中电子增强声音的数量。
对于人工智能音乐的反对者来说——至少从官方角度来说,这一类别几乎包括整个唱片行业及其艺术家,其中许多人签署了反人工智能请愿书——前景更加光明。能够生成音乐的人工智能并不是一个好消息。不过也有例外:Timbaland 就是其中之一,最近告诉滚石乐队他使用 Suno(每天 10 小时)来完成不完整的歌曲,并与该公司合作担任创意顾问。舒尔曼坚称,他收到了许多正在悄悄使用 Suno 的艺术家、词曲作者和制作人的来信,其中至少包括一位一线明星,舒尔曼称他签署了一份反人工智能请愿书。
Shulman 希望就训练数据的使用达成一些协议,但他也认为艺术家应该更担心模型最终能够再现他们的声音,即使他们没有接受过训练(Suno 没有接受过训练)允许,因为提示中禁止出现艺术家姓名。“有人会训练一个没有尼尔·杨的模型,”舒尔曼说。“然后找出如何通过正确描述该模型来从该模型中激发出尼尔·杨的形象。”¤
Suno 的功能远远超出了 ChatGPT 风格的文本提示 — 您现在可以上传自己的部分作品、无伴奏人声、循环或其他音频,并将其转换为歌曲,实现高级的人类与人工智能协作。(他们还有一个测试版功能,可以让你上传视频或照片来激发歌曲灵感。)
Suno 的项目经理丽贝卡·胡 (Rebecca Hu) 表示,迭代现有音频的能力正在吸引年轻的节拍制作者来到该平台。“我们的许多高级用户都是年轻的制作人,”胡说。“他们认为这就是未来……”。我们正在尝试转向基于音乐的用户界面。当谈到音乐时,文字很难理解……。我认为有趣的用例是制作人或词曲作者在一个房间里进行迭代。尽管如此,该公司主要专注于让非音乐家参与制作音乐的最初使命。
V4 还提供了使用该公司正在开发的新的、正在进行的歌词生成模型的选项,该模型比之前使用的 ChatGPT 模型生成更古怪、更人性化的歌词。它在生成说唱歌词方面明显更出色,尽管它确实引用了 Drake 2015 年左右的一句台词——贯穿六人组——在我们的一个演示中。
舒尔曼说,大多数员工并没有想到 Suno 面临的版权诉讼,但它“显然会影响事情,被起诉并不好”。但我认为我们对构建音乐的未来感到兴奋。从这个角度来看,这是一个减速带,但最终不应该妨碍每个人建设音乐的未来。”他补充说,他希望最终争取唱片公司和艺术家作为合作伙伴:“那个未来对于音乐,我们实际上不能也不想自己做。”