AI 音乐比以往更加真实：Suno 的新模型

Suno 可以根据文本提示或电话录音生成歌曲，其刚刚推出的新型号 V4 是迄今为止功能最强大的

即使像它面临诉讼来自唱片业的使用无数受版权保护的歌曲来训练其音乐生成人工智能模型，苏诺已成为世界上第五大最常用的生成人工智能服务，并且该公司仍在推动其技术向前发展。一种新的、更加现实的模型 V4 现已向付费订阅者开放，并且最终将覆盖所有用户。“我认为它已经成为我积极想听的东西，”Suno 联合创始人 Mikey 说道舒尔曼。“而不是我想要不断改进的东西。”

舒尔曼坐在公司同样全新的定制办公室中，该工作室占地两层楼，配备了真正的吉他、贝斯和高端音响系统。就在马萨诸塞州剑桥市哈佛大学校园附近的三号楼。“我们必须改进模型，以证明购买精美扬声器的合理性，”舒尔曼开玩笑说。截至2月份，该公司共有员工12人左右；现在他们已超过 50 个，而且还会有更多。“在真正有才华的研究人员方面，很难与 OpenAI 竞争，”Shulman 说，他指的是 ChatGPT 背后的人工智能巨头。“但我们竞争的方式是，如果您想学习使 [AI] 模型与人类品味保持一致，没有比这更好的地方了。”

与具有客观基准的大型语言模型不同，您可以比较 Claude 和 ChatGPT 在 LSAT 上的分数，例如，Suno 的工程师只能使用人类的偏好。记录过去用户对同一提示的不同结果之间的偏好对于改进新模型发挥了重要作用。“仅仅几个月后，我们就能更好地了解人类的偏好，”舒尔曼说。

AI 生成的音乐，无论是来自 Suno 还是其最直接的竞争对手，乌迪奥，往往有一定的声音——与低比特率 MP3 不同——这在人声中最为明显。当我们在工作室里花费几个小时创作出一首又一首歌曲时，V4 的作品比任何以前的 Suno 型号都更加清晰，具有更真实的歌手和乐器，以及更广泛的立体声场。舒尔曼说，该模型的构图技巧也得到了提高。“音乐变得越来越有趣，”他认为。“您会得到意想不到的和弦变化。”

编辑精选

在我们的一项努力中，您可以在上面听到，我们使用了一组我快速写的歌词，并搭配“有机国家”的提示，取得了相当令人印象深刻的结果——您几乎可以看到磨损的痕迹。给不存在的歌手戴上帽子。这位歌手的声音确实经过了自动调音，这可能反映了 Suno 训练数据中电子增强声音的数量。

对于人工智能音乐的反对者来说——至少从官方角度来说，这一类别几乎包括整个唱片行业及其艺术家，其中许多人签署了反人工智能请愿书——前景更加光明。能够生成音乐的人工智能并不是一个好消息。不过也有例外：Timbaland 就是其中之一，最近告诉滚石乐队他使用 Suno（每天 10 小时）来完成不完整的歌曲，并与该公司合作担任创意顾问。舒尔曼坚称，他收到了许多正在悄悄使用 Suno 的艺术家、词曲作者和制作人的来信，其中至少包括一位一线明星，舒尔曼称他签署了一份反人工智能请愿书。

Shulman 希望就训练数据的使用达成一些协议，但他也认为艺术家应该更担心模型最终能够再现他们的声音，即使他们没有接受过训练（Suno 没有接受过训练）允许，因为提示中禁止出现艺术家姓名。“有人会训练一个没有尼尔·杨的模型，”舒尔曼说。“然后找出如何通过正确描述该模型来从该模型中激发出尼尔·杨的形象。”¤

OC

AI 音乐比以往更加真实：Suno 的新模型

编辑精选

相关内容

热门故事

关于《AI 音乐比以往更加真实：Suno 的新模型》的评论

发表评论

摘要

相关新闻

相关讨论