ChatGPT 需要更多 Cowbell
作者:Nancy Walecki
如果您无法哼唱 18 世纪坎布里亚民歌“Do Ye Ken John Peel”,那也情有可原。但在 1942 年,这首歌的一个版本,加上有关百事可乐的歌词,成为美国最受认可的旋律。
三年前,两名男子拿着留声机走进百事可乐总裁的办公室。他们播放了一段后来成为美国最早的广告歌曲之一的小样。随着“Do Ye Ken John Peel”的曲调,它是这样唱的:百事可乐恰到好处/十二盎司,这很多/五分钱的两倍。百事可乐是适合您的饮料。这首歌曲一炮而红。全国各地的人们都在自动点唱机上播放这首曲子。它被翻译成 55 种语言。纽约百事可乐工厂顶部的电子铃声在半小时响起前七个音符。其他公司也认识到了低俗广告的力量,广播中很快就有太多广告引起了听众的抱怨。最终,纽约时报— 广播电台禁止这些“歌唱广告”,但公司可以通过推出器乐版本来绕过禁令。
从那以后,美国对广告歌曲又爱又恨,但他们仍然继续为音乐家提供薪水。大多数音乐行业都是由介于“摇滚明星”和“业余爱好者”之间的灰色地带的人组成,比如音乐家和作曲家,他们不仅制作专辑,还制作商业配乐和歌曲。当一个报告去年 10 月份,有消息称 OpenAI 正在开发一款音乐生成工具,类似于 Suno 和 Google 的 Lyria 等产品,我并不担心摇滚明星。这些艺术家至少有自己的名气可以用来交易。但广告音乐家的作品通常是匿名的,你不需要成为斯特拉文斯基才能创作 800-588-2300-EMPIRE 曲子。歌曲会好起来吗,还是广告旋律会成为新技术削减的又一个生计?
在过去的几十年里,歌曲创作不再是一门艺术,而是一门科学。现在有一些在“Do Ye Ken John Peel”时代不存在的惯例,并且惯例可以使工作更容易自动化。
首先,这些年来,歌曲变得越来越短,从 30 秒的歌曲演变为有时被称为“助记符”或简短的声音标签,如 Netflix图杜姆和 Liberty Mutual 的“Liberty,Liberty,Liiberty,Liiberty”。(Liberty Mutual 的首席营销官 Jenna Lebel 告诉我,他们最初测试了这首歌的一个版本,该版本重复了自由六次,但他们觉得有点太多了,就把它减少到了四次,效果很好。)从声音上来说,顺口溜——我就是无法让自己称它们为助记符——很简单。加州大学洛杉矶分校 (UCLA) 的民族音乐学家蒂莫西·D·泰勒 (Timothy D. Taylor) 撰写了历史广告音乐,用于保存他遇到的每首歌曲的数据库,并按流派标记。“其中许多歌曲都是写给儿童听的,”他说。“它们的简单性是它们在您脑海中留下深刻印象的部分原因。”
由于存在所有这些限制,广告歌曲作者专注于可衡量的、经过验证的品质。“在很多方面,像 Suno 这样的产品对音乐的看法与广告公司的做法是一样的——通过有关情绪和流派的文字,并通过对现有艺术家的引用,”拉维·克里希纳斯瓦米 (Ravi Krishnaswami) 在布朗大学研究人工智能音乐,他本人也是一名商业音乐作曲家,他在给我的一封电子邮件中写道。代理机构可能会向作曲家简要询问一首让人感觉“好奇”、“有趣”、“诙谐”、“古怪”的歌曲,例如您可能在 Spotify 播放列表上看到的描述符类型,然后评估哪些歌曲最能唤起听众的这些情绪。从理论上讲,人工智能可以通过编程来创作具有这些品质的小曲,也许会产生一些朗朗上口的东西,比如“就像一个好邻居,州立农场就在那里”或“我贴上了创可贴”(顺便说一下,这两首曲子都是由巴里·曼尼洛创作的)。
但好的商业音乐需要针对人们的情感,而人工智能音乐则不擅长做到这一点,至少目前如此。根据 Stephen Arnold Music 和音乐测试公司 SoundOut 的一项分析,人工智能通常无法提供与提示者所要求的情绪相匹配的曲目。克里希纳斯瓦米告诉我,虽然人工智能现在可以创作出好听的歌曲,但“我还不确定是否‘很棒’。”
我明白他的意思。当我使用一台发电机时,它为我提供了足够好听的音乐,适合猫粮广告中的 B 卷。但人工智能能给我一些像 Meow Mix 歌曲一样令人愉快的奇怪的东西吗?不。我想要一首可以在咖啡公司使用的歌曲,希望它能给我一些像 Folgers 主题这样的东西。相反,它给了我 –酿造幸福”,商店品牌杰森·玛拉兹 (Jason Mraz) 唱道“灵魂中的咖啡魔力”。
也许歌词不是重点,我想。(我们不可能都是巴里·曼尼洛。)因此,我向生成器询问了一系列五个音符,咖啡公司可以将其用作其声音标签。然后它给了我一首 2 分 27 秒的歌曲,名为“咖啡铃声一位女高音用百老汇水准的措辞在歌曲播放时旁白,实际上是大声唱出“温暖而诱人的五音序列”和“木琴上的上升音调,以绵绵不绝的轻柔铃声结束,让人想起勺子在杯子里搅拌的声音。”我试图明确表示我想要五秒以内的东西不包括自述歌词。但我刚刚又听到了一首长歌,更像是“勺子的声音”。
其中许多歌曲都很荒唐可笑。许多人都非常平均。但真正的问题是我不记得其中任何一个。一首好的歌曲需要让你难以忘怀——利宝互助银行选择它的旋律是因为人们只听一次就可以回唱,勒贝尔告诉我。消费者情报公司 NielsenIQ 的神经科学总监布拉德利·瓦恩斯 (Bradley Vines) 告诉我,重复是一首歌成为耳虫的主要方式,但它也需要适量的熟悉和不寻常。令人难忘的歌曲都有一个共同的旋律形状——想想有多少流行歌曲——旋律的音高升降,形成一个拱形(麦当劳的曲调“我爱它”也是如此)。但耳虫通常会有令人惊讶的音调变化,就像“像个好邻居”旋律中令人满意的跳跃一样。Vines 表示,考虑到耳虫的驱动因素是意外的,对现有耳虫进行训练的人工智能系统可能无法通过遵循以前有效的方法来创建新的耳虫。
我生成的音乐可能会被遗忘,因为它是也奇怪(没有常见的旋律形状)或太平淡(没有令人惊讶的音程或节奏变化)。但研究还表明,人们只是不记得人工智能生成的内容以及人类制作的内容。Vines 告诉我,当 NielsenIQ 向人们展示人工智能和人类制作的广告时,他们无法可靠地区分两者。然而,当他们观看人工智能广告时,他们大脑中的记忆系统就不那么活跃了。“这些广告中有些东西不那么熟悉和相关,”他说。– 在无意识层面上,人类创造的媒体和人工智能生成的媒体之间仍然存在一些区别。
这并不是说广告商没有使用这项技术——他们确实使用了这项技术,但主要是为了演示,而不是成品。不太擅长歌手的作曲家可能会发送带有人工智能人声的样本曲目。或者,有人测试是否要与乐队或弦乐四重奏一起制作商业曲目,可以轻松地尝试两者,然后再雇用人员进行真正的广告。部分原因是出于务实考虑:例如,如果公司在提示“一首由 12 弦 Rickenbacker 演奏的 1960 年代英国乐观摇滚歌曲”时产生的歌曲听起来太像披头士乐队,他们可能会担心被起诉。– 我没有看到任何人去,嘿,人工智能,给我写下一首可口可乐广告歌”,JAM Creative Productions 总裁 Jonathan Wolfert 告诉我。(具有讽刺意味的是,可口可乐当前的节日活动以人工智能生成的视觉效果为特色,但即便如此,该公司仍然强调音乐广告中的动作是由人类执行的。)
每当音乐一代变得足够好时,公司就会做好准备。Liberty Mutual 在其向焦点群体展示的早期广告中使用人工智能进行语音、音乐和音效。然后,它使用人类来完成最终版本。目前,人们普遍认为人工智能生成的广告不真实,但勒贝尔告诉我,Liberty Mutual 一直在测试它们,希望有一天能将其纳入市场。
与我交谈的许多人都说,一首伟大的歌曲或任何伟大的音乐都需要“人性化”。不过,当我要求他们定义它时,他们的共识似乎是,“我一听到它就知道了。”但也许这很简单:人工智能不是人类。它不存在于感官世界,也不接触日常生活提供的灵感。乔尼·米切尔 (Joni Mitchell) 撰写了《内森·拉·弗兰尼尔》(Nathan La Franeer),讲述一位真正的纽约市出租车司机带她去机场的故事。保罗·麦卡特尼从他母亲的冷奶油中得到了埃莉诺·里格比“保存在罐子里的脸”的图像。他在访问布里斯托尔时在一块牌子上看到了里格比这个名字。
顺口溜不是给海鸥的歌或左轮手枪,但最好的作品也来自同样不可估量的创造性思维的飞跃。我想到了大卫·卢卡斯。现年 88 岁的卢卡斯是一位从 60 年代到 90 年代的多产歌曲作家,但到了晚上,他是一位摇滚音乐家。他是 Blue yster Cult 的热门单曲《(Don’t Fear)the Reaper》的制作人,也是建议这首歌需要牛铃的人。(他对此一无所知,直到几十年后,当周六夜现场画了一个完整的草图,然后需要更多牛铃进入文化词典。)
卢卡斯曾经参加过一次有关芬达的会议。他告诉我,他和其他广告人员互相传递瓶子,笑着说,玩得很开心。当他坐上出租车返回工作室时,他想,嗯,那很有趣。然后他听到了歌词“口渴很有趣”。这是一句奇怪的台词“谁喜欢口渴?”不是我。但在听了几周人工智能生成的歌曲后,没有一个像这样在我的大脑中留下深刻的印象卢卡斯的芬达顺口溜,我只听过一次。我怀疑人工智能(或大多数人类)会认为“(不要害怕)收割者”需要更多的牛铃。