英语轻松读发新版了,欢迎下载、更新

人工智能的混音效果能比真正的混音工程师更好吗?我们对 iZotope 的人工智能驱动的 Neutron 5 进行了测试,以找出答案

2024-12-12 12:26:39 英文原文

作者:Stuart AdamsSocial Links Navigation

mixing desk
(图片来源:Shutterstock/SMX12)

对于某些人来说,混音是项目中最激动人心的阶段,在这里,音乐性、想象力和技术智慧结合在一起,产生无尽的创造力和对完美的深深满足的追求。但对于其他人来说,混合是一个令人沮丧、困难且过于技术性的过程,似乎很少能带来预期的结果。

当然,经验是关键。如果不先制作大量糟糕的混音,就无法揭开创造良好混音的秘密。但仅仅因为有人想要编写和分享自己的音乐,并不意味着他们也想了解不同压缩器类型的复杂性、探索 EQ 的细节或掌握相位对齐。

值得庆幸的是,新一代人工智能音频处理器和工具的帮助就在眼前,但这提出了一个明显的问题:人工智能能否比我们有机肉袋更好地混合?

为了找到答案,我们招募了最近更新的服务iZotope 中子 5和一位经验丰富的人,并为三首截然不同的歌曲提供了多轨部分。结果很有趣……但我们不要操之过急。

什么是中子5?

mixing plugin

(图片来源:iZotope)

Neutron 5 是一套包含 10 个处理器的套件,范围从传统到奇异。具体来说,这些是门、均衡器、压缩器、瞬态整形器、激励器、雕刻器、Unmask、削波器、密度和相位。这些处理器本身都不是人工智能驱动的,并且可以像任何其他插件一样使用。

第一剂 AI 以 Neutron 5 插件本身的形式出现,它提供了用于托管每个处理器的插槽(有两个 Compressor 插槽)。您可以完全手动使用它,自行设置各个处理器,但使用 Neutron 5 包装器的主要好处是访问其人工智能驱动的助手模式。

一旦 Neutron 5 插件插入到轨道上,助手就可以被告知聆听轨道音频的一小部分,然后相应地配置处理器。它通过识别正在演奏的乐器,然后以尝试将该乐器的声音与假定的理想声音相匹配的方式设置处理器来实现这一点。

想要将所有最热门的音乐和装备新闻、评论、优惠、功能等直接发送到您的收件箱吗?在这里注册。

助手可以识别多种不同的乐器和乐器类型,但它的知识绝不是详尽的,并且它的识别也不是万无一失的(合成器是一个特殊的致命弱点,这是可以理解的)。不过,这不是问题,因为您可以通过从列表中选择不同的乐器或导入包含理想乐器示例的音频来否决人工智能,这会触发人工智能相应地重新配置处理器。

mixing plugin

(图片来源:iZotope)

助理模式还提供了一组简化的控件,这些控件充当深入到底层处理器的宏,从而可以轻松修改人工智能选择的设置。如果您想要对事物进行更广泛的控制,您可以自由地深入研究每个处理器的常规 GUI 并进行特定的调整。

该套件的第二个人工智能插件 Visual Mixer 有助于在混音中的所有曲目之间实现良好的平衡。这意味着将单个实例加载到您的项目中,通常作为主混音总线上的插入。可以加载更多实例,但毫无意义,因为每个实例只是同一事物的一个窗口。

Visual Mixer 可以识别加载到项目中的任何其他 Neutron 插件,并可以与之交互。您选择其中哪些将由 Visual Mixer 控制,哪些应被视为混音的主要焦点,然后让 AI 聆听整首歌曲,最好将所有轨道推子设置为 0dB 并集中平移。

Neutron 的目标是充当有用的工作室助手,可以处理繁琐的细节,让制作人可以自由地专注于大局

完成后,人工智能会呈现一组五个推子,您可以使用它们设置混音的主要焦点、人声、打击乐、低音和“音乐”组件的相对平衡。当您对这种平衡感到满意时,Visual Mixer 将返回到垂直推子轨道的主视图,并覆盖表示 AI 分析中包含的每个轨道音量的标记。

mixing plugin

(图片来源:iZotope)(图片来源:iZotope)

mixing plugin

上下移动标记可控制该轨道的音量,对于立体声轨道,左右移动并拖动标记的边缘可设置声相位置和立体声宽度。

奇怪的是,单声道轨道被锁定在中心,因此必须使用 DAW 的常规混音器进行平移,这感觉相当笨拙。

总的来说,Neutron 的目标是充当一个有帮助的工作室走狗助理可以处理挑剔的细节,如果被否决,不会争论或抱怨,这让你,制片人,可以自由地专注于大局。

人工智能与自然智能

如何混合一首曲目?声音应该多大?适用于吉他、军鼓或苏萨号的“正确”EQ 设置是什么?踢压多少就太多了?最终,如何才能获得商业发行版的光滑、优美的声音?

像 Neutron 这样的人工智能系统是否可以帮助您完成繁重的工作,从而提高混音创造力,或者它是否会引导您走向同质的声音和风格?

简单但无益的答案是“视情况而定”。每首歌曲、每场演出、每场情境、音乐家、表演和录音都是独一无二的,因此每一次混音都需要定制方法来适应这种独特的因素组合。这是经验丰富的人类混合工程师的第二天性,但人工智能可以模仿相同的态势感知和多功能性吗?像 Neutron 这样的人工智能系统是否可以通过为您完成繁重的工作来帮助混合创造力,或者它是否会引导您走向同质的声音和风格?

为了回答这些问题,我们选择了三首截然不同的歌曲,并将它们交给人类制作人,使用他们的正常方法进行混音。在某些情况下,这意味着只需要使用 Cubase 的内置通道条(门控、动态、均衡器、饱和度)和标准插件套件(频率均衡器、工作室压缩器等)。在其他情况下,选择的插件在某些乐器上特别有效。

例如,KIT Plugins F66 以原始(极其罕见)Fairchild 660 压缩器为模型,用于所有人声,而具有 Sonnox Oxford EQ 和各种 1176 压缩器型号的链是 Cubase 时的主要选择。海峡地带无法满足要求。立体声宽度控制由 SSL Fusion Stereo Image 处理,因为它能够在保持中心焦点的同时增加宽度,并且 Don’t Keep Me On Hold 中的铜管乐器部分通过 PSP Binamp 获得了额外的嘶嘶声,这在铜管乐器上听起来非常好部分。

人类混音完成后,所有混音处理(EQ、动态、加宽等)都被删除,并替换为 Neutron 5 插件的 AI 配置实例。创意和特效——混响、延迟、滤波器等——从人类混音转移到 Neutron 混音中,任何编辑(例如消除麦克风溢出)以及(在适当的情况下)自动化也是如此。

人工智能派生的设置在认为合适的地方进行了调整,但我们将其限制为仅使用助手的简化宏,因为目的是比较人类与人工智能,而不是人类与人类辅助的人工智能。

结果是这样的。对于每个示例,您都可以通过 Soundcloud 嵌入来收听混音。Soundcloud 对上传到平台的音频进行处理,因此如果您想听到完全未处理的版本,点击这里下载原始 WAV 文件。

1. Hayley Reardon & Pau Figueres - In The Good Light

我们选择这首歌是因为它简单的人声和吉他乐器。这种混合的挑战在于仅用两种乐器创造深度和兴趣。让这个问题变得特别棘手的是,这两种乐器都在音频频谱的中频范围内完成重要工作,从而增加了出现频率掩蔽问题的可能性。此外,不可能通过坚实的底端来实现深度感,因为这两种乐器在低频方面都没有做太多的事情。

中子混合

人的混合

判决

我们认为 Neutron 在这种混合方面做得并不是特别好。人工智能选择的人声设置导致了非常刺耳且不讨人喜欢的声音,尽管我们的人类大大放弃了这些设置,但最终混音中的人声处理并没有公正地对待海莉的声音。同样,Neutron 对吉他部分的处理听起来有些平淡,而且声像太宽,无法提供真实的声场。我们的人类再次试图在某种程度上阻止这一点。

相比之下,人类混音听起来更真实,每个音乐家在音场上都占据自己的空间。人声处理将Hayley声音细腻的呼吸质感衬托出来,但又不显得单薄或刺耳,动态均匀悦耳。吉他也有丰富的音色,流畅的动态并没有抑制 Pau 敲击和敲击的冲击力。

那么,我们称这为肉袋的轻而易举的胜利,但欢迎您不同意。

2. 艾伯特·卡德尔 - Whiptails

在制作 EDM 和其他现代风格时,混音很大程度上只是作曲过程中的另一个阶段。效果层和广泛的自动化与源部件、乐器和表演一样,都是成品音乐的本质。为了保持公平,我们没有过度进行此类处理,并确保两种混合物使用的任何处理都是相同的。

中子混合

人性混合

判决

Neutron 在这里做得很好,提供了听起来很扎实的混音,与音乐和乐器相得益彰。立体声图像强烈集中在中心,但这对于可能在俱乐部音响系统上播放的曲目来说不一定是坏事。

在我们看来,人类的混音比 Neutron 的直接效果更微妙。踩镲更轻、更不刺耳,单独的声音和乐器更容易辨别,更宽、更清晰的立体声图像创造了令人满意的运动感和空间感。

两者都是很好的组合,但彼此明显不同,因此决定哪一种最好归结为个人喜好。如果晚上出去玩,我们可能会倾向于 Neutron 的混音,但如果用耳机或良好的高保真音响收听,我们会更喜欢人类的混音。那么我们称此为平局。你怎么认为?

3. 记住琼斯 - 不要让我等待

这部时髦、令人感觉良好的欢闹剧中大量的乐器演奏向人工智能和人类发出了挑战。我们有主唱、和声、一套多麦克风鼓组、贝斯、两把吉他、电钢琴、哈蒙德管风琴、一个三声部铜管乐器组,最重要的是,合唱部分还有康加鼓。

这些乐器中的每一种都需要经过适当的处理,以开拓出自己的动态和频谱空间,然后再进行适当的平衡,以确保其在歌曲中发挥其作用。由于不同的乐器在不同的时间点发挥自己独特的优势,这种平衡必须不断改变。

中子混合

人性混合

判决

考虑到本次会议的复杂性,我们对 Neutron 的处理能力感到惊喜。也有一些缺点是可以挑出来的,比如军鼓太前卫,开销有点软弱,电钢琴声音低沉,通常会淹没在背景音乐中。但 Neutron 也有处理得特别好的方面,例如吉他声部的平衡和清晰度。让我们这样说:如果这是我们的歌曲,我们很乐意发布人工智能的混音。

也就是说,我们更愿意释放人类的混合体,它比人工智能的混合体更有活力、更有活力、更令人兴奋。声音清脆、富有特色、清晰。低频提供了受控且坚实的基础,而高频则具有闪亮的清晰度。立体声图像很华丽,但没有任何中心焦点的损失,乐器在它们应该出现的时候会退后,只有当它们有有趣的东西要说时才会出现。铜管乐听起来不可思议!

人工智能无疑在这里表现出色,当之无愧地获得亚军,但我们认为它无法与人类混音师的创造力相媲美。

谁脱颖而出?

从上面的内容看来,良好的肉袋混合已经证明自己优于人工智能,但有一些重要的注意事项需要考虑。一方面,我们可以通过推翻人工智能的决定来改善 Neutron 混合中的许多缺陷,但我们不会暴露它的能力和缺点。另一方面,我们没有考虑 Neutron 的人工智能助手能节省多少时间。

此外,虽然人工智能仅限于使用 Neutron 的处理器,但我们的人类工程师可以深入研究更大的处理器和插件池。没有使用 Neutron 理论上无法匹配的东西,但我们的人类可以选择特别适合正在处理的仪器的插件。

我们确实发现,与人工智能辅助进行混音感觉就像在检查清单一样,而相比之下,定期混音感觉就像使用您可以运用的所有积累的知识和智慧来制作一件定制的艺术品。这并不是避免使用 Neutron 5 的理由。它的各个处理器都非常出色,并且非常值得套件的成本,虽然人工智能助手将受到那些发现混合过程令人沮丧的人的特别欢迎,但这完全取决于您是否实际使用或不使用它们。

尽管如此,即使考虑到这些注意事项,我们仍然相信我们已经回答了本页顶部提出的问题。答案是“不,它不能……或者至少还不能”。


本文中使用的曲目来自 Telefunken Elektroakustik 的实验室现场直播系列和剑桥音乐技术多轨库,两者都为制作人提供了可下载的多轨目录,以练习他们的混音技巧。我们要感谢德律风根、剑桥 MT 和参与的艺术家,海莉·里尔登,保罗·菲格雷斯,阿尔伯特·卡德尔记住琼斯,感谢我们能够主办他们的音乐。

关于《人工智能的混音效果能比真正的混音工程师更好吗?我们对 iZotope 的人工智能驱动的 Neutron 5 进行了测试,以找出答案》的评论


暂无评论

发表评论

摘要

从使用 iZotope Neutron 5 处理器的人工智能辅助混音与在三个不同轨道上的传统人工混音之间的详细比较来看,虽然人工智能提供了坚实的基础,并且在某些情况下可以提供专业级混音,但仍然存在人类无法完成的领域。直觉、创造力和经验闪闪发光。以下是您的发现摘要:### 逐轨分析1. **海莉·里尔登 - “No One's Love”(简化版)**- **中子混合:** 人工智能混合总体上很扎实,但缺乏人为接触所能带来的一些微妙和清晰度。- **人声混音:** 更细致,踩镲更清晰,乐器分离更好,整体上更愉快的聆听体验。2. **阿尔伯特·卡德尔 - “坠落”**- **Neutron Mix:** 音质稳定,但与人类混音相比,动态和微妙程度稍差。立体图像集中聚焦。- **人声混音:** 提供更宽、更清晰的立体声场,使各个声音更容易区分,并创造更具吸引力的聆听体验。3. **记住琼斯 - “别让我等待”**- **中子混合:** 可以很好地处理复杂的乐器,但有一些问题,例如低沉的电钢琴和霸道的军鼓。- **人声混音:** 更加动感、充满活力,具有清脆的人声、平衡的低音、闪闪发光的高端清晰度以及华丽的立体声图像。### 总体影响- **时间效率:** 由于流程简化,人工智能辅助混合可以更快。然而,如果过于依赖自动设置而不进行手动优化,质量可能会受到影响。- **插件灵活性:** 混音师通常可以使用更广泛的插件和处理器,这些插件和处理器提供独特的声音特性,可以增强混音效果,超出 Neutron 内置 AI 提供的功能。- **创造力和细微差别:** 人耳和大脑非常擅长实时做出微妙的决定,平衡音乐制作的情感和技术方面。### 结论虽然 iZotope Neutron 5 的人工智能处理器为混音提供了一个强大的起点,并且对于那些苦于传统混音技术的用户来说非常有帮助,但与人类专业知识制作的混音相比,它们仍然存在不足。人工智能在处理更简单的轨道上特别有效,但可能需要对复杂的项目进行更多微调。最终,使用 Neutron 5 人工智能功能的决定很大程度上取决于个人工作流程偏好和项目要求。对于初学者或寻求快速结果的人来说,人工智能的帮助是非常宝贵的。然而,对于旨在突破音频质量和创意表达界限的专业人士来说,人类直觉在现阶段仍然是不可替代的。### 最后的想法虽然人工智能在音乐制作工具方面正在迅速发展,但它尚未超越熟练的人类混音师的细致决策能力。因此,您的初步评估是正确的:人工智能混音还无法完全与经验丰富的人类混音师提供的创意独创性和技术技巧相媲美。