Adobe 的新 AI 工具可让声音设计师通过哼唱和模仿声音来创建音频

作者：Matthias Bastian

Adobe Research 和西北大学开发了 Sketch2Sound，这是一种人工智能系统，可以将声音模仿和文本描述转化为专业的音效和氛围。

Adobe Research 和西北大学创建了一个人工智能系统，可以改变声音设计师的工作方式。被称为素描2声音，该工具允许用户通过哼唱、用声音制作音效以及以纯文本描述他们想要的内容来创建专业音频。

该系统分析声音输入的三个关键要素：响度、音色（决定声音的亮暗程度）和音高。然后它将这些特征与文本描述相结合以生成所需的声音。

视频：García 等人，Adobe Research广告

解码器时事通讯

最重要的人工智能新闻直接发送到您的收件箱。

– 每周

– 免费

– 随时取消

Sketch2Sound 的有趣之处在于它如何理解上下文。

例如，如果有人进入“森林氛围”并发出短促的声音，系统会自动识别出这些声音应该成为鸟叫声 - 无需具体指令。

同样的智慧也适用于音乐。创建鼓节奏时，用户可以输入“低音鼓、军鼓”并使用低音和高音哼出节奏。系统自动将低音鼓放置在低音上，将军鼓放置在高音上。

为专业人士提供微调控制

研究团队内置了特殊的过滤技术，可以让用户调整他们想要控制生成的声音的精确程度。声音设计师可以根据自己的需要选择精确、详细的控制或更轻松、近似的方法。

这种灵活性可以使 Sketch2Sound 对于拟音艺术家（为电影和电视节目创作声音效果的专业人士）特别有价值。他们可以通过语音和文本描述更快地产生效果，而不是操纵物理对象来发出声音。

研究人员指出，输入录音的空间音频特征有时会以不需要的方式影响生成的声音，但它正在努力解决这个问题。Adobe 尚未宣布 Sketch2Sound 何时或是否会成为商业产品。