作者:Matthias Bastian
Adobe Research 和西北大学开发了 Sketch2Sound,这是一种人工智能系统,可以将声音模仿和文本描述转化为专业的音效和氛围。
Adobe Research 和西北大学创建了一个人工智能系统,可以改变声音设计师的工作方式。被称为素描2声音,该工具允许用户通过哼唱、用声音制作音效以及以纯文本描述他们想要的内容来创建专业音频。
该系统分析声音输入的三个关键要素:响度、音色(决定声音的亮暗程度)和音高。然后它将这些特征与文本描述相结合以生成所需的声音。
视频:García 等人,Adobe Research广告
解码器时事通讯
最重要的人工智能新闻直接发送到您的收件箱。
– 每周
– 免费
– 随时取消
Sketch2Sound 的有趣之处在于它如何理解上下文。
例如,如果有人进入“森林氛围”并发出短促的声音,系统会自动识别出这些声音应该成为鸟叫声 - 无需具体指令。
同样的智慧也适用于音乐。创建鼓节奏时,用户可以输入“低音鼓、军鼓”并使用低音和高音哼出节奏。系统自动将低音鼓放置在低音上,将军鼓放置在高音上。
研究团队内置了特殊的过滤技术,可以让用户调整他们想要控制生成的声音的精确程度。声音设计师可以根据自己的需要选择精确、详细的控制或更轻松、近似的方法。
这种灵活性可以使 Sketch2Sound 对于拟音艺术家(为电影和电视节目创作声音效果的专业人士)特别有价值。他们可以通过语音和文本描述更快地产生效果,而不是操纵物理对象来发出声音。
研究人员指出,输入录音的空间音频特征有时会以不需要的方式影响生成的声音,但它正在努力解决这个问题。Adobe 尚未宣布 Sketch2Sound 何时或是否会成为商业产品。