英语轻松读发新版了,欢迎下载、更新

Adobe 的新 AI 工具可让声音设计师通过哼唱和模仿声音来创建音频

2024-12-22 09:12:39 英文原文

作者:Matthias Bastian

Adobe Research 和西北大学开发了 Sketch2Sound,这是一种人工智能系统,可以将声音模仿和文本描述转化为专业的音效和氛围。

Adobe Research 和西北大学创建了一个人工智能系统,可以改变声音设计师的工作方式。被称为素描2声音,该工具允许用户通过哼唱、用声音制作音效以及以纯文本描述他们想要的内容来创建专业音频。

该系统分析声音输入的三个关键要素:响度、音色(决定声音的亮暗程度)和音高。然后它将这些特征与文本描述相结合以生成所需的声音。

视频:García 等人,Adobe Research广告

解码器时事通讯

最重要的人工智能新闻直接发送到您的收件箱。

– 每周

– 免费

– 随时取消

Sketch2Sound 的有趣之处在于它如何理解上下文。

例如,如果有人进入“森林氛围”并发出短促的声音,系统会自动识别出这些声音应该成为鸟叫声 - 无需具体指令。

同样的智慧也适用于音乐。创建鼓节奏时,用户可以输入“低音鼓、军鼓”并使用低音和高音哼出节奏。系统自动将低音鼓放置在低音上,将军鼓放置在高音上。

为专业人士提供微调控制

研究团队内置了特殊的过滤技术,可以让用户调整他们想要控制生成的声音的精确程度。声音设计师可以根据自己的需要选择精确、详细的控制或更轻松、近似的方法。

这种灵活性可以使 Sketch2Sound 对于拟音艺术家(为电影和电视节目创作声音效果的专业人士)特别有价值。他们可以通过语音和文本描述更快地产生效果,而不是操纵物理对象来发出声音。

研究人员指出,输入录音的空间音频特征有时会以不需要的方式影响生成的声音,但它正在努力解决这个问题。Adobe 尚未宣布 Sketch2Sound 何时或是否会成为商业产品。

关于《Adobe 的新 AI 工具可让声音设计师通过哼唱和模仿声音来创建音频》的评论


暂无评论

发表评论

摘要

Adobe Research 和西北大学开发了 Sketch2Sound,这是一种人工智能系统,使用户能够通过哼唱、发声效果或通过文本描述声音来创建专业音频。该系统分析语音输入的响度、音色和音高,并将它们与文本描述相结合,以生成所需的声音效果和氛围。它还可以理解上下文,例如从被描述为“森林气氛”的短促声音中识别鸟叫声。此外,用户可以控制生成声音的精度,从而提高工作灵活性,这对拟音艺术家来说具有潜在价值。