英伟达的新人工智能模型可以创造出前所未有的“闻所未闻的声音”
2024-12-02 16:39:00
Nvidia 推出了 Fugatto,这是一种先进的人工智能模型,能够以前所未有的方式转换音乐、声音和其他声音。Fugatto 利用超过 50,000 小时的带注释音频数据训练了 25 亿个参数,使用 Composable ART 根据文本或音频提示来组合和控制声音属性。该模型可以生成独特的声音组合并执行诸如改变语音情感、隔离人声以及使乐器适应新来源等任务。详细信息可参见 Nvidia 的白皮书和 Fugatto 页面上的示例。