英语轻松读发新版了,欢迎下载、更新

英伟达的新人工智能模型可以创造出前所未有的“闻所未闻的声音”

2024-12-02 16:39:00 英文原文

Speakers Soundwave

图片:彼得·阿恩施泰特

这篇文章最初发表在我们的姊妹刊物上M3是从瑞典语翻译和本地化的。

关于《英伟达的新人工智能模型可以创造出前所未有的“闻所未闻的声音”》的评论


暂无评论

发表评论

摘要

Nvidia 推出了 Fugatto,这是一种先进的人工智能模型,能够以前所未有的方式转换音乐、声音和其他声音。Fugatto 利用超过 50,000 小时的带注释音频数据训练了 25 亿个参数,使用 Composable ART 根据文本或音频提示来组合和控制声音属性。该模型可以生成独特的声音组合并执行诸如改变语音情感、隔离人声以及使乐器适应新来源等任务。详细信息可参见 Nvidia 的白皮书和 Fugatto 页面上的示例。