英语轻松读发新版了,欢迎下载、更新

认识亚马逊新的AI语音模型Nova Sonic

2025-04-09 19:04:36 英文原文

人工智能公司已经开发语音模型已经有一段时间了,但是在Openai揭幕之后,事情似乎确实越来越大chatgpt语音模式

现在,亚马逊有引入它的新“基础” AI语音模型称为Nova Sonic。这确实使Alexa听起来像是她过去的生活方式。

根据亚马逊的说法,Nova Sonic“将语音理解和语音产生统一为单个模型,以在AI应用中启用更类似人类的语音对话。”通过提供的样品,它肯定比公司以前的AI语音模型更为人性化。 

例如,根据单词的位置以及句子中的含义,有适当的暂停,语气和变形。亚马逊提供了一些您可以听的样本这里和这里。可混合的轻速速度同样,“更多人类”是这里的关键描述。仍然有很多迹象表明这是AI的声音,但这听起来确实像Alexa这样的AI语音助手迈出了一大步。亚马逊说,它通过将传统上可以使用的多种模型(例如语音识别,大语言模型和文本到语音)组合为一个单一的统一模型来实现这一目标。

根据亚马逊的说法,它不仅了解言语的细微差别,而且还可以理解当人类以这些细微差别发表自己的言论时,它也会理解它。

根据

TechCrunch

,Nova Sonic已经为亚马逊的下一代AI语音助手Alexa+提供动力。根据最近的发展,大型AI公司目前似乎正在专注于语音模型。因此,为在该空间中的竞争做准备以加热。

亚马逊已经指出,Nova Sonic比OpenAI的GPT-4O型号便宜大约80%,并将其推广为最具成本效益。”

Nova Sonic目前可以通过亚马逊的企业AI开发人员平台Bedrock向开发人员使用。

关于《认识亚马逊新的AI语音模型Nova Sonic》的评论


暂无评论

发表评论

摘要

亚马逊启动了其新的“基础” AI语音模型,称为Nova Sonic,该模型将语音理解和生成统一为AI应用程序的单个更类似人类的对话语音模型。这种进步包括适当的暂停,语气和语音变化,与Alexa的先前迭代相比,它听起来更自然。亚马逊声称,通过将语音识别,大语言模型和文本到语音的多个模型集成到一个统一模型中,Nova Sonic可以在产生和接收语音时更好地了解细微差别。该模型已经为下一代Alexa+语音助手提供了动力,并且可以通过亚马逊的基石平台为开发人员使用。根据TechCrunch的说法,与OpenAI的GPT-4O这样的竞争对手相比,它有望具有显着的成本效益。