人工智能公司已经开发语音模型已经有一段时间了,但是在Openai揭幕之后,事情似乎确实越来越大chatgpt语音模式。
现在,亚马逊有引入它的新“基础” AI语音模型称为Nova Sonic。这确实使Alexa听起来像是她过去的生活方式。
根据亚马逊的说法,Nova Sonic“将语音理解和语音产生统一为单个模型,以在AI应用中启用更类似人类的语音对话。”通过提供的样品,它肯定比公司以前的AI语音模型更为人性化。
例如,根据单词的位置以及句子中的含义,有适当的暂停,语气和变形。亚马逊提供了一些您可以听的样本这里和这里。可混合的轻速速度同样,“更多人类”是这里的关键描述。仍然有很多迹象表明这是AI的声音,但这听起来确实像Alexa这样的AI语音助手迈出了一大步。亚马逊说,它通过将传统上可以使用的多种模型(例如语音识别,大语言模型和文本到语音)组合为一个单一的统一模型来实现这一目标。
根据亚马逊的说法,它不仅了解言语的细微差别,而且还可以理解当人类以这些细微差别发表自己的言论时,它也会理解它。
根据
TechCrunch
,Nova Sonic已经为亚马逊的下一代AI语音助手Alexa+提供动力。根据最近的发展,大型AI公司目前似乎正在专注于语音模型。因此,为在该空间中的竞争做准备以加热。
亚马逊已经指出,Nova Sonic比OpenAI的GPT-4O型号便宜大约80%,并将其推广为最具成本效益。”
Nova Sonic目前可以通过亚马逊的企业AI开发人员平台Bedrock向开发人员使用。