元数据宣布将带来一个新的语音模式其日益流行起来的元AI聊天机器人在上个月的Connect活动中。它终于开始推出了,并且从一些初步测试来看,我发现它的互动性和自然度比我预期的要好。
不同于开放人工智能组织的ChatGPT的高级语音功能这是语音到语音的转换,MetaAI Voice 首先将你说的话转換成文字,然后用文字回应你,最后再把它的回复念出来。这和之前的描述工作方式相同。谷歌的Gemini Live.
Meta AI 还提供了一系列的声音,包括像朱迪·丹奇女爵士、奥卡菲娜、基根-迈克尔·凯和克里斯滕·贝尔这样的名人声音。此外还有五个系统合成的声音,这些声音听起来同样自然且引人入胜,并非复制自任何特定的名人。
尽管它是文字转语音,你可以打断AI,并且我发现它处理被打断的状况比其他系统更好。微软的新Copilot或者谷歌Gemini直播
如何访问Meta AI语音?
Meta AI 已包含在大多数 Meta 产品中 WhatsApp, Instagram, Facebook以及雷朋智能眼镜。要访问它,你只需与人工智能启动聊天对话,而不是与真人联系。
它目前还不可全球使用,但正在分阶段逐步开放访问。例如,英国用户可以在WhatsApp上使用,但在网页版本上无法使用。meta.ai眼镜中的访问也是间歇性的,不同国家可用的功能也不同。
当你有权限访问语音模式时,它会在聊天栏中以一个图标的形式出现。该图标看起来像一个波形图,由一系列先小后大再变小的线条组成。点击它会切换到屏幕上的圆形视图,AI将以你选择的声音开始说话。
要更改语音,请点击语音模式右上角的“信息”图标,选择语音并从九个选项中进行选择。在设置视图中,您还可以查看之前与AI的对话和发送的图片的详细信息。
当你在ChatGPT或Copilot中使用语音模式时,你只会得到语音,但Meta AI是将语音转为文本的,所以它会把你说的话显示在屏幕上供你看。不过这并不总是完美的。有一次我让Judie Dench AI说唱,但它回答的是“包起来”,我觉得真正的Judi Dench在这方面可能会比它表现得更好。
Meta AI语音:裘德·洛像Gen Alpha一代说话 - YouTube
Meta AI语音听起来比Advanced Voice或Copilot Voice更像机器人。这是因为它首先需要转写你说的内容。
原生语音(用于副驾和高级语音)的最大优势在于可以根据您的说话方式改变声音。尽管音色稍显僵硬,但这些声音效果真的很令人印象深刻。
名人声音听起来非常像他们模仿的对象。即使是非名人声音也比其他模型听起来更自然。我认为Meta在所有AI工具中拥有最好的音色。在我之间进行选择时,让我回想起了上世纪九十年代作为青少年挑选手机铃声的情景。
经过我的测试,我觉得在让人工智能将一首十四行诗翻译成“Gen Alpha 俚语”后再用戴安娜·邓恩的声音朗读出来之后,我应该向戴安娜·邓恩女士道歉。注意:原文中的"Dame Judi Dench"应译为“戴安娜·邓恩女勋爵”,但为了句子流畅性和避免误解,此处简化为“戴安娜·邓恩”。
除了语音功能之外,它和其他人工智能系统类似。在性能上更接近于谷歌Gemini Live,并且通过访问你的Meta(即Facebook、Instagram和WhatsApp)数据,它增添了只有苹果公司才能匹敌的个人化上下文。
尽管存在一些限制,我发现它比内置的语音模型更灵敏。它从未拒绝过回答问题,并且每次都能成功打断对话。然而,它只会背诵真实作品(如诗或故事)中的片段,而它的虚构故事最多也只有一页或两页——不会讲很长的话。
Meta表现出色,不仅在于其Meta AI聊天机器人,还包括其语音模型。我的预测是,到2025年底,可能将有十亿人定期使用它。