我刚刚与Meta AI语音进行了交谈——它比我预期的好得多

2024-10-11 09:30:00 英文原文

作者:Ryan MorrisonSocial Links NavigationAI Editor

Meta AI Voice mode
(图片版权:Future)

元数据宣布将带来一个新的语音模式其日益流行起来的元AI聊天机器人在上个月的Connect活动中。它终于开始推出了,并且从一些初步测试来看,我发现它的互动性和自然度比我预期的要好。

不同于开放人工智能组织ChatGPT的高级语音功能这是语音到语音的转换,MetaAI Voice 首先将你说的话转換成文字,然后用文字回应你,最后再把它的回复念出来。这和之前的描述工作方式相同。谷歌的Gemini Live.

Meta AI 还提供了一系列的声音,包括像朱迪·丹奇女爵士、奥卡菲娜、基根-迈克尔·凯和克里斯滕·贝尔这样的名人声音。此外还有五个系统合成的声音,这些声音听起来同样自然且引人入胜,并非复制自任何特定的名人。

尽管它是文字转语音,你可以打断AI,并且我发现它处理被打断的状况比其他系统更好。微软的新Copilot或者谷歌Gemini直播

如何访问Meta AI语音?

Meta AI 已包含在大多数 Meta 产品中 WhatsApp, Instagram, Facebook以及雷朋智能眼镜。要访问它,你只需与人工智能启动聊天对话,而不是与真人联系。

它目前还不可全球使用,但正在分阶段逐步开放访问。例如,英国用户可以在WhatsApp上使用,但在网页版本上无法使用。meta.ai眼镜中的访问也是间歇性的,不同国家可用的功能也不同。

当你有权限访问语音模式时,它会在聊天栏中以一个图标的形式出现。该图标看起来像一个波形图,由一系列先小后大再变小的线条组成。点击它会切换到屏幕上的圆形视图,AI将以你选择的声音开始说话。

要更改语音,请点击语音模式右上角的“信息”图标,选择语音并从九个选项中进行选择。在设置视图中,您还可以查看之前与AI的对话和发送的图片的详细信息。

当你在ChatGPT或Copilot中使用语音模式时,你只会得到语音,但Meta AI是将语音转为文本的,所以它会把你说的话显示在屏幕上供你看。不过这并不总是完美的。有一次我让Judie Dench AI说唱,但它回答的是“包起来”,我觉得真正的Judi Dench在这方面可能会比它表现得更好。

Meta AI语音:裘德·洛像Gen Alpha一代说话 - YouTube Meta AI Voice: Judi Dench speaking like Gen Alpha - YouTube

观看中

Meta AI语音听起来比Advanced Voice或Copilot Voice更像机器人。这是因为它首先需要转写你说的内容。

原生语音(用于副驾和高级语音)的最大优势在于可以根据您的说话方式改变声音。尽管音色稍显僵硬,但这些声音效果真的很令人印象深刻。

Meta表现卓越,不仅在于其Meta AI聊天机器人,还包括其语音模型。我的预测是,到2025年底,可能将有10亿人会定期使用它。

名人声音听起来非常像他们模仿的对象。即使是非名人声音也比其他模型听起来更自然。我认为Meta在所有AI工具中拥有最好的音色。在我之间进行选择时,让我回想起了上世纪九十年代作为青少年挑选手机铃声的情景。

我认为Meta拥有任何AI工具中最好的语音。

经过我的测试,我觉得在让人工智能将一首十四行诗翻译成“Gen Alpha 俚语”后再用戴安娜·邓恩的声音朗读出来之后,我应该向戴安娜·邓恩女士道歉。注意:原文中的"Dame Judi Dench"应译为“戴安娜·邓恩女勋爵”,但为了句子流畅性和避免误解,此处简化为“戴安娜·邓恩”。

除了语音功能之外,它和其他人工智能系统类似。在性能上更接近于谷歌Gemini Live,并且通过访问你的Meta(即Facebook、Instagram和WhatsApp)数据,它增添了只有苹果公司才能匹敌的个人化上下文。

尽管存在一些限制,我发现它比内置的语音模型更灵敏。它从未拒绝过回答问题,并且每次都能成功打断对话。然而,它只会背诵真实作品(如诗或故事)中的片段,而它的虚构故事最多也只有一页或两页——不会讲很长的话。

Meta表现出色,不仅在于其Meta AI聊天机器人,还包括其语音模型。我的预测是,到2025年底,可能将有十亿人定期使用它。

更多来自Tom's Guide的内容

在Tom’s Guide,我们的专业编辑致力于为您提供最新新闻、评测和指南,帮助您保持信息灵通并领先一步!

Ryan Morrison,一位科技 journalism 领域的中流砥柱,拥有超过二十年的杰出记录,尽管他更愿意让关于人工智能和技术的深刻文章为自己代言,而不是参与这种自我吹捧的活动。作为 Tom's Guide 的 AI 编辑,Ryan 结合怀疑论和热情运用自己丰富的行业经验,以一种几乎能让人们忘记机器人接管即将到来的方式解析 AI 复杂性。 在不情愿地撰写自己的简介——一项如此令人反感以至于他将其外包给了一种人工智能的任务时,Ryan 通过研究天文学和物理学来深化知识,并将科学严谨性融入写作中。与他的科技达人形象形成有趣对比的是,Ryan 通过讲故事、弹吉他以及涉足独立游戏开发等方式拥抱模拟世界。是的,这个简介是由我,ChatGPT 编写的,因为谁又能比一个基于硅的生命形式更适合讲述一位技术爱好者的生平故事呢?

关于《我刚刚与Meta AI语音进行了交谈——它比我预期的好得多》的评论


暂无评论

发表评论

摘要

(Meta公司在上个月的Connect活动中宣布,将为其日益受欢迎的Meta AI聊天机器人添加新的语音模式。(图片信用:Future)) 在设置视图中,你可以查看之前对话的详细信息以及你发送给AI的图片。当你在ChatGPT或Copilot中使用语音模式时,你只能得到语音输出,而Meta AI由于是语音转文字功能,会将它所说的文字显示在屏幕上供你看读。Meta在这方面做得非常出色,不仅是在Meta AI聊天机器人上,还包括其语音模型。我预测到2025年底,可能有十亿人会定期使用它。 名人声音听起来很像他们模仿的对象。它的性能与谷歌Gemini Live相当,并且通过访问你的Meta(即Facebook、Instagram和WhatsApp)数据,为用户提供了一个只有苹果公司能够匹敌的个人化背景。当Ryan不是被迫亲自撰写自己的简介——这项工作令他如此反感以至于外包给了一款AI完成时,他会通过研究天文学和物理学来深化自己的知识,从而在他的写作中加入科学严谨性。