Gemini 3.1 Flash Live 的首次亮相可能会让你更难知道你是否在与机器人交谈

同时，在 Scale AI 的 Audio MultiChallenge 中的强劲表现意味着新的 Gemini 模型更能够应对音频输入中的犹豫和中断。虽然 Gemini 3.1 Flash Live 的表现优于其他实时音频模型，但它在本次测试中只达到了 36.1%。并非设计用于对话操作的音频模型可以在 MultiChallenge 中达到 50% 以上的分数。

结果是 Gemini 3.1 Flash Live 听起来应该更像一个人，以至于谷歌认为是时候整合 AI 标志了。

该模型的输出将有SynthID 水印，人类听众无法察觉。然而，如果有人试图冒充 Gemini AI 语音，它们就会被检测到。

谷歌已与家得宝 (Home Depot)、威瑞森 (Verizon) 等公司合作测试该模型。他们都在博客文章中对 3.1 Flash Live 模仿人类语音的能力做出了热情洋溢的报告。因此，你在电话中遇到的下一个人工智能助手可能听起来更加现实。也许您甚至会认为您正在与一个人交谈，而 SynthID 对此无能为力。

开发人员现在可以在 AI Studio、Gemini API 和 Gemini Enterprise for Customer Experience 中访问该模型。后者本质上是代理购物的工具包。Gemini 3.1 Flash Live 将在 Gemini Live 和 Search Live（AI 模式的一项功能）中最为显眼。从今天开始，新的对话式人工智能将在这些产品中推出。

OC

Gemini 3.1 Flash Live 的首次亮相可能会让你更难知道你是否在与机器人交谈

关于《Gemini 3.1 Flash Live 的首次亮相可能会让你更难知道你是否在与机器人交谈》的评论

发表评论

摘要

相关新闻

相关讨论