OC

Knowledge OS
鹦鹉螺口语
Gemini 3.1 Flash Live 的首次亮相可能会让你更难知道你是否在与机器人交谈
2026-03-26 17:44:07 · 英文原文

Gemini 3.1 Flash Live 的首次亮相可能会让你更难知道你是否在与机器人交谈

同时,在 Scale AI 的 Audio MultiChallenge 中的强劲表现意味着新的 Gemini 模型更能够应对音频输入中的犹豫和中断。虽然 Gemini 3.1 Flash Live 的表现优于其他实时音频模型,但它在本次测试中只达到了 36.1%。并非设计用于对话操作的音频模型可以在 MultiChallenge 中达到 50% 以上的分数。

信用:谷歌信用:谷歌

结果是 Gemini 3.1 Flash Live 听起来应该更像一个人,以至于谷歌认为是时候整合 AI 标志了。

该模型的输出将有SynthID 水印,人类听众无法察觉。然而,如果有人试图冒充 Gemini AI 语音,它们就会被检测到。

谷歌已与家得宝 (Home Depot)、威瑞森 (Verizon) 等公司合作测试该模型。他们都在博客文章中对 3.1 Flash Live 模仿人类语音的能力做出了热情洋溢的报告。因此,你在电话中遇到的下一个人工智能助手可能听起来更加现实。也许您甚至会认为您正在与一个人交谈,而 SynthID 对此无能为力。

开发人员现在可以在 AI Studio、Gemini API 和 Gemini Enterprise for Customer Experience 中访问该模型。后者本质上是代理购物的工具包。Gemini 3.1 Flash Live 将在 Gemini Live 和 Search Live(AI 模式的一项功能)中最为显眼。从今天开始,新的对话式人工智能将在这些产品中推出。

关于《Gemini 3.1 Flash Live 的首次亮相可能会让你更难知道你是否在与机器人交谈》的评论

暂无评论

发表评论

摘要

谷歌的最新型号Gemini 3.1 Flash Live在处理音频输入的犹豫和中断方面表现出色,尽管它在Scale AI的Audio MultiChallenge中得分仅为36.1%。这一改进使其输出听起来更加像人类,从而促使集成 SynthID 水印来检测虚假 AI 语音。家得宝 (Home Depot) 和 Verizon 等合作伙伴报告称,对该模型的对话能力进行了成功测试。开发人员可以通过 AI Studio、Gemini API 和 Gemini Enterprise for Customer Experience 访问 Gemini 3.1 Flash Live。从今天开始,增强型人工智能将在 Gemini Live 和 Search Live 等产品中推出。

相关讨论