谷歌悄然推出一款可离线工作的人工智能听写应用程序 |TechCrunch
作者:Ivan Mehta
谷歌周一悄然发布了一款离线优先的听写应用程序,名为– iOS 上的 Google AI Edge Eloquent –接受喜欢的人小束流,超级耳语,柳树,以及其他。
该应用程序可免费下载,下载基于 Gemma 的自动语音识别 (ASR) 模型后,您就可以开始在手机上听写。在应用程序中,您可以看到实时转录,当您点击暂停时,应用程序会自动过滤掉“um”和“ah”等填充词并润色文本。
文字记录下方有“关键点”、“正式”、“短”和“长”等选项,用于转换文本。

您还可以关闭云模式以使用仅本地处理。(当云模式打开时,该应用程序使用基于云的 Gemini 模型进行文本清理。)如果需要,Google AI Edge Eloquent 可以从您的 Gmail 帐户导入某些关键字、名称和行话。另外,您可以将自己的自定义单词添加到列表中。
该应用程序显示转录会话的历史记录,并允许您搜索所有记录。它可以显示您在上次会话中听写的单词、每分钟的单词速度以及说出的单词总数。
– Google AI Edge Eloquent 是一款先进的听写应用程序,旨在弥合自然语音和专业的即用型文本之间的差距。与逐字转录错误和填充词的标准听写软件不同,Eloquent 利用 AI 来捕捉您的意图。该公司在应用商店的描述中写道,它会自动编辑掉“嗯”、“呃”、以及句子中间的自我更正,输出干净、准确的散文。

虽然该应用程序目前仅在 iOS 上可用,但 App Store 描述引用了 Android 版本。(我们已联系谷歌获取更多信息,如果收到回复,我们将更新故事。)
根据描述,Eloquent 提供“无缝 Android 集成”,可以将其设置为用户的默认键盘,以便在系统范围内跨任何文本字段进行访问。另外,该应用程序将能够使用浮动按钮功能,与 Wispr Flow 在 Android 上使用的类似,以便从任何地方轻松访问转录。
人工智能驱动的转录应用程序是受到用户欢迎随着语音到文本模型变得更好。有了这个实验性应用程序,谷歌也加入了这一趋势。如果此测试成功,我们也可以看到 Android 上的转录功能得到改进。