英语轻松读发新版了,欢迎下载、更新

Mistral释放Voxtral,其第一个开源AI音频模型|TechCrunch

2025-07-15 15:14:44 英文原文

作者:Rebecca Bellan

随着AI系统变得越来越强大,语音正迅速成为我们与机器通信的默认方式。法国人工智能创业公司Mistral已经以其第一个开放模型参加了音频竞赛,旨在挑战有围墙的公司系统的主导地位。 

周二,米斯特拉尔(Mistral)宣布发行Voxtral,这是其第一个针对企业的音频模型。

该公司将Voxtral推销为能够在生产中部署真正可用的语音智能的第一个开放模型。

换句话说,开发人员不再需要在廉价的,开放的系统之间进行选择,该系统能够摸索转录,并且不真正理解所说的话,而且功能良好,但已关闭,使开发人员拥有更高的账单,对部署的控制权较少。” 

对于企业而言,这意味着Voxtral提供了一种负担得起的替代方案,该公司声称的是可比解决方案的一半。

图片来源:Mistral

米斯特拉尔(Mistral)说,紫外线最多可以转录30分钟的音频。由于其LLM骨干,Mistral Small 3.1,它最多可以理解40分钟,允许用户询问有关音频内容的问题,生成摘要或将语音命令转换为诸如调用API或运行功能之类的实时操作。Voxtral也是多种语言,具有抄写和理解包括英语,西班牙,法语,葡萄牙语,印地语,德语,荷兰语和意大利语的语言的能力。

该公司提供了其语音理解模型的两个变体。第一个,Voxtral Small,有240亿个用于生产规模部署的参数,并且与ElevenLabs Scribe,GPT-4O-Mini和Gemini 2.5 Flash.”具有竞争力。 

第二个Voxtral Mini具有30亿个本地和边缘部署参数。还有一个超级廉价的,剥离的,快速的API版本的30亿款模型,称为Voxtral Mini Trescribe,该版本针对仅转录用例进行了优化,并承诺以不到一半的价格以不到一半的价格超越Openai Whisper。

用户可以通过下载拥抱脸或测试Mistral的Chatbot Le Chat中的API来免费尝试Voxtral。根据公司的说法,将API集成到申请中为每分钟0.001美元。 

发布一个月后发布米斯特拉尔宣布了裁判官,它的第一个推理模型家族逐步通过问题来提高可靠性。 

Mistral是欧洲顶级AI公司之一,以其倡导开源AI模型而闻名。本月初,TechCrunch报告说,该公司正在谈判提高10亿美元的股权来自阿布扎比的MGX基金等投资者。

丽贝卡·贝兰(Rebecca Bellan)是TechCrunch的高级记者,她涵盖了特斯拉(Tesla)和埃隆·马斯克(Elon Musk)更广泛的帝国,自治,人工智能,电气化,演出工作平台,大型技术监管审查等等。她是股票播客的共同主持人之一,并写了《 TechCrunch Daily Morning通讯》。此前,她介绍了forbes.com的社交媒体,她的作品出现在彭博城市,大西洋,《每日野兽》,《母亲琼斯》,《 i-d(副)》等。丽贝卡已投资以太坊。

关于《Mistral释放Voxtral,其第一个开源AI音频模型|TechCrunch》的评论


暂无评论

发表评论

摘要

French AI初创公司Mistral发布了Voxtral,这是其首个针对企业的开源音频模型,为封闭的公司系统提供了负担得起的替代品。Voxtral最多可以转录30分钟的音频,并最多可以理解40分钟,从而支持多种语言。该公司提供了两种变体:Voxtral Smill,有240亿个参数和Voxtral Mini,其中有30亿个本地部署参数。用户可以在拥抱面孔或Mistral的聊天机器人聊天时免费尝试Voxtral,API集成起价为每分钟0.001美元。