作者:Rebecca Bellan
随着AI系统变得越来越强大,语音正迅速成为我们与机器通信的默认方式。法国人工智能创业公司Mistral已经以其第一个开放模型参加了音频竞赛,旨在挑战有围墙的公司系统的主导地位。
周二,米斯特拉尔(Mistral)宣布发行Voxtral,这是其第一个针对企业的音频模型。
该公司将Voxtral推销为能够在生产中部署真正可用的语音智能的第一个开放模型。
换句话说,开发人员不再需要在廉价的,开放的系统之间进行选择,该系统能够摸索转录,并且不真正理解所说的话,而且功能良好,但已关闭,使开发人员拥有更高的账单,对部署的控制权较少。”
对于企业而言,这意味着Voxtral提供了一种负担得起的替代方案,该公司声称的是可比解决方案的一半。
米斯特拉尔(Mistral)说,紫外线最多可以转录30分钟的音频。由于其LLM骨干,Mistral Small 3.1,它最多可以理解40分钟,允许用户询问有关音频内容的问题,生成摘要或将语音命令转换为诸如调用API或运行功能之类的实时操作。Voxtral也是多种语言,具有抄写和理解包括英语,西班牙,法语,葡萄牙语,印地语,德语,荷兰语和意大利语的语言的能力。
该公司提供了其语音理解模型的两个变体。第一个,Voxtral Small,有240亿个用于生产规模部署的参数,并且与ElevenLabs Scribe,GPT-4O-Mini和Gemini 2.5 Flash.”具有竞争力。
第二个Voxtral Mini具有30亿个本地和边缘部署参数。还有一个超级廉价的,剥离的,快速的API版本的30亿款模型,称为Voxtral Mini Trescribe,该版本针对仅转录用例进行了优化,并承诺以不到一半的价格以不到一半的价格超越Openai Whisper。
用户可以通过下载拥抱脸或测试Mistral的Chatbot Le Chat中的API来免费尝试Voxtral。根据公司的说法,将API集成到申请中为每分钟0.001美元。
发布一个月后发布米斯特拉尔宣布了裁判官,它的第一个推理模型家族逐步通过问题来提高可靠性。
Mistral是欧洲顶级AI公司之一,以其倡导开源AI模型而闻名。本月初,TechCrunch报告说,该公司正在谈判提高10亿美元的股权来自阿布扎比的MGX基金等投资者。
丽贝卡·贝兰(Rebecca Bellan)是TechCrunch的高级记者,她涵盖了特斯拉(Tesla)和埃隆·马斯克(Elon Musk)更广泛的帝国,自治,人工智能,电气化,演出工作平台,大型技术监管审查等等。她是股票播客的共同主持人之一,并写了《 TechCrunch Daily Morning通讯》。此前,她介绍了forbes.com的社交媒体,她的作品出现在彭博城市,大西洋,《每日野兽》,《母亲琼斯》,《 i-d(副)》等。丽贝卡已投资以太坊。