Mistral释放Voxtral，其第一个开源AI音频模型|TechCrunch

作者：Rebecca Bellan

随着AI系统变得越来越强大，语音正迅速成为我们与机器通信的默认方式。法国人工智能创业公司Mistral已经以其第一个开放模型参加了音频竞赛，旨在挑战有围墙的公司系统的主导地位。

周二，米斯特拉尔（Mistral）宣布发行Voxtral，这是其第一个针对企业的音频模型。

该公司将Voxtral推销为能够在生产中部署真正可用的语音智能的第一个开放模型。

换句话说，开发人员不再需要在廉价的，开放的系统之间进行选择，该系统能够摸索转录，并且不真正理解所说的话，而且功能良好，但已关闭，使开发人员拥有更高的账单，对部署的控制权较少。”

对于企业而言，这意味着Voxtral提供了一种负担得起的替代方案，该公司声称的是可比解决方案的一半。

米斯特拉尔（Mistral）说，紫外线最多可以转录30分钟的音频。由于其LLM骨干，Mistral Small 3.1，它最多可以理解40分钟，允许用户询问有关音频内容的问题，生成摘要或将语音命令转换为诸如调用API或运行功能之类的实时操作。Voxtral也是多种语言，具有抄写和理解包括英语，西班牙，法语，葡萄牙语，印地语，德语，荷兰语和意大利语的语言的能力。

该公司提供了其语音理解模型的两个变体。第一个，Voxtral Small，有240亿个用于生产规模部署的参数，并且与ElevenLabs Scribe，GPT-4O-Mini和Gemini 2.5 Flash.”具有竞争力。

第二个Voxtral Mini具有30亿个本地和边缘部署参数。还有一个超级廉价的，剥离的，快速的API版本的30亿款模型，称为Voxtral Mini Trescribe，该版本针对仅转录用例进行了优化，并承诺以不到一半的价格以不到一半的价格超越Openai Whisper。

用户可以通过下载拥抱脸或测试Mistral的Chatbot Le Chat中的API来免费尝试Voxtral。根据公司的说法，将API集成到申请中为每分钟0.001美元。

发布一个月后发布米斯特拉尔宣布了裁判官，它的第一个推理模型家族逐步通过问题来提高可靠性。

Mistral是欧洲顶级AI公司之一，以其倡导开源AI模型而闻名。本月初，TechCrunch报告说，该公司正在谈判提高10亿美元的股权来自阿布扎比的MGX基金等投资者。

丽贝卡·贝兰（Rebecca Bellan）是TechCrunch的高级记者，她涵盖了特斯拉（Tesla）和埃隆·马斯克（Elon Musk）更广泛的帝国，自治，人工智能，电气化，演出工作平台，大型技术监管审查等等。她是股票播客的共同主持人之一，并写了《 TechCrunch Daily Morning通讯》。此前，她介绍了forbes.com的社交媒体，她的作品出现在彭博城市，大西洋，《每日野兽》，《母亲琼斯》，《 i-d（副）》等。丽贝卡已投资以太坊。

OC

Mistral释放Voxtral，其第一个开源AI音频模型|TechCrunch

关于《Mistral释放Voxtral，其第一个开源AI音频模型|TechCrunch》的评论

发表评论

摘要

相关新闻

相关讨论