Mistral AI说其小型3型号是GPT-4O MINI的本地开源替代品

作者：Written by Radhika Rajkumar, Editor Jan. 30, 2025 at 1:10 p.m. PT

mistral55gettyimages-2187409296 — 养育图像/盖蒂图像

星期四，法国实验室Mistral AI发射小型3，该公司称之为“类别中最有效的模型”，并表示对潜伏期进行了优化。”

米斯特拉尔（Mistral）说，小3可以与Llama 3.3 70B和Qwen 32B竞争，以及其他大型模型，它是“对GPT4O-Mini等不透明专有模型的绝佳开放替代品”。

还：马克·扎克伯格（Mark Zuckerberg）说

像Mistral的其他型号一样，24B参数Small 3是开源的，并在Apache 2.0许可下发布。Mistral

该版本继续说：“在快速，准确的响应非常关键的情况下，小型3毫无疑问，”该版本继续说，该模型的层数少于可比的模型，这有助于其速度。”

该模型在MMLU基准测试中的实现优于81％的精度，并且未接受加固学习（RL）或合成数据，米斯特拉尔（Mistral）说，这比DeepSeek R1“在模型生产管道中”。”

公告指出：“我们的指令调整模型的竞争性与开放权重模型的大小相同，并在基准后跨代码，数学，一般知识和教学跨代码，数学，一般知识和教学的专有GPT4O-MINI模型。”

使用第三方供应商，Mistral让人类评估者测试了Small 3，其中有1,000多个编码和通才提示。大多数测试人员更喜欢小3比Gemma-2 27B和QWEN-2.5 32B，但是当小3对阵Llama-3.3 70B和GPT-4O Mini时，数字更均匀。米斯特拉尔（Mistral）承认人类判断中的差异使该测试与标准化的公共基准不同。

还：苹果研究人员揭示了DeepSeek AI背后的秘密酱

Mistral建议为建立面向客户的虚拟助手的小型3，尤其是对于快速发展需求，例如金融服务中的欺诈检测，法律建议和医疗保健，因为可以对其进行微调以创建“高度准确的主题专家”，版本

小型3也可以用于机器人技术和制造业，可能是“处理敏感或专有信息的业余爱好者和组织”的理想选择，因为它可以在MacBook上运行至少32GB RAM。

米斯特拉尔（Mistral）嘲笑说，我们可以期望有更多不同尺寸的型号“在未来几周内具有增强的推理能力”。您可以在拥抱面上访问小3这里。

编辑标准

OC

Mistral AI说其小型3型号是GPT-4O MINI的本地开源替代品

关于《Mistral AI说其小型3型号是GPT-4O MINI的本地开源替代品》的评论

发表评论

摘要

相关新闻

相关讨论