英语轻松读发新版了,欢迎下载、更新

Mistral AI说其小型3型号是GPT-4O MINI的本地开源替代品

2025-01-30 21:10:00 英文原文

作者:Written by Radhika Rajkumar, Editor Jan. 30, 2025 at 1:10 p.m. PT

mistral55gettyimages-2187409296
养育图像/盖蒂图像

星期四,法国实验室Mistral AI发射小型3,该公司称之为“类别中最有效的模型”,并表示对潜伏期进行了优化。” 

米斯特拉尔(Mistral)说,小3可以与Llama 3.3 70B和Qwen 32B竞争,以及其他大型模型,它是“对GPT4O-Mini等不透明专有模型的绝佳开放替代品”。

还:马克·扎克伯格(Mark Zuckerberg)说

像Mistral的其他型号一样,24B参数Small 3是开源的,并在Apache 2.0许可下发布。Mistral

up-and-to-the-left.png
Mistral说,Small 3专为本地使用而设计,为建筑推理能力提供了基础。

该版本继续说:“在快速,准确的响应非常关键的情况下,小型3毫无疑问,”该版本继续说,该模型的层数少于可比的模型,这有助于其速度。” 

该模型在MMLU基准测试中的实现优于81%的精度,并且未接受加固学习(RL)或合成数据,米斯特拉尔(Mistral)说,这比DeepSeek R1“在模型生产管道中”。” 

公告指出:“我们的指令调整模型的竞争性与开放权重模型的大小相同,并在基准后跨代码,数学,一般知识和教学跨代码,数学,一般知识和教学的专有GPT4O-MINI模型。” 

mistral-instruct-knowledge.png
Mistral

使用第三方供应商,Mistral让人类评估者测试了Small 3,其中有1,000多个编码和通才提示。大多数测试人员更喜欢小3比Gemma-2 27B和QWEN-2.5 32B,但是当小3对阵Llama-3.3 70B和GPT-4O Mini时,数字更均匀。米斯特拉尔(Mistral)承认人类判断中的差异使该测试与标准化的公共基准不同。 

还:苹果研究人员揭示了DeepSeek AI背后的秘密酱

Mistral建议为建立面向客户的虚拟助手的小型3,尤其是对于快速发展需求,例如金融服务中的欺诈检测,法律建议和医疗保健,因为可以对其进行微调以创建“高度准确的主题专家”,版本 

小型3也可以用于机器人技术和制造业,可能是“处理敏感或专有信息的业余爱好者和组织”的理想选择,因为它可以在MacBook上运行至少32GB RAM。 

米斯特拉尔(Mistral)嘲笑说,我们可以期望有更多不同尺寸的型号“在未来几周内具有增强的推理能力”。您可以在拥抱面上访问小3这里

编辑标准

关于《Mistral AI说其小型3型号是GPT-4O MINI的本地开源替代品》的评论


暂无评论

发表评论

摘要

法国实验室Mistral AI推出了Small 3,这是一种开源型号,其24B参数优化了用于延迟和本地用途。它的表现优于诸如Llama 3.3 70B和Qwen 32B之类的模型,而无需使用强化学习或合成数据。人类评估者比Gemma-2和Qwen更喜欢小3,但与Llama-3.3和GPT-4O Mini混合了结果。Mistral建议它用于面向客户的虚拟助手,欺诈检测,法律建议,医疗保健,机器人技术,制造和业余爱好者,因为它在带有32GB RAM的MacBook等设备上的效率。