英语轻松读发新版了,欢迎下载、更新

裁判:Mistral AI通过推理模型挑战了大型技术

2025-06-10 15:44:51 英文原文

作者:Ryan Daws

Mistral AI撤回了裁判官的窗帘,这是他们的第一个专门用于推理任务的模型。

裁判官有两种口味:一个24B参数开源版本,称为裁判型较小,任何人都可以修改,而更强大的企业版,《杂志媒体》,针对高级推理能力最重要的商业应用。

Mistral AI解释说,最好的人类思维不是通过逻辑,洞察力,不确定性和发现来编织的。”

这是一个公平的观点,现有的模型通常与人类实际上通过问题思考的凌乱,非线性的方式困难。我测试了许多推理模型,它们通常遭受三个关键局限性:它们缺乏专业领域的深度,他们的思维过程令人沮丧地不透明,并且在不同语言上表现不佳。

MISTRAL AI的现实推理专业人士

对于那些犹豫要通过复杂任务的AI的专业人员,裁判可能会改变一些想法。

法律老鹰,金融人员,医疗保健专业人员和政府工作者将欣赏该模型展示其工作的能力。当您在受监管的环境中进行操作时,所有结论都可以通过逻辑步骤来追溯到重要的步骤,因为AI所说的简直不削减它。

软件开发人员也没有被遗忘。裁判官声称要以一种结构化思维方式发光,从而为更好的项目计划,建筑设计和数据工程提供了更好的思维。在某些产生合理听起来但有缺陷的技术解决方案的模型中,我很想看看官员的推理能力是否在这方面传递出来。

Mistral声称其推理模式在创意任务上也很出色。该公司报告说,裁判官是一个出色的创意伴侣,可以写作和讲故事,能够在被要求提供更多实验性内容时产生连贯的叙述。这种多功能性表明,我们超越了为创意和逻辑任务提供单独模型的时代。

是什么将裁判官与其他人区分开来?

将裁判官与普通语言模型区分开的是透明度。它不是简单地从黑匣子中吐出答案,而是以用户可以遵循和验证的方式揭示其思维过程。

这在专业背景下非常重要。律师不想要合同条款建议;他们需要了解其背后的法律推理。医生可以盲目信任诊断建议,而不会看到临床逻辑。通过使其推理可追溯,裁判官可以帮助弥合在高风险领域中采用AI的信任差距。

与非英语AI开发人员进行了交谈后,我对推理能力如何在英语外急剧下降感到沮丧。裁判官似乎通过强大的多语言支持可以正面解决这一问题,使专业人士可以用自己的首选语言进行推理,而无需进行绩效惩罚。

这只是便利性;这是关于公平和访问权限的。随着国家越来越多地实施要求局部解决方案的AI法规,与以英语为中心的竞争者相比,有效地理解跨语言的工具将具有重要优势。

掌握裁判官

对于那些想尝试实验的人,现在可以通过拥抱脸在Apache 2.0许可证下提供小裁判官。那些对更强大的中等版本感兴趣的人可以通过Mistral的聊天界面或通过其API平台测试预览。

寻求部署选项的企业用户可以在Amazon Sagemaker上找到裁判媒体,IBM Watsonx,Azure和Google Cloud Marketplace实施即将推出。

随着通用聊天机器人的最初兴奋开始消失,市场渴望获得专门的AI工具,这些工具在特定的专业任务方面表现出色。通过专注于针对领域专家的透明推理,Mistral刻出了潜在的有价值的利基市场。

米斯特拉尔(Mistral)是由Deepmind和Meta AI的校友去年创立的,他以Breakneck Speed的速度提高了自己,成为欧洲的AI冠军。他们始终如一地超越自己的体重,创建了与公司规模多倍的产品竞争的模型。

随着组织越来越多地要求AI,尤其是在欧洲AI行为将需要透明度的裁判员专注于展示其推理过程的感觉特别及时。

(图片由斯蒂芬

参见:解决幻觉:麻省理工学院旋转教会AI何时毫无头绪

想从行业领导者那里了解有关AI和大数据的更多信息吗?查看AI和大数据博览会在阿姆斯特丹,加利福尼亚和伦敦举行。综合事件与其他领先活动共同分居,包括智能自动化会议,,,,,,,,数字转换周, 和网络安全和云博览会

探索由Techforge提供支持的其他即将举行的企业技术活动和网络研讨会这里

关于《裁判:Mistral AI通过推理模型挑战了大型技术》的评论


暂无评论

发表评论

摘要

Mistral AI已揭开了裁判官的宣布,这是一种以推理为中心的模型,有两个版本:开源24B参数版本,称为杂志小型和更强大的商业版本,即裁判媒体。该模型通过为法律,金融,医疗保健和政府部门等受管制环境至关重要的透明推理过程来解决现有模型的局限性。它还支持创造性的任务,并提供强大的多语言功能,而不会降级。Apache 2.0许可证下的拥抱脸上可以使用Small,而Enterprise用户可以通过各种云平台访问裁判媒体。