裁判：Mistral AI通过推理模型挑战了大型技术

作者：Ryan Daws

Mistral AI撤回了裁判官的窗帘，这是他们的第一个专门用于推理任务的模型。

裁判官有两种口味：一个24B参数开源版本，称为裁判型较小，任何人都可以修改，而更强大的企业版，《杂志媒体》，针对高级推理能力最重要的商业应用。

Mistral AI解释说，最好的人类思维不是通过逻辑，洞察力，不确定性和发现来编织的。”

这是一个公平的观点，现有的模型通常与人类实际上通过问题思考的凌乱，非线性的方式困难。我测试了许多推理模型，它们通常遭受三个关键局限性：它们缺乏专业领域的深度，他们的思维过程令人沮丧地不透明，并且在不同语言上表现不佳。

对于那些犹豫要通过复杂任务的AI的专业人员，裁判可能会改变一些想法。

法律老鹰，金融人员，医疗保健专业人员和政府工作者将欣赏该模型展示其工作的能力。当您在受监管的环境中进行操作时，所有结论都可以通过逻辑步骤来追溯到重要的步骤，因为AI所说的简直不削减它。

软件开发人员也没有被遗忘。裁判官声称要以一种结构化思维方式发光，从而为更好的项目计划，建筑设计和数据工程提供了更好的思维。在某些产生合理听起来但有缺陷的技术解决方案的模型中，我很想看看官员的推理能力是否在这方面传递出来。

Mistral声称其推理模式在创意任务上也很出色。该公司报告说，裁判官是一个出色的创意伴侣，可以写作和讲故事，能够在被要求提供更多实验性内容时产生连贯的叙述。这种多功能性表明，我们超越了为创意和逻辑任务提供单独模型的时代。

将裁判官与普通语言模型区分开的是透明度。它不是简单地从黑匣子中吐出答案，而是以用户可以遵循和验证的方式揭示其思维过程。

这在专业背景下非常重要。律师不想要合同条款建议；他们需要了解其背后的法律推理。医生可以盲目信任诊断建议，而不会看到临床逻辑。通过使其推理可追溯，裁判官可以帮助弥合在高风险领域中采用AI的信任差距。

与非英语AI开发人员进行了交谈后，我对推理能力如何在英语外急剧下降感到沮丧。裁判官似乎通过强大的多语言支持可以正面解决这一问题，使专业人士可以用自己的首选语言进行推理，而无需进行绩效惩罚。

这只是便利性；这是关于公平和访问权限的。随着国家越来越多地实施要求局部解决方案的AI法规，与以英语为中心的竞争者相比，有效地理解跨语言的工具将具有重要优势。

对于那些想尝试实验的人，现在可以通过拥抱脸在Apache 2.0许可证下提供小裁判官。那些对更强大的中等版本感兴趣的人可以通过Mistral的聊天界面或通过其API平台测试预览。

寻求部署选项的企业用户可以在Amazon Sagemaker上找到裁判媒体，IBM Watsonx，Azure和Google Cloud Marketplace实施即将推出。

随着通用聊天机器人的最初兴奋开始消失，市场渴望获得专门的AI工具，这些工具在特定的专业任务方面表现出色。通过专注于针对领域专家的透明推理，Mistral刻出了潜在的有价值的利基市场。

米斯特拉尔（Mistral）是由Deepmind和Meta AI的校友去年创立的，他以Breakneck Speed的速度提高了自己，成为欧洲的AI冠军。他们始终如一地超越自己的体重，创建了与公司规模多倍的产品竞争的模型。

随着组织越来越多地要求AI，尤其是在欧洲AI行为将需要透明度的裁判员专注于展示其推理过程的感觉特别及时。

（图片由斯蒂芬）

想从行业领导者那里了解有关AI和大数据的更多信息吗？查看AI和大数据博览会在阿姆斯特丹，加利福尼亚和伦敦举行。综合事件与其他领先活动共同分居，包括智能自动化会议，，，，块，，，，数字转换周，和网络安全和云博览会。

探索由Techforge提供支持的其他即将举行的企业技术活动和网络研讨会这里。

OC