作者:Ryan Daws
Mistral AI撤回了裁判官的窗帘,这是他们的第一个专门用于推理任务的模型。
裁判官有两种口味:一个24B参数开源版本,称为裁判型较小,任何人都可以修改,而更强大的企业版,《杂志媒体》,针对高级推理能力最重要的商业应用。
Mistral AI解释说,最好的人类思维不是通过逻辑,洞察力,不确定性和发现来编织的。”
这是一个公平的观点,现有的模型通常与人类实际上通过问题思考的凌乱,非线性的方式困难。我测试了许多推理模型,它们通常遭受三个关键局限性:它们缺乏专业领域的深度,他们的思维过程令人沮丧地不透明,并且在不同语言上表现不佳。
对于那些犹豫要通过复杂任务的AI的专业人员,裁判可能会改变一些想法。
法律老鹰,金融人员,医疗保健专业人员和政府工作者将欣赏该模型展示其工作的能力。当您在受监管的环境中进行操作时,所有结论都可以通过逻辑步骤来追溯到重要的步骤,因为AI所说的简直不削减它。
软件开发人员也没有被遗忘。裁判官声称要以一种结构化思维方式发光,从而为更好的项目计划,建筑设计和数据工程提供了更好的思维。在某些产生合理听起来但有缺陷的技术解决方案的模型中,我很想看看官员的推理能力是否在这方面传递出来。
Mistral声称其推理模式在创意任务上也很出色。该公司报告说,裁判官是一个出色的创意伴侣,可以写作和讲故事,能够在被要求提供更多实验性内容时产生连贯的叙述。这种多功能性表明,我们超越了为创意和逻辑任务提供单独模型的时代。
将裁判官与普通语言模型区分开的是透明度。它不是简单地从黑匣子中吐出答案,而是以用户可以遵循和验证的方式揭示其思维过程。
这在专业背景下非常重要。律师不想要合同条款建议;他们需要了解其背后的法律推理。医生可以盲目信任诊断建议,而不会看到临床逻辑。通过使其推理可追溯,裁判官可以帮助弥合在高风险领域中采用AI的信任差距。
与非英语AI开发人员进行了交谈后,我对推理能力如何在英语外急剧下降感到沮丧。裁判官似乎通过强大的多语言支持可以正面解决这一问题,使专业人士可以用自己的首选语言进行推理,而无需进行绩效惩罚。
这只是便利性;这是关于公平和访问权限的。随着国家越来越多地实施要求局部解决方案的AI法规,与以英语为中心的竞争者相比,有效地理解跨语言的工具将具有重要优势。
对于那些想尝试实验的人,现在可以通过拥抱脸在Apache 2.0许可证下提供小裁判官。那些对更强大的中等版本感兴趣的人可以通过Mistral的聊天界面或通过其API平台测试预览。
寻求部署选项的企业用户可以在Amazon Sagemaker上找到裁判媒体,IBM Watsonx,Azure和Google Cloud Marketplace实施即将推出。
随着通用聊天机器人的最初兴奋开始消失,市场渴望获得专门的AI工具,这些工具在特定的专业任务方面表现出色。通过专注于针对领域专家的透明推理,Mistral刻出了潜在的有价值的利基市场。
米斯特拉尔(Mistral)是由Deepmind和Meta AI的校友去年创立的,他以Breakneck Speed的速度提高了自己,成为欧洲的AI冠军。他们始终如一地超越自己的体重,创建了与公司规模多倍的产品竞争的模型。
随着组织越来越多地要求AI,尤其是在欧洲AI行为将需要透明度的裁判员专注于展示其推理过程的感觉特别及时。
(图片由斯蒂芬)
想从行业领导者那里了解有关AI和大数据的更多信息吗?查看AI和大数据博览会在阿姆斯特丹,加利福尼亚和伦敦举行。综合事件与其他领先活动共同分居,包括智能自动化会议,,,,块,,,,数字转换周, 和网络安全和云博览会。
探索由Techforge提供支持的其他即将举行的企业技术活动和网络研讨会这里。