Mistral AI的新语言模型将AI能力带到您的手机和笔记本电脑上

2024-10-16 17:47:19 英文原文

作者:Michael Nuñez

Credit: VentureBeat made with Midjourney

来源:VentureBeat 使用 Midjourney 制作

订阅我们的每日和每周通讯,获取最新更新和独家行业领先人工智能报道内容。了解更多


墨霜AI,这家人工智能领域的新星于本周三发布了两款新的语言模型,有可能重塑企业与开发者部署人工智能技术的方式。

总部位于巴黎的初创公司的新产品, ministerial 3B以及Ministral 8B这些设计旨在将强大的人工智能能力带到边缘设备上,标志着从以云为中心的方法向行业主导地位的重大转变。

这些紧凑型模型,统称为“部长们尽管体积小巧,这些模型的能力却令人惊讶地强大。拥有30亿参数的Ministral 3B在大多数基准测试中都超过了Mistral原始的70亿参数模型的表现。其更大的兄弟版本Ministral 8B则在性能上与几倍于它规模的模型相媲美。

不同基准测试下AI语言模型的性能比较。Mistral AI的新款Ministral 3B和8B模型(加粗显示)在知识、常识和多语种任务方面表现出色,与谷歌(Gemma)和Meta(Llama)的大规模模型相比具有竞争力。得分越高表示性能越好。(来源:Mistral)

边缘AI:将智能带入用户身边

此次发布的意义远远超出了技术规格的范畴。通过使AI能够在智能手机、笔记本电脑和物联网设备上高效运行,Mistral开启了通往此前由于连接性或隐私限制而被认为不切实际的应用的大门。

这种向边缘计算的转变可能使高级人工智能功能更加易于获取,使其更接近终端用户,并解决与基于云的解决方案相关的隐私问题。

考虑一个场景,工厂机器人需要基于视觉输入做出瞬间决策。传统上,这需要将数据发送到云端服务器进行处理,从而引入延迟和潜在的安全风险。使用Ministral模型,AI可以直接在机器人上运行,实现无需外部依赖的实时决策。

这种以边缘计算优先的方法对个人隐私也具有深远的影响。在设备上本地运行AI模型意味着敏感数据永远不会离开用户的掌控。

这可能对医疗、金融和其他数据隐私至关重要的领域的应用产生重大影响。它代表了我们对AI部署思考的根本性转变,有可能缓解云系统中长期存在的数据泄露和未经授权访问的担忧。

AI语言模型在关键基准测试中的性能对比。Mistral AI的新款Ministral 3B和8B模型(橙色)在多语言能力和知识任务方面,与Google的Gemma和Meta的Llama等更大规模的模型相比,表现出具有竞争力或更优的准确性。图表展示了更为紧凑的模型与其大型同类模型相匹敌的潜力。(来源:Mistral)

效率与环境影响的平衡

Mistral的发布时间与人们对日益增长的关注问题相吻合人工智能的环境影响大型语言模型通常需要大量的计算资源,导致能源消耗增加。

通过提供更高效的替代方案,Mistral 正在将自己定位为人工智能市场中环保的选择。这一举措符合整个行业向可持续计算发展的更广泛趋势,可能会影响公司在日益增长的气候担忧面前制定其人工智能策略的方式。

该公司的商业模式也同样值得关注。在将Ministral 8B模型提供给研究用途的同时,Mistral通过其云端平台提供了两种型号供商业用途使用。

这种混合方法反映了开源软件世界中的成功策略,在促进社区参与的同时保持收入流。

通过围绕其模型培育开发者的生态系统,Mistral正在建立一个坚实的基础以对抗更大的竞争对手,这一策略已经被像这样的公司证明是有效的。红帽公司在Linux领域。

在竞争激烈的环境中应对挑战

人工智能领域的竞争越来越激烈。科技巨头如谷歌以及元数据已经发布了他们自己的紧凑型模型,而开放人工智能(OpenAI)继续凭借其GPT系列主导头条新闻。

Mistral在边缘计算上的专注可能会在这个竞争激烈的领域中开辟一个独特的 niche。该公司的方法预示着一个未来,在这个未来中,人工智能不仅是一种基于云的服务,而且是每个设备不可或缺的一部分,从根本上改变我们与技术互动的方式。

然而,挑战仍然存在。在边缘部署人工智能引入了模型管理、版本控制和安全方面的新复杂性。企业将需要强大的工具和支持来有效管理一批边缘AI设备。

这种转变可能会催生一个全新的行业,专注于边缘人工智能管理和安全,类似于云计算的兴起孕育了众多云管理初创公司。

Mistral似乎意识到了这些挑战。该公司将其新模型定位为与大型云端系统互补。这种策略允许灵活的架构,在此架构中,边缘设备处理常规任务,而更复杂的查询则被路由到云中的更强大模型。这是一项务实的战略,既承认了当前边缘计算的局限性,又在推动可能的边界。

les Ministraux背后的技術創新同樣令人印象深刻。Ministral 8B采用了一種新型的“交错滑动窗口注意力机制这种机制使其能够比传统模型更高效地处理长文本序列。

两个模型都支持长达128,000个令牌的上下文长度,相当于大约100页的文字——这一特性对于文档分析和摘要任务可能特别有用。这些改进标志着在使大型语言模型更易于使用和更具实用性方面迈出了一大步。

随着企业应对这一技术的影响,几个关键问题浮现出来。边缘AI将如何影响现有的云基础设施投资?始终可用且保护隐私的AI将带来哪些新的应用可能性?监管框架将如何适应一个AI处理去中心化的世界?这些问题的答案很可能会塑造未来几年人工智能行业的走向。

Mistral发布的紧凑型、高性能AI模型不仅标志着技术上的演进——它更是对未来非常近的时期内AI功能方式的大胆重新构想。

这一举措可能会扰乱传统的基于云的AI基础设施,迫使科技巨头重新考虑他们对集中式系统的依赖。真正的疑问是:在一个AI无处不在的世界里,云端还会重要吗?

VB每日消息

了解最新资讯!每天将最新新闻发送到您的邮箱。

通过订阅,您同意VentureBeat的服务条款。

感谢订阅。查看更多VB新闻通讯在这里.

发生错误。

关于《Mistral AI的新语言模型将AI能力带到您的手机和笔记本电脑上》
暂无评论

摘要

2024年10月16日 10:47 上午 来源:VentureBeat,由Midjourney制作 加入我们的每日和每周通讯,获取最新的更新和独家内容,了解行业领先的AI报道。分数越高表示性能越好。(通过在其模型周围培育开发者生态系统,Mistral正在建立一个强大的基础来对抗更大的竞争对手,这一策略对于像Linux领域的Red Hat这样的公司来说已被证明是有效的。Ministral 8B采用了一种新颖的“交错滑动窗口注意力”机制,使其能够比传统模型更高效地处理长文本序列。Mistral发布的紧凑且高性能的人工智能模型不仅标志着技术上的演进——它还代表着对未来非常接近的人工智能功能的一次大胆重新构想。)