IBM 推出 Granite 3.0:为企业打造的高性能 AI 模型

2024-10-21 04:05:38 英文原文

新发布的Granite 3.0 8B及2B模型,采用宽松的Apache 2.0许可证,在许多学术和企业基准测试中表现出色,能够超越或匹敌同尺寸的其他模型。

全新Granite Guardian 3.0型号提供了IBM最为全面的安全防护能力,以推进安全且值得信赖的人工智能发展。

新Granite 3.0混合专家模型实现极其高效的推理和低延迟,适合基于CPU的部署和边缘计算

新的Granite时间序列模型在零样本/少样本预测中达到了最先进的性能,优于规模大十倍的模型。

IBM 发布了新一代由 Granite 驱动的 Watsonx 代码助手,用于通用编程;推出了新的工具以在 watsonx.ai 上构建和部署 AI 应用程序和代理

宣布Granite将成为Consulting Advantage的默认模型,这是一个由IBM的160,000名顾问使用的AI驱动的交付平台,用于更快地为客户提供新的解决方案。

2024年10月21日

, /美通社/-- 今天, 在IBM(纽约证券交易所:)IBM在该公司举办的年度TechXchange活动中,宣布发布了迄今为止最先进的AI模型系列。花岗岩 3.0IBM的第三代Granite旗舰语言模型在许多学术和行业基准上可以超越或匹敌领先模型提供商的同类规模模型,展示了强大的性能、透明度和安全性。

IBM Granite

符合公司对开源AI的承诺,Granite模型在宽松的Apache 2.0许可下发布,使其在性能、灵活性和自主性方面为企业的客户及整个社区提供了独特的优势。

IBM的Granite 3.0系列包括:

  • 通用/语言:花岗岩 3.08B指令, granite 3.02B指令,Granite 3.08B基岩,花岗岩 3.02B基础
  • 护栏与安全:花岗岩守护者 3.08B, 花岗岩守护者 3.02B
  • 专家混合模型:granite 3.03BA800M 指令版, 花岗岩 3.01BA400M 指令,granite 3.03BA800M 基础版, 花岗岩 3.01BA400M 基础版

新的Granite 3.08B以及2B语言模型被设计为适用于企业人工智能的“主力”模型,能够为检索增强生成(RAG)、分类、摘要、实体抽取和工具使用等任务提供强大的性能。这些紧凑且多功能的模型旨在通过企业数据进行微调,并无缝集成到各种业务环境或工作流程中。

虽然许多大型语言模型(LLM)是基于公开可用的数据训练的,但大多数企业数据仍未被利用。通过将一个小的Granite模型与企业数据结合使用,特别是采用革命性的对齐技术,可以实现这一点。指令实验室– 由IBM和RedHat于五月份推出 – IBM认为企业可以通过更低的成本实现特定任务的性能,与大型模型相比成本仅为后者的几分之一(根据几个早期概念验证中的观察结果,在某些情况下成本为大模型的1/3到1/23)1).

Granite 3.0版本的发布重申了IBM致力于在AI产品中构建透明度、安全性和信任的承诺。_THE END_(原文在此处结束,无后续内容需要翻译)花岗岩3.0技术报告以及责任使用指南提供用于训练这些模型的数据集的描述,包括数据过滤、清洗和整理的详细步骤,并提供主要学术和企业基准测试中模型性能的全面结果。

关键的是,IBM为watsonx.ai上的所有Granite模型提供了知识产权赔偿,因此企业客户可以更加放心地将其数据与这些模型合并。

提升标准:Granite 3.0基准测试

Granite 3.0语言模型在原始性能上也展示了有前景的结果。

在Hugging Face的OpenLLM排行榜定义的标准学术基准上,Granite 3.08B模型的整体性能在平均意义上优于同类开源模型(来自Meta和Mistral)的最新性能。在IBM的最新AttaQ安全基准测试中,Granite 3.08B在所有测量的安全维度上指导模型的表现优于Meta和Mistral的模型。

在RAG(检索增强生成)、工具使用和网络安全领域的核心企业任务中,Granite 3.08B该模型在平均性能上优于同类开源模型(来自Mistral和Meta),表现出领先的表现。3

The Granite 3.0模型是在超过12万亿个令牌上训练而成的,这些数据来自12种不同的自然语言和116种不同的编程语言。使用了一种新颖的两阶段训练方法,并利用了几千次实验的结果来优化数据质量、数据选择和训练参数。到年底时,3.0版本8B以及2B语言模型预计会包含对扩展功能的支持128K上下文窗口和多模态文档理解能力。

IBM提供了其Granite专家混合(MoE)架构模型,包括Granite 3.0,在性能和推理成本之间展现了优秀的平衡。1BA400M和Granite 3.03BA800M,作为更小、轻便的型号,可以部署在低延迟应用以及基于CPU的部署中。

IBM还宣布发布了其预训练的Granite时间序列模型的更新版本,该模型的第一个版本在今年早些时候发布。这些新模型在更大规模的数据集上进行训练(是之前数据量的三倍),并且在所有三个主要的时间序列基准测试中表现出色,在性能上超过了来自Google、阿里巴巴等公司的十倍大小的模型。更新后的模型还提供了更大的建模灵活性,支持外部变量和滚动预测功能。4

介绍Granite Guardian 3.0:开启负责任的人工智能新时代 

作为此次发布的一部分,IBM 还推出了一种新的 Granite Guardian 系列模型,允许应用程序开发人员通过检查用户提示和 LLM 响应来实施安全防护措施,以防范各种风险。Granite Guardian 3.08B以及2B模型提供了目前市场上最全面的风险和危害检测能力。

除了社会偏见、仇恨、毒性、亵渎、暴力、越狱等危害维度之外,这些模型还提供了一系列独特的RAG特定检查,例如事实依据、上下文相关性和答案相关性。在19个安全和RAG基准的广泛测试中,Granite Guardian 3.08B该模型在平均准确率上高于Meta公司发布的三代Llama Guard模型,在平均表现上与专门的幻觉检测模型WeCheck和MiniCheck持平,具有相似的幻觉检测性能。5

虽然石英守护者模型源自相应的石英语言模型,但它们可以与其他任何开源或专有AI模型一起使用来实施防护措施。

Granite 3.0模型的可用性

整个Granite 3.0模型系列以及更新的时间序列模型可以在HuggingFace上以许可的Apache 2.0许可证下载。新的Granite 3.0指令变体8B以及2B语言模型和Granite Guardian 3.08B16B和2B模型现已可以在IBM的watsonx平台上用于商业用途。Granite 3.0的部分模型也将作为NVIDIA NIM微服务提供,并通过Google Cloud的Vertex AI Model Garden与HuggingFace的集成提供。

为了提供开发者选择和易于使用,并支持本地、边缘部署,精选的一套Granite 3.0模型也在Ollama和Replicate上可用。

最新一代的Granite模型扩展了IBM强大的开源大型语言模型目录。IBM与生态系统合作伙伴像 AWS、Docker、Domo、Qualcomm Technologies, Inc. 通过其高通®AI_hubSalesforce,SAP以及其他合作伙伴将各种Granite模型整合到他们的产品中或在他们的平台上提供这些模型,为世界各地的企业提供更多选择。

助理到代理:实现企业的未来人工智能

IBM 正通过一系列技术推进企业人工智能的发展——从模型和助手,到调优和部署特定于公司独特数据和应用场景所需工具。IBM 还为未来能够自我指导、反思并在动态商业环境中执行复杂任务的人工智能代理铺平了道路。

IBM 仍在不断改进其人工智能助手技术产品组合——从 watsonx Orchestrate 开始,帮助企业通过低代码工具和自动化构建自己的助手,到一系列预先构建的特定任务和领域的助手,例如客户服务、人力资源、销售和市场营销。世界各地的组织已经使用 watsonx Assistant 帮助他们为诸如回答客户或员工的常规问题、现代化其主机系统和遗留 IT 应用程序、帮助学生探索潜在的职业道路或为购房者提供数字按揭支持等任务构建人工智能助手。

今天IBM也揭开了即将发布的版本的序幕沃森X代码助理下一代版本由Granite代码模型驱动,提供跨语言(如C、C++、Go、Java和Python)的通用编码辅助,并具备企业级Java应用程序现代化高级功能。6Granite的代码功能现在也可以通过Visual Studio Code插件访问。IBM Granite.Code.

IBM也计划发布帮助开发者的全新工具通过watsonx.ai更高效地构建、自定义和部署AI——包括代理框架、与现有环境的集成以及用于常见用例(如RAG和代理)的低代码自动化。7

IBM专注于开发具有更高自主性、复杂推理和多步问题解决能力的AI代理技术。Granite 3.0的初始发布8B该模型功能支持关键代理能力,例如高级推理和高度结构化的聊天模板及提示风格,以实现工具使用的工作流程。IBM还计划在IBM watsonx Orchestrate中引入一个新的AI代理聊天功能,该功能利用代理能力来协调AI助手、技能和自动化,帮助用户提高团队的生产效率。8IBM计划在2025年继续在其产品组合中构建代理功能,包括为特定领域和用例预建的代理。

扩展了由人工智能驱动的交付平台,以增强IBM咨询师的人工智能能力 

IBM也宣布其人工智能驱动的配送平台的重大扩展,IBM咨询服务优势多模式平台包含AI代理、应用程序和可重复使用的框架等方法,可以赋能160,000名IBM顾问以更低的成本更快地为客户创造更大的价值。

作为扩展的一部分,Granite 3.0语言模型将成为Consulting Advantage的默认模型。利用Granite的性能和效率,IBM咨询公司将能够帮助最大化IBM客户生成式AI项目的投资回报。

扩展的另一个关键部分是引入IBM咨询优势云转型和管理以及IBM咨询业务运营优势。每个部分都包括特定领域的AI代理、应用程序和方法,这些都融入了IBM的最佳实践,以便IBM顾问能够帮助加速客户的云和AI转型任务,例如代码现代化和质量工程,或在财务、人力资源和采购等领域的操作转换和执行。

了解更多信息关于Granite和IBM的业务人工智能战略,请访问https://www.ibm.com/granite.

1成本计算基于IBM watsonx的每百万令牌API费用(针对开源模型)和openAI的GPT4模型费用(假设输入占80%,输出占20%)进行客户概念验证。
2 IBM Research技术论文:Granite 3.0语言模型
3 IBM Research技术论文:Granite 3.0语言模型
4 微型时间混合器:用于多变量时间序列增强零样本/少样本预测的快速预训练模型
5 评估结果发布在Granite Guardian GitHub代码库中
62024年第四季度计划可用性
72024年第四季度计划可用性
82025年第一季度计划可用性

媒体联系人:
艾米·安杰利尼
alangeli@us.ibm.com

IBM Corporation logo. (PRNewsfoto/IBM)

来源:IBM

关于《IBM 推出 Granite 3.0:为企业打造的高性能 AI 模型》的评论


暂无评论

发表评论

摘要

IBM的第三代Granite旗舰语言模型在许多学术和行业基准上可以超越或匹敌同类领先供应商提供的同样大小的语言模型,展示了强大的性能、透明度和安全性。更新后的模型还提供了更大的建模灵活性,支持外部变量和滚动预测。 推出Granite Guardian 3.0:引领负责任AI的下一个时代 作为此次发布的一部分,IBM还推出了一个新的Granite Guardian模型系列,允许应用程序开发人员通过检查用户的提示和LLM响应来实现安全护栏,以应对各种风险。它在幻觉检测方面的整体性能也与专门用于检测幻觉的WeCheck和MiniCheck模型持平。 虽然Granite Guardian模型源自相应的Granite语言模型,但它们可以与其他开源或专有的AI模型一起使用,实施防护措施。IBM还计划推出一个新的人工智能代理聊天功能到IBM watsonx Orchestrate中,该功能利用代理能力来协调人工智能助手、技能和自动化,帮助用户提高其团队的生产力。IBM计划在2025年继续在其产品组合中构建代理功能,包括为特定领域和用例预建的代理。要了解有关Granite和IBM业务AI战略的更多信息,请访问https://www.ibm.com/granite。