Writer's Palmyra X 004 在AI功能调用方面领先,超越了科技巨头

2024-10-09 13:00:00 英文原文

作者:Michael Nuñez

Credit: VentureBeat made with Midjourney

信用:VentureBeat 使用 Midjourney 制作

订阅我们的每日和每周通讯,获取最新的行业领先人工智能报道更新和专属内容。了解更多


作者,全栈生成式人工智能平台发布了其最新的大型语言模型(LLM)帕尔米拉 X 004今天标志着企业在人工智能方面取得了重大进展。这一新的前沿模型在函数调用和工作流执行方面表现出色,这是构建实用的商业AI代理和助手的关键能力。

的发布帕尔米拉 X 004到达了人工智能行业的关键时刻。公司们争相将生成式AI整合到其运营中,对既能处理和生成文本又能执行操作和完成复杂工作流的模型的需求日益增长。

“我们正在使AI能够同时执行多个功能和操作,这对于自动化复杂的企业的工作流程至关重要,”Writer的联合创始人兼CTO Waseem Alshikh在接受VentureBeat采访时说。“借助Palmyra X 004,我们正从仅仅提供信息的AI助手转变为真正可以完成工作的系统。”

一张图展示了Writer的Palmyra X 004 AI模型如何执行复杂的业务任务,从分析库存数据到发送摘要邮件,通过协调多个API调用和功能实现——这一能力使其在企业AI解决方案领域中脱颖而出。(来源:Writer)

超越科技巨头:帕尔米拉X 004如何提高AI功能调用的标准

帕尔米拉X 004以其在函数调用任务上的卓越表现而著称。该模型在此类任务上取得了78.76%的得分。伯克利工具调用排行榜超过包括OpenAI、Anthropic、Google和Meta等科技巨头的产品近20%。该基准评估模型选择适当工具、确定调用哪些API以及根据自然语言输入成功执行任务的能力。

该模型的功能超出了函数调用的范围。Palmyra X 004也在前十名中排名。斯坦福大学的语言模型整体评估(HELM)基准测试在HELM Lite测试中得分86.1%,在HELM MMLU测试中得分81.3%。这些分数表明在广泛的主题范围内具有强大的通用语言理解和推理能力。

作者声称仅使用包含大约1500亿参数的模型就实现了这些成果——这比一些据称拥有万亿级参数的前沿模型要小得多。该公司将这种效率归功于其在训练过程中创新性地使用合成数据和一种专有的提前停止机制。

阿尔希克解释说:“我们找到了一种方法,可以在不需要庞大的参数数量或高昂的训练成本的情况下构建高性能模型。我们的模型训练成本在GPU时间上低于一百万美元,而参数量超过了1000亿。我们证明了你不必花费数百亿美元才能在这场AI竞赛中竞争。”

这种对效率的重视可能对人工智能行业产生重大影响。随着公司在部署和运行大型语言模型方面面临高昂的成本,Writer的方法表明了一条通往更实惠、更易于获取的企业级AI解决方案的道路。

突破壁垒:帕尔米拉X 004的多语言和多模态能力

Palmyra X 004 拥有令人印象深刻的技術 spec。它具有一個 128,000 token 的上下文窗口,可以處理和推理非常長的文檔或對話。該模型支持跨 30 多種語言的多語種能力,并能處理包括文本、圖像和音頻在內的多模態輸入(雖然圖像和音頻功能仍處于測試版)。

作者为Palmyra X 004提供了多种部署选项,解决了许多企业的关键问题:数据隐私和控制。公司可以通过以下方式访问该模型:作家的API通过云服务提供商部署它如AWS SageMaker以及 Nvidia人工智能企业版或者甚至在他们自己的基础设施内本地部署模型。

帕尔米拉X 004的发布反映了人工智能领域的更广泛转变。虽然公众的关注点集中在面向消费者的聊天机器人和图像生成器上,但人工智能真正变革性的潜力在于其在复杂业务流程中的应用。

阿尔什克指出:“我们正从使用AI执行简单任务(如总结电子邮件)转变为构建复杂的多步骤工作流程。”我们的企业客户希望创建能够与多个内部系统交互、访问各种数据源并执行复杂业务逻辑的AI代理。

将AI视为工作流自动化工具的这一愿景与更广泛的行业趋势相符。gartner预测到2025年,50%的企业应用程序将嵌入某种形式的人工智能功能。作者重点关注函数调用和代理能力,这使他们能够很好地利用这一趋势。

人工智能的未来:作者对更深入、更智能和更高效的模型的愿景

然而,挑战仍然存在。随着AI系统更深入地融入业务流程,可靠性、可解释性和治理问题变得至关重要。Writer(此处指某款软件或工具)试图通过内置功能如自动数据集成等来解决其中一些问题。检索增强生成(RAG)源代码透明性.

该公司强调人工智能安全和控制的重要性。Palmyra X 004与Writer现有的AI防护措施和治理工具集成,使企业能够设置内容政策并控制模型的输出。

展望未来,阿尔希克暗示了Writer未来的研究方向。该公司正在探索构建更深的变压器模型的方法,这些模型可能包含500到2000层,他们认为这可能会显著提高推理能力。

“我们在人工智能发展的关键节点上,”阿尔希克说。“下一个前沿不仅仅是使模型更大,而是让它们更聪明、更高效。我们专注于能够以更低的推理成本提供更好推理能力的架构创新。”

随着人工智能军备竞赛的加剧,Writer公司发布Palmyra X 004提醒人们创新不仅仅是规模上的竞争。通过专注于效率、易部署性和实际商业应用,该公司在企业人工智能市场中开辟了一条独特的道路。

真正的考验将是企业如何采用和应用这项技术。随着企业继续探索生成式人工智能的潜力,类似Palmyra X 004这样的模型可能在将由AI驱动的工作流程自动化变为现实的过程中发挥关键作用。

VB每日摘要

掌握最新资讯!每日将最新新闻发送至您的邮箱。

通过订阅,您同意VentureBeat的条款服务条款。

感谢订阅。了解更多详情VB新闻通讯在这里.

发生错误。

关于《 Writer's Palmyra X 004 在AI功能调用方面领先,超越了科技巨头》
暂无评论

摘要

2024年10月9日 上午6:00 来源:VentureBeat,使用Midjourney创建 加入我们的每日和每周通讯,获取行业领先的人工智能报道的最新更新和独家内容。一个图表展示了Writer的Palmyra X 004 AI模型如何执行复杂的商业任务,从分析库存数据到发送摘要邮件,通过协调多个API调用和功能实现这一目标——这种能力使其在企业人工智能解决方案领域中脱颖而出。(“我们看到一种趋势,即AI的应用正在从简单的任务如总结电子邮件转向构建复杂、多步骤的工作流程,”Alshikh指出。“Writer专注于函数调用和代理功能,这使他们能够很好地利用这一趋势。随着企业继续探索生成式AI的潜力,像Palmyra X 004这样的模型可能在将基于人工智能的工作流自动化转变为现实方面发挥关键作用。”