英语轻松读发新版了,欢迎下载、更新

AWS是第一个也是唯一的云提供商,可以为作者提供新的自适应推理模型Palmyra X5

2025-04-28 17:42:39 英文原文

作者:Amazon Staff

Palmyra X5的开发是为了有效地为多步代理提供动力的开发,可通过作家和Amazon Bedrock作为完全管理的模型提供。

AWS announces Writer's Palmyra X5 available in Amazon Bedrock

亚马逊网络服务(AWS)宣布了Palmyra X5的可用性,一种新的,最先进的自适应推理模型,在亚马逊基岩中有100万个令牌上下文窗口。Palmyra X5由企业生成AI的领导者作家发行,是第一个具有此大小的上下文窗口之一,可以在Amazon Bedrock中使用。为速度和成本效率进行了优化,它使客户能够构建高级,多步AI代理,并以精确的方式改变他们在大量企业数据上的推论。AWS是第一个也是目前唯一的云提供商,可以从作者那里提供完全管理的无服务器模型,包括新的Palmyra X5和Palmyra X4,并很快提供了其他模型。

Sound waves in motion. An Amazon Nova logo is in the center of the image.

随着生成AI的继续加速,客户需要广泛的模型才能选择最适合其需求的模型。在亚马逊基岩中增加了作家,扩大了已有最广泛的托管模型,可从领先的AI公司供客户轻松,安全地构建和扩展生成的AI应用程序,这些应用程序可以改变并帮助他们在企业中进行创新。

Palmyra X5是Amazon Bedrock中第一个可用的1M上下文窗口模型之一,进一步扩展了AWS客户可用的选项。(上下文窗口是模型可以处理的信息的数量,并且记住每个输入或请求。它在令牌中测量了模型可以处理的文本的最小单元,并且可以被认为是模型的“短期内存”)。使用这种大小的上下文窗口,Palmyra可以准确处理1500页的内容,相当于约6本书。它也是该行业最早可用的自适应推理模型之一。该模型将高级大语言模型(LLM)的功能与扩展的内存和处理能力相结合。企业现在可以解决远程任务的财务报告,法律合同分析,医疗纪录合成,客户反馈挖掘等,而无需打破预算。

除了其推理能力外,Palmyra X5还提供了能够与系统相互作用,高级代码生成和部署以及在30多种语言中进行多种语言支持的能力。

认识AI:什么是Palmyra x5

如果Palmyra X5是一个人,他们将具有超人的能力,可以在22秒内阅读100万个单词,并立即产生可行的见解。他们是团队成员,不仅纪念了200页的战略文档中的所有内容,而且还了解与昨天的客户会议和上一季度财务业绩的关系。当面对复杂的问题时,他们可以逐步通过解决方案进行有条不紊的工作,从而在途中清楚地解释他们的思维过程,无论他们是否有助于分析大量客户反馈以识别常见主题或对技术问题进行故障排除。

A screenshot of Generative BI with Amazon Q in Quicksight Getting Started.

直接从Palmyra X5上的作家和AWS直接

“我们之所以选择AWS作为第一个从作家那里提供完全管理模型的主要云提供者,因为它的安全性无与伦比,我们共同改变了企业如何利用AI来推动创新和成长的愿景,”作家CTO和共同创始人Waseem Alshikh说。系统。

“基于我们与作家的强大战略合作,AWS很高兴能通过基岩提供作家的Palmyra模型家族,为世界各地的组织提供了一个新的代理创新时代。”开发人员和企业旨在建立和扩展AI代理商,并改变他们如何在大量企业数据上利用AWS的安全性,可扩展性和性能。”

  • Palmyra X5是市场上最有效的大型LLM之一,以速度和成本进行了优化。Palmyra X5可以在约22秒内吸收全百万个token提示,并且可以在〜.3秒内返回单个功能调用转盘
  • Palmyra X5在最新的Longbench V2评估中表现出一流的得分与成本比率,平均得分令人印象深刻。企业的准确性接近最高的准确性,同时支付的价格明显减少,使得无需违反预算,就可以实现大量的代理和长篇小说任务。
  • 它支持30多种语言,为全球企业提供真正的多语言功能。
  • 它的价格为每100万美元的投入令牌为0.60美元,每100万美元的产出代币$ 6,使其成为市场上最具成本效益的大背景LLM之一。
  • Palmyra X5也是BigCodebench(完整的,指导)评估中最高的模型之一,分数为48.7,展示了其处理实用和具有挑战性的编程任务的能力。

尽管生成AI正在改变我们创建,分析和与信息交互的方式,但代理AI从根本上重塑工作本身的本质。AI的下一个前沿超越内容创建和洞察力生成,使用可以独立计划,执行和适应复杂动作序列的AI代理。AWS客户可以使用Writer的模型在不管理基础架构的情况下使用Writer的模型安全地构建和扩展AI代理。对于整个行业的企业而言,Palmyra X5尤其令人兴奋的是,他们可以构建和部署更复杂的AI代理,这些AI代理需要大量数据,包括访问其他代理,LLM和外部系统中的工具。

A man looks at a board of computer chips.

作家将精确的,完全拥有的模型运行,这些模型从未经过训练后的量化或蒸馏,因此您今天验证的行为是您明天会看到的行为。Palmyra X5以严格的向后兼容性为基础,以备用团队重新调整流量的痛苦,这是客户可以影响的发表的企业路线图,并使潜伏期优化的推理使LLM相互作用并使LLM互动和检索型发电(RAG)甚至在百万泰式规模上都感到瞬间。

Writer宣布,由于新型的变压器设计(可以同时审查输入数据而不是顺序审查输入数据)和混合注意机制(允许多种方式以多种方式专注于效率和有效性,因此它将将100万个令牌设置为其将来发行的所有LLM的最小上下文窗口大小。这意味着企业可以围绕不断扩展功能而不是受到上下文窗口的限制,可以计划其AI策略。

参观AWS新闻博客有关Palmyra X5的更多详细信息,包括如何在Amazon Bedrock和潜在用例中部署该模型,并查看亚马逊基岩的作家产品页面。

如何使用Palmyra X5和Palmyra X4

首先,访问亚马逊基岩控制台

关于《AWS是第一个也是唯一的云提供商,可以为作者提供新的自适应推理模型Palmyra X5》的评论


暂无评论

发表评论

摘要

Amazon Web Services(AWS)已推出了Palmyra X5,这是一种具有100万个令牌上下文窗口的新高级推理模型,可通过Writer和Amazon Bedrock作为完全管理的解决方案提供。Palmyra X5优化了速度和成本效率,可以创建能够处理大量企业数据的复杂多步进型AI代理。这标志着AWS是第一个从作家提供全面托管模型的云提供商,在代码生成中提供了增强的功能,跨30多种语言的多语言支持以及精确的长期任务处理而无需高昂的成本。该模型设计用于无缝集成到安全,可扩展的环境中,例如亚马逊基岩,迎合寻求创新AI解决方案的企业。