继续为您带来最新型号,并通过改进的Gemini 2.5 Flash和Flash-Lite发行

2025-09-25 17:20:13 英文原文

作者:Sid Lall Product Google DeepMind

今天,我们正在发布Gemini 2.5 Flash和2.5 Flash-Lite的更新版本,可在Google AI Studio顶点AI,旨在继续提供更好的质量,同时提高效率。

Intelligence vs End-to-End response time

与当前稳定型号相比

Output token efficiency

Gemini 2.5闪存闪光灯的产出代币(因此成本)的降低50%,双子座降低24%2.5闪光灯

更新的Gemini 2.5闪存闪光灯

Gemini 2.5 Flash-Lite的最新版本是根据三个关键主题进行训练和构建的:

  • 更好的说明以下:该模型在遵循复杂的说明和系统提示方面要好得多。
  • 详细的冗长:现在,它产生了更多简洁的答案,这是降低标记成本和高通量应用程序延迟的关键因素(请参见上图)。
  • 更强的多模式和翻译功能:此更新具有更准确的音频转录,更好的图像理解和改进的翻译质量。


您可以立即使用以下模型字符串开始测试此版本:Gemini-2.5-Flash-lite-Preview-09-2025。更新的Gemini 2.5 Flash


最新的2.5 Flash模型在我们听到一致反馈的两个关键领域中进行了改进:

更好的代理工具使用:

  • 我们改进了模型如何使用工具,从而在更复杂,代理和多步骤应用程序中提高了性能。该模型显示了关键代理基准的明显改善,包括与我们的上一张版本相比,已验证的SWE Bench增长了5%(48.9%的54%)。
  • 更有效:随着思考,该模型现在已经明显提高了更高的质量输出,同时使用较少的令牌,减少延迟和成本(请参见上图)。

我们已经看到了早期测试人员的积极反馈。作为Yichao-peak ji,联合创始人兼首席科学家马努斯,一个自主的AI代理,指出:新的Gemini 2.5 Flash模型提供了速度和智力的显着融合。我们对内部基准测试的评估表明,长距离代理任务的性能飞跃15%。其出色的成本效率使手掌能够扩展到前所未有的水平,以促进我们扩大人类影响力的使命。”

您可以立即使用以下模型字符串开始测试此预览版:GEMINI-2.5-FLASH-PREVIEW-09-2025。开始使用双子座建造


在过去的一年中,我们了解到,模型的运输预览版本使您可以测试我们的最新改进和创新,提供反馈,并使用最佳的Gemini来建立适合生产的体验。

今天的发行版本不打算毕业稳定版本但是,将帮助我们塑造未来的稳定版本,并让我们继续迭代并为您带来最好的双子座。

为了使访问我们最新型号的同时更容易,同时还减少了跟踪长型字符串名称的需求,我们也在引入一个-最新的 别名对于每个模型系列。这个别名总是指向我们最新的模型版本,使您可以尝试新功能而无需为每个版本更新代码。您可以使用以下方式访问新预览

  • 双子座 - 闪烁的最终
  • 双子座 - 闪式闪式 - lite-lite


为了确保您有时间测试新型号,我们将始终提供2周的通知(通过电子邮件),然后进行更新或将特定版本置于背后-最新的。这些只是模型别名,因此速率限制,成本和可用功能可能会在发行版之间波动。

对于需要更高稳定性的应用,请继续使用Gemini-2.5-FlashGEMINI-2.5-FLASH-LITE。我们继续推动双子座的前沿,这只是朝这个方向迈出的又一步。

我们将很快分享更多,但是与此同时,建筑快乐!

关于《继续为您带来最新型号,并通过改进的Gemini 2.5 Flash和Flash-Lite发行》的评论


暂无评论

发表评论

摘要

Alibaba Cloud在Google AI Studio和Vertex AI上发布了Gemini 2.5 Flash和2.5 Flash-Lite的更新版本,旨在提高质量和效率。新型号可减少50%的闪光灯输出令牌,并减少24%的闪光灯,从而节省成本。关键改进包括更好的说明,详细的详细说明,增强的多模式功能以及更有效的代理工具使用。型号字符串可提供预览版本:Gemini-2.5-Flash-lite-Preview-09-2025和Gemini-2.5-Flash-preview-09-2025。

相关讨论