新闻摘要:
NVIDIA 今天宣布推出 NVIDIA Nemotron™ 3 系列开放模型、数据和库,旨在推动跨行业透明、高效和专业的代理 AI 开发。
Nemotron 3 型号(具有 Nano、Super 和 Ultra 尺寸)实现了突破混合潜在专家混合物 (MoE)帮助开发人员大规模构建和部署可靠的多代理系统的架构。
随着组织从单模型聊天机器人转向协作式多代理人工智能系统,开发人员面临着越来越多的挑战,包括通信开销、上下文漂移和高推理成本。此外,开发人员需要透明度来信任能够自动执行复杂工作流程的模型。Nemotron 3 直接应对这些挑战,提供客户构建专业化、代理式 AI 所需的性能和开放性。
“开放式创新是人工智能进步的基础,”NVIDIA 创始人兼首席执行官黄仁勋表示。“通过 Nemotron,我们正在将先进的人工智能转变为一个开放平台,为开发人员提供大规模构建代理系统所需的透明度和效率。”
NVIDIA Nemotron 支持 NVIDIA 更广泛的主权人工智能工作,与来自以下组织的组织合作:欧洲到韩国采用开放、透明和高效的模型,使他们能够构建符合自己的数据、法规和价值观的人工智能系统。
埃森哲、Cadence、CrowdStrike、Cursor、德勤、安永、Oracle Cloud Infrastructure、Palantir、Perplexity、ServiceNow、西门子、Synopsys 和 Zoom 等早期采用者正在集成 Nemotron 系列的模型,为制造、网络安全、软件开发、媒体、通信和其他行业的人工智能工作流程提供动力。
– NVIDIA 和 ServiceNow 多年来一直在塑造人工智能的未来,而最好的尚未到来。 – ServiceNow 董事长兼首席执行官 Bill McDermott。– 今天,我们在帮助所有行业的领导者快速跟踪他们的代理人工智能战略方面向前迈出了重要一步。ServiceNow 的智能工作流程自动化与 NVIDIA Nemotron 3 相结合,将继续以无与伦比的效率、速度和准确性定义标准。
随着多智能体人工智能系统的扩展,开发人员越来越依赖专有模型进行最先进的推理,同时使用更高效和可定制的开放模型来降低成本。在单个工作流程中在前沿级模型和 Nemotron 之间路由任务可以在优化的同时为代理提供最大的智能代币经济学。
Perplexity 首席执行官阿拉文德·斯里尼瓦斯 (Aravind Srinivas) 表示:“Perplexity 的理念是,人类的好奇心将通过内置于特殊工具(例如人工智能助手)中的精确人工智能来放大。”– 借助我们的代理路由器,我们可以将工作负载引导至经过最佳微调的开放模型,例如 Nemotron 3 Ultra,或者在任务受益于其独特功能时利用领先的专有模型 – 确保我们的 AI 助手以卓越的速度、效率和规模运行。
开放的 Nemotron 3 模型使初创公司能够更快地构建和迭代 AI 代理,并加速从原型到企业部署的创新。General Catalyst、Mayfield 和 Sierra Ventures 的投资组合公司正在探索 Nemotron 3,以构建支持人类与人工智能协作的 AI 团队成员。
Mayfield 管理合伙人 Navin Chaddha 表示:“NVIDIA 的开放模型堆栈和 NVIDIA Inception 计划为早期公司提供了模型、工具和经济高效的基础设施,用于快速试验、差异化和扩展。”– Nemotron 3 为创始人提供了构建代理 AI 应用程序和 AI 团队的良好开端,并帮助他们利用 NVIDIA 庞大的安装基础。 –
Nemotron 3 高效、准确地重塑多智能体人工智能
Nemotron 3 系列教育部模型包括三种尺寸:
Nemotron 3 Nano 现已上市,是计算成本效益最高的模型,针对软件调试、内容摘要、人工智能助理工作流程和信息检索等任务进行了优化,推理成本较低。该模型使用独特的混合 MoE 架构来提高效率和可扩展性。
与 Nemotron 2 Nano 相比,该设计的令牌吞吐量提高了 4 倍,推理令牌生成量减少了 60%,从而显着降低了推理成本。Nemotron 3 Nano 具有 100 万个令牌上下文窗口,可记住更多内容,使其更准确,并且能够更好地连接长期、多步骤任务中的信息。
Artificial Analysis,一个对人工智能进行基准测试的独立组织,对模型进行排名同尺寸模型中最开放、最高效,精度领先。
Nemotron 3 Super 擅长于需要许多协作代理以低延迟完成复杂任务的应用程序。Nemotron 3 Ultra 作为需要深入研究和战略规划的人工智能工作流程的高级推理引擎。
Nemotron 3 Super 和 Ultra 在 NVIDIA Blackwell 架构上使用 NVIDIA 的超高效 4 位 NVFP4 训练格式,显着降低了内存需求并加快了训练速度。这种效率允许在现有基础设施上训练更大的模型,而不会影响相对于更高精度格式的准确性。
借助 Nemotron 3 系列模型,开发人员可以选择适合其特定工作负载大小的开放模型,从数十个代理扩展到数百个代理,同时受益于针对复杂工作流程的更快、更准确的长期推理。
用于人工智能代理定制的新开放工具和数据
NVIDIA 还发布了一系列训练数据集和最先进的强化学习库,可供构建专业 AI 代理的任何人使用。
新 Nemotron 的 3 万亿代币预训练,培训后和强化学习数据集提供了创建高性能、领域专业代理所需的丰富推理、编码和多步骤工作流程示例。的Nemotron 代理安全数据集提供真实世界的遥测数据,帮助团队评估和加强复杂代理系统的安全性。
为了加速开发,NVIDIA 发布了尼莫健身房和尼莫RL开源库,为 Nemotron 模型提供训练环境和训练后基础,以及 NeMo Evaluator 来验证模型的安全性和性能。所有工具和数据集现已在 GitHub 和 Hugging Face 上提供。
Nemotron 3 支持LM工作室, 骆驼.cpp,西格朗和法学硕士。此外,主要智力和不懒惰正在将 NeMo Gym 的即用型培训环境直接集成到其工作流程中,让团队更快、更轻松地获得强大的强化学习培训。
开始使用 NVIDIA 开放模型
Nemotron 3 Nano 现已上市抱脸并通过推理服务提供商,包括巴斯坦,深基础设施,烟花,友爱科技,开放路由器和一起人工智能。
Nemotron 在企业人工智能和数据基础设施平台上提供,包括 Couchbase、DataRobot、H2O.ai、JFrog、Lambda 和 UiPath。对于公共云上的客户,Nemotron 3 Nano 将通过 Amazon Bedrock(无服务器)在 AWS 上提供,并受到 Google Cloud、CoreWeave、Crusoe、Microsoft Foundry、内比乌斯、Nscale 和 Yotta 很快就会出现。
Nemotron 3 Nano 可作为NVIDIA NIM™ 微服务在 NVIDIA 加速的基础设施上的任何地方进行安全、可扩展的部署,以实现最大程度的隐私和控制。
Nemotron 3 Super 和 Ultra 预计将于 2026 年上半年上市。