人工智能基础设施路线图：2026 年的五个前沿领域

第一代人工智能基础设施公司解锁了智能的“大脑”。下一代将把这些智能引擎释放到现实世界中。

第一代人工智能是为一个模型即产品的世界而构建的，进步意味着更大的权重、更多的数据和出色的基准。人工智能基础设施反映了这一现实，推动了基础模型、计算能力、训练技术和数据操作领域巨头的崛起。这是我们的重点2024年人工智能基础设施路线图，这推动了我们对以下公司的投资人择,法尔人工智能,超级专家（获得者：光标），以及虚拟API随着人工智能基础设施革命的展开。

但情况已经发生了变化。大型实验室正在超越追逐基准收益，转向设计与现实世界交互的人工智能，而企业也正在从概念验证转向生产。让我们走到这一步的基础设施（针对规模和效率进行了优化）不会让我们进入下一阶段。现在需要的是使人工智能扎根于操作环境、现实世界经验和持续学习的基础设施。

新一波人工智能基础设施工具的舞台正在搭建，以使人工智能能够在现实世界中运行。我们确定了定义下一波浪潮的五个前沿领域，每个前沿领域都解决了模型扩展之外需要解决的结构性限制。

下一代人工智能基础设施的五个前沿领域

1.“利用”基础设施

随着人工智能部署从单一模型转向复合系统，旨在“利用”模型（释放其全部潜力）的基础设施变得比以往任何时候都更加重要。

以内存和上下文管理为例。大多数企业人工智能系统都患有组织失忆症。虽然基本的检索增强生成（RAG）解决了模型和数据源之间的连接问题，但复合人工智能系统现在需要更复杂的内存基础设施。企业拥有大量历史数据和组织知识（从专有文档到 CRM 记录），人工智能系统必须访问这些数据和组织知识，以避免出现幻觉并立足于公司特定的现实。

可靠的人工智能部署不仅取决于原始模型的能力，还取决于知识检索、跨会话上下文管理和规划等组件的编排。随着模型商品化，差异化转移到记忆和上下文层。开发人员曾经从头开始构建的内容（自定义矢量数据库和检索系统）现在正在成为自己的基础设施类别。初创公司和大型科技公司同样如此现在提供即插即用的语义层，可以维护对话上下文、用户偏好和跨会话的长期记忆。

新颖的评估和可观察性提出了另一个关键的基础设施挑战——以前的软件开发范例中不存在这一挑战。考虑将对话式人工智能代理投入生产的团队。传统监控跟踪完成率、延迟、错误代码和赞成/反对反馈。但对话式人工智能却以不同的方式失败了。当聊天机器人给出自信的错误答案，逐渐偏离用户的实际问题，或者在产生看似合理的内容时误解了请求，用户通常不会做出反应。没有抱怨，没有反对，没有错误信号。对话在仪表板上看起来很好，但人工智能却悄然失败了。

估计78% 的人工智能故障是看不见的– 人工智能出了问题，但没有人发现。不是用户，不是传统的监控，甚至不是情绪分析。这些失败聚集成重复出现的模式：

信心陷阱– 人工智能肯定是错误的，用户接受它
漂移– 人工智能逐渐回答与所提出的问题不同的问题
沉默的不匹配– AI 会产生误解，但会产生足够合理的结果，让用户不会反驳

即使使用更强大的模型，这些模式在 93% 的情况下仍然存在，因为它们源于交互动态——模型如何呈现输出以及用户如何传达意图——而不是能力差距。

新的基础设施正在兴起来解决这个问题。平台如Bigspin.ai不仅提供部署前测试，还根据黄金数据集和用户反馈提供模型输出的实时生产监控。我们还利用新平台，超越传统分析，转向语义指标智囊团和判断实验室，以及诸如法学硕士法官之类的技术，这些技术正在兴起，用于高质量评估和指标定义。

这些例子说明了人工智能利用基础设施不断变化的需求。有关环境、运行时、编排、协议和框架的更多信息，请参阅我们的软件3.0路线图。2. 持续学习系统

当今的人工智能模型面临着一个根本性的限制：冻结的权重阻碍了部署后的真正学习。

虽然诸如压缩之类的上下文管理策略非常强大，而且我们看到许多大型实验室将它们用于长期运行的代理，但上下文学习只能通过死记硬背实现表面水平的适应，而不是获得新技能。随着上下文的增长，它也会变得极其昂贵，因为 KV 缓存会随着上下文的增加而线性扩展。从技术和经济角度来看，构建能够记住一切并在多年使用中不断改进的人工智能系统是不可行的。

这就是持续学习提供解决方案的地方。它使人工智能能够随着时间的推移积累跨任务的知识和技能，在保持早期能力的同时获得新能力。与一次性训练并静态部署的传统模型不同，持续学习系统在生产中不断发展，每次交互都变得更加智能，同时避免灾难性遗忘。研究人员和从业者正在通过培训前和培训后阶段的创新来实现这一目标。

架构方法从根本上重新思考模型如何学习：

学习机正在构建像人类一样在推理过程中不断学习的模型。通过新的架构和训练范式，模型将掌握“如何学习”的元技能，从而能够在部署后适应个人用户和企业
Core Automation 正在从根本上重新思考 Transformer 架构，以构建新的注意力机制中自然产生记忆的系统
斯坦福大学和 Nvidia 的 TTT-E2E使用滑动窗口 Transformer，在测试时通过对其上下文的下一个标记预测继续学习，并将该上下文压缩到其权重中。在训练过程中，模型学习如何在推理时更好地更新自己的权重，使该方法成为端到端的

近期的生产就绪解决方案也正在出现：

– 墨盒 – 方法将长上下文存储在小型 KV 缓存中，离线训练一次，然后在推理过程中在不同的用户请求中重复使用
次线性系统和基础模型实验室正在竞相通过新技术解决环境限制

我们看到的持续学习方法范围广泛，从可以完全重新定义该领域的高风险架构登月计划，到逐步改进现有变压器的生产就绪技术。我们渴望见到各个领域的创始人。

持续学习的生产部署需要新的治理原语，而标准机器学习工作流程中尚不存在这些原语。当更新引入回归时，回滚机制可以恢复到稳定的检查点，需要对权重、数据和超参数进行完整的沿袭跟踪。隔离技术允许安全实验而不影响核心功能。除了大海捞针测试之外，创建基准来衡量持续学习系统与情境学习的性能也至关重要。

3.强化学习平台

由于数据质量从根本上决定了人工智能的能力，“垃圾输入，垃圾输出”这一古老的机器学习公理变得尤为重要。数据平台如默科,图灵, 和微1通过调动人类专业知识创建高质量的数据集，在人工智能革命的第一波浪潮中发挥了重要作用。但我们认为，随着人工智能系统从模式识别发展到自主决策，一个关键的限制已经出现：人类生成的标记数据不再足以实现生产级人工智能。它无法教会人工智能系统如何处理具有延迟后果和复杂决策的复杂、多步骤任务。

这就是强化学习 (RL) 变得至关重要的地方，因为 AI 必须通过交互而不是静态数据集进行学习，才能让 AI 扎根于“经验”。现在，利用 RL 堆栈已成为 AI 基础工具的基石，可以教授代理复杂的行为，而无需承担现实世界试错的成本和风险。这个新兴堆栈中的平台包括：

环境营造与体验策划	定制实验室,深调,舰队, 栖息地,矩阵,机械化、开放奖励,菲尼蒂,偏好模型,近端，萼片人工智能,稳定工作，维里斯,最大电压
强化学习即服务	应用计算,CGFT,� 梅蒂斯,� 渗透作用，轨迹
平台基础设施	敏捷RL,平视显示器,伊西多尔,开放管道,原始智力,修补匠

4. 推理拐点

模型部署和推理优化成为我们 2024 年路线图中的关键基础设施层，届时供应商喜欢法尔,一起,巴斯坦, 和烟花开创了高效的服务解决方案。当时，资本密集型模型训练消耗了整个人工智能堆栈的大部分计算资源。今天，我们正在见证计算重心的根本性转变。随着人工智能代理和应用程序从原型过渡到大规模生产，推理工作负载现在在计算需求和经济重要性方面都可以与培训相媲美，并且在许多情况下超过培训。作为 NVIDIA 的黄仁勋在 GTC 2026 主题演讲中表示，“人工智能终于能够做富有成效的工作，因此推理的拐点已经到来。”

这一拐点反映了一个成熟的市场，运行人工智能系统的成本和性能与构建它们的初始投资一样重要。

新一代基础设施初创公司正在通过整个推理堆栈的专门优化来解决这一生产需求。公司喜欢张量网格正在利用LM缓存消除冗余的重新计算，方舟正在推进基于 SGLang 的多轮对话路由和调度，以及因弗拉克特正在突破 vLLM 性能极限以实现高吞吐量服务。吉姆莱特实验室甚至超大规模企业也喜欢英伟达正在致力于专门为复杂代理系统构建的异构推理创新。这些创新将尖端系统研究转化为可衡量的生产收益：更快的响应时间和更低的成本。

我们还看到了新颖部署的推理创新，边缘和设备上就是一个典型的例子。随着人工智能渗透到从机器人到消费者的所有经济领域，人工智能部署需要满足用户的需求，而这并不总是基于云。我们看到这样的公司网络人工智能,毫微微人工智能,极地网格,Aizip Mirai, 和开放推理构建消费设备中人工智能部署的最“边缘”。来自模型供应商的设备创新，例如感知器对于物理人工智能也很重要，我们对这个领域有更多的期望，正如我们在我们对智能机器人的思考。

边缘人工智能对于国防等行业也至关重要，通讯被堵塞或被拒绝的地方；公司如涡轮一号,统治动态,微微网格, 和断路器正在带头为战士提供基础设施工具，即使在最严峻的环境下也能利用人工智能的力量。

5. 世界模型

模型层是人工智能基础设施堆栈中最具活力、竞争最激烈的层之一。虽然法学硕士已经接管了语言智能，但一类新的模型——世界模型——已经出现，为物理世界提供智能。

随着人工智能从我们的屏幕转移到我们的物理现实，新的挑战出现了：如果人工智能“大脑”没有“身体”，它如何发展对物理和世界的直觉？世界模型提供了一个解决方案。这些人工智能系统的核心是接受真实世界数据（视频、传感器、GPS 等）的训练，学习预测世界在当前情况和行动下如何演变。他们不是描述现实，而是模拟现实。

在这项最新的研究中，出现了三种广泛的架构范式。在实践中，公司也开始探索将每种元素结合起来的混合体：

基于视频的世界模型来自诸如雷卡和迪卡特将问题视为视频生成之一，直接在像素空间中预测未来的帧。由于它们逐步生成输出，因此可以实时操作并动态响应新输入，从而非常适合交互式环境。尽管他们仍然难以在更长的时间内保持物理一致性，但他们产生了视觉上引人注目的输出
显式 3D 表示模型来自诸如世界实验室采用不同的路径，构建持久的 3D 场景表示，以较低的推理成本提供强大的空间连贯性。目前，这些环境是预先生成的且静态的，但 World Labs 已表示实时交互性已在其路线图上
潜在预测模型，基于联合嵌入预测架构（JEPA）AMI 实验室，通过预测压缩潜在空间中的未来状态来完全避免像素生成。这种方法的计算效率显着提高，并且回避了许多视觉故障模式，但可解释性降低。虽然每种范式都取得了有意义的进展，但仍然存在重要差距——如何解决这些问题将决定世界模型更广泛商业化的道路

对于世界模特来说，这种商业机会是巨大的。我们最近分享了我们的观点机器人技术的世界模型，因为该领域一直是最引人注目的早期应用之一。通过生成无限的合成训练环境，世界模型解决了数十年来一直困扰物理人工智能的数据稀缺问题。自动驾驶正在证明这一点，Waymo 和 Wayve 使用世界模型来模拟罕见的边缘情况，而现实世界中的测试程序无法经济地复制这些情况。相同的核心功能可以释放更多功能，例如国防、医疗保健、工业运营和企业规划中的高风险模拟。

世界模型不是一种特定于垂直领域的工具——它们是机器智能的新基础，类似于法学硕士对基于文本的推理所做的工作。早期建立在它们之上的行业将在部署在现实世界中工作的代理方面取得显着的领先优势。我们对构建架构和模拟器的公司感到兴奋，这些架构和模拟器使跨行业的世界模型成为可能。

构建人工智能体验和进入现实世界的基础设施

虽然第一代人工智能基础设施公司构建了智能引擎（证明人工智能能力的模型、计算集群和训练管道），但下一代必须构建神经系统和工具，使人工智能能够在现实世界中感知、记忆、适应和持续运行。这些前沿不仅仅代表了对现有基础设施的渐进式改进。在这些空间中建设的公司不仅仅是优化延迟或降低成本；他们正在解决将令人印象深刻的演示与创造持久价值的可靠系统区分开来的基本挑战。

我们相信 2026 年将是 AI 基础设施重心发生明确转移的一年，届时将重新构想今年及以后的 AI 原生运营。我们特别高兴能与追求这些目标的创始人合作。如需与我们联系，请联系 aiinfra@bvp.com。

^{免责声明：此处提供的信息仅用于一般信息和教育目的，并不构成投资建议、推荐或购买或出售任何证券或投资产品的要约或招揽。根据《投资顾问法》，所提供的信息也无意作为广告材料。所讨论的某些公司可能是现任或前任的投资组合公司。BVP 可能仍拥有这些公司的经济利益。对特定公司、证券或投资策略的任何讨论不应被视为采取任何特定行动的建议。过去的表现并不代表未来的结果。所有投资均涉及风险，包括可能损失本金。市场状况和投资回报可能会大幅波动。请访问 https://www.bvp.com/legal 了解更多信息。}

OC

人工智能基础设施路线图：2026 年的五个前沿领域

第一代人工智能基础设施公司解锁了智能的“大脑”。下一代将把这些智能引擎释放到现实世界中。

下一代人工智能基础设施的五个前沿领域

1.“利用”基础设施

当今的人工智能模型面临着一个根本性的限制：冻结的权重阻碍了部署后的真正学习。

3.强化学习平台

4. 推理拐点

5. 世界模型

构建人工智能体验和进入现实世界的基础设施

关于《人工智能基础设施路线图：2026 年的五个前沿领域》的评论

发表评论

摘要

相关新闻

相关讨论