当我第一次写的时候—矢量数据库:闪亮物体综合症和失踪独角兽的案例Ø2024 年 3 月,该行业充斥着炒作。载体数据库被定位为下一件大事– 新一代人工智能时代必备的基础设施层。数十亿风险资金涌入,开发商争先恐后地将嵌入整合到他们的管道中,分析师屏息以待地追踪融资轮次松果,韦维阿特,色度,米尔乌斯和其他十几个。
这个承诺令人陶醉:终于,一种通过含义而不是脆弱的关键字进行搜索的方法。只需将您的企业知识转储到矢量存储中,连接法学硕士,然后观看奇迹发生。
但魔法从未完全实现。
两年过去了,现实检验已经到来:95% 投资于新一代人工智能计划的组织都看到了零可衡量的回报。而且,我当时提出的许多警告——关于矢量的局限性、拥挤的供应商格局以及将矢量数据库视为灵丹妙药的风险——几乎都按照预期发挥了作用。
当时,我质疑 Pinecone(该类别的典型代表)是否会获得独角兽地位,或者是否会成为数据库世界中“失踪的独角兽”。今天,这个问题已经以最有说服力的方式得到了回答:松果是据报道正在考虑出售,在激烈的竞争和客户流失中奋力突围。
是的,松果筹集了大笔资金并签署了招牌标志。但实际上,差异化很弱。Milvus、Qdrant 和 Chroma 等开源厂商的成本比他们低。像 Postgres 这样的现任者(与向量)而 Elasticsearch 只是添加了向量支持作为一项功能。客户越来越多地问:“当我现有的堆栈已经足够好地处理向量时,为什么要引入一个全新的数据库?”
结果是:曾经价值近十亿美元的松果现在正在寻找下家。确实是失踪的独角兽。2025 年 9 月,Pinecone 被任命为 Ash Ashutosh担任首席执行官,创始人 Edo Liberty 担任首席科学家。时机很能说明问题:领导层变动是在其长期独立性面临越来越大的压力和质疑之际发生的。
我还认为矢量数据库本身并不是最终的解决方案。如果您的用例需要精确性(就像在手册中搜索“错误 221”一样),纯矢量搜索将愉快地提供“错误 222”,因为“足够接近”。在演示中很可爱,在生产中却是灾难性的。
事实证明,相似性和相关性之间的紧张关系对于矢量数据库作为通用引擎的神话来说是致命的。
– 企业艰难地发现了语义 – 正确的方法。 –
兴高采烈地用向量替换词法搜索的开发人员很快就重新引入了与向量结合的词法搜索。期望矢量能够“正常工作”的团队最终转向元数据过滤,重新排名者以及手动调整的规则。到 2025 年,共识很明确:向量很强大,但只能作为混合堆栈的一部分。
矢量数据库初创公司的爆炸式增长从来都不是可持续的。Weaviate、Milvus(来自 Zilliz)、Chroma、Vespa、Qdrant — 每个都声称有细微的差异化,但对于大多数买家来说,他们都做了同样的事情:存储向量并检索最近的邻居。
如今,这些球员中很少有人能够突破。市场已经碎片化、商品化,并在很多方面被现有企业吞并。矢量搜索现在是云数据平台中的一个复选框功能,而不是一个独立的护城河。
正如我当时所写:区分一个矢量数据库与另一个矢量数据库将带来越来越大的挑战。这一挑战只会变得更加困难。瓦尔德,马尔科,兰斯数据库,PostgresSQL,MySQL 热波,甲骨文23c,Azure SQL,卡桑德拉,雷迪斯,新4j,单一商店,弹性搜索,开放搜索,阿帕切·索尔……这样的例子不胜枚举。
但这不仅仅是一个衰落的故事,更是一个进化的故事。在矢量炒作的废墟中,结合了多种方法优点的新范式正在出现。
混合搜索:关键字+向量现在是严肃应用程序的默认设置。公司了解到,您既需要精确性,又需要模糊性、精确性和语义性。Apache Solr、Elasticsearch、pgVector 和 Pinecone 自己的“级联检索”等工具都支持这一点。
图RAG:2024/2025 年末最热门的流行词是 GraphRAG — 图增强检索增强生成。通过将向量与知识图结合起来,GraphRAG 对实体之间的关系进行编码,而仅靠嵌入就可以扁平化实体之间的关系。回报是巨大的。
亚马逊的人工智能博客引用了来自的基准利特里亚,混合 GraphRAG 将金融、医疗保健、工业和法律领域的测试数据集的答案正确率从约 50% 提高到 80% 以上。
的GraphRAG 工作台基准测试(2025 年 5 月发布)在推理任务、多跳查询和领域挑战方面对 GraphRAG 与普通 RAG 进行了严格评估。
安RAG 与 GraphRAG 的 OpenReview 评估发现每种方法都有各自的优势,具体取决于任务 - 但混合组合通常效果最佳。
FalkorDB 的博客报告当模式精度很重要(结构化域)时,GraphRAG 在某些基准测试中可以比向量检索高出约 3.4 倍。
GraphRAG 的兴起强调了一个更重要的观点:检索不是关于任何单个闪亮的对象。这是关于构建检索系统– 分层、混合、上下文感知的管道,可以在正确的时间以正确的精度为法学硕士提供正确的信息。
结论是:矢量数据库从来就不是奇迹。它们是搜索和检索发展过程中的重要一步。但它们不是、也从来不是结局。
这个领域的赢家不会是那些将矢量作为独立数据库出售的人。他们将把矢量搜索嵌入到更广泛的生态系统中——将图形、元数据、规则和上下文工程集成到有凝聚力的平台中。
换句话说:独角兽不是矢量数据库。独角兽是检索堆栈。
统一数据平台将包含矢量图+图:预计主要数据库和云供应商将提供集成检索堆栈(矢量+图形+全文)作为内置功能。
“检索工程”将成为一门独特的学科:正如 MLOps 的成熟一样,围绕嵌入调整、混合排名和图构建的实践也将成熟。
元模型学习更好地查询:未来的法学硕士可能学习协调每个查询使用哪种检索方法,动态调整权重。
时态和多模态 GraphRAG:研究人员已经将 GraphRAG 扩展为具有时间感知能力(T-GRAG)和多模式统一(例如连接图像、文本、视频)。
开放基准和抽象层:类似的工具基准QED(用于 RAG 基准测试)和 GraphRAG-Bench 将推动社区走向更公平、可比较的测量系统。
矢量数据库故事的弧线遵循一条经典路径:普遍的炒作周期,随后是内省、修正和成熟。到 2025 年,矢量搜索不再是每个人盲目追求的闪亮对象,而是现在更复杂、多管齐下的检索架构中的关键构建块。
最初的警告是正确的。纯粹基于向量的希望常常会在精度、关系复杂性和企业限制的浅滩上崩溃。然而,这项技术从未被浪费:它迫使业界重新思考检索,融合语义、词汇和关系策略。
如果我要在 2027 年写续集,我怀疑它不会将矢量数据库视为独角兽,而是将其视为传统基础设施——基础设施,但会因更智能的编排层、自适应检索控制器和动态选择的人工智能系统而黯然失色。其中检索工具适合查询。
到目前为止,真正的战斗不是矢量与关键词的较量,而是构建检索管道的间接、混合和规则,这些管道能够可靠地将新一代人工智能建立在事实和领域知识的基础上。这就是我们现在应该追逐的独角兽。
Amit Verma 是该公司的工程和人工智能实验室负责人神经元7。