加入我们的每日和每周时事通讯,了解有关行业领先人工智能报道的最新更新和独家内容。了解更多
松果近年来,作为领先的本地矢量数据库平台之一而闻名。松果在竞争日益激烈的市场中继续保持差异化新能力帮助解决企业人工智能挑战
今天 Pinecone 宣布了对其同名产品的一系列更新矢量数据库平台。这些更新包括一种新的级联检索方法,该方法结合了密集和稀疏向量检索的优点。Pinecone 还部署了一套新的重新排名技术,旨在帮助提高矢量嵌入的准确性和效率。该公司声称,新的创新将帮助企业构建准确度提高高达 48% 的企业人工智能应用程序。
“我们正在尝试扩展到我们的核心向量数据库之外,以从根本上解决更广泛的检索挑战,”Pinecone 的产品经理 Gareth Jones 告诉 VentureBeat。
了解稠密向量和稀疏向量之间的区别
迄今为止,Pinecone 与许多其他矢量数据库技术一样,依赖于密集矢量。
琼斯解释说,密集文本嵌入模型会生成固定长度的向量,以捕获语义和上下文含义。它们对于维护上下文非常强大,但对于关键字搜索或实体查找则不那么有效。他指出,如果不进行重大微调,密集模型有时可能会难以处理电话号码、零件号和其他特定实体等概念。
相反,稀疏索引允许更灵活的关键字搜索和实体查找。Pinecone 正在添加稀疏索引来解决单独的密集向量搜索的局限性。总体目标是提供更全面的检索解决方案。
将关键字类型搜索与向量相结合的想法并不新鲜。这个概念经常被归入术语“混合搜索”之下。琼斯将新的 Pinecone 方法称为级联检索。他认为这与一般的混合搜索不同。
琼斯表示,级联检索不仅仅是并行运行密集索引和稀疏索引的简单混合方法。该方法涉及在密集和稀疏检索的基础上添加一系列级联改进,例如重新排序模型。级联方法结合了不同技术的优势,而不是仅仅对结果进行基于分数的基本融合。
重新排名如何进一步提高 Pinecone 矢量数据库的准确性
Pinecone 还通过集成一系列新的重新排序技术来提高结果的准确性。
AI 重新排序器是企业 AI 堆栈中的一个关键工具,用于优化查询结果的顺序或“排名”。Pinecone 的更新包括多个重新排名选项,包括 Cohere 最新的最先进的 Rerank 3.5 模型和 Pinecone 自己的高性能重新排名器。
通过构建自己的重新排序技术,Pinecone 的目标是在拥挤的矢量数据库市场中进一步脱颖而出。新的 Pinecone 重新排序器是该公司开发的首款重新排序器,旨在提供尽可能最佳的结果,尽管会产生一些延迟影响。根据 Pinecone 自己的分析,在使用 Benchmarking-IR (BEIR) 基准进行评估时,新的 pinecone-rerank-v0 本身可以将搜索准确性提高高达 60%。新的 pinecone-sparse-english-v0 重新排名模型有可能将基于关键字的查询的性能提升高达 44%。
这些重新排序组件的主要好处是,它们允许 Pinecone 通过组合密集索引和稀疏索引的输出来提供优化的检索结果。这对企业很重要,因为它允许他们整合检索堆栈并获得更好的性能,而无需管理多个供应商或模型。Pinecone 的目标是提供一个紧密集成的堆栈,用户可以简单地发送文本并获取重新排名的结果,而无需管理底层组件的开销。
除了平台内有更多功能之外,琼斯还强调,它是一种无服务器产品,可以帮助企业优化成本。该平台的无服务器架构可根据实际使用模式自动处理扩展。
“我们维持无服务器付费模式,”琼斯表示。“人们的应用程序流量在特定的一天看起来非常不同,无论是查询还是将文档写入索引……我们都会处理所有这些,因此他们在任何给定时间都不会过度配置。Ø