Voyage AI 正在构建 RAG 工具以减少 AI 产生幻觉 - TechCrunch

2024-10-03 13:00:00 英文原文

人工智能倾向于编造事情。这对于任何经常使用它的人来说都没有吸引力,尤其是对于企业来说,错误的结果可能会损害利润。在 Salesforce 最近的一项调查中,一半的员工表示,他们担心公司的生成式人工智能系统的答案不准确。

虽然没有任何技术可以解决这些幻觉,但有些技术可以提供帮助。例如,检索增强生成(RAG)将人工智能模型与知识库配对,在模型回答之前提供补充信息,充当一种事实检查机制。

整个企业都被由于对更可靠的人工智能的极高需求,基于 RAG 构建。Voyage AI 就是其中之一。Voyage 由斯坦福大学教授 Tengyu Ma 于 2023 年创立,为 Harvey、Vanta、Replit 和 SK Telecom 等公司的 RAG 系统提供支持。

Voyage 的使命是提高企业人工智能的搜索和检索准确性和效率,马云在接受 TechCrunch 采访时表示。Voyage 解决方案针对特定领域(例如编码、金融、法律和多语言应用程序)量身定制,并根据公司数据量身定制。

为了启动 RAG 系统,Voyage 训练 AI 模型来转换文本、将文档、PDF 和其他形式的数据转换为数字表示形式,称为向量嵌入。嵌入以紧凑的格式捕获不同数据点之间的含义和关系,这使得它们对于 RAG 等搜索相关应用非常有用。

Voyage 使用一种称为上下文嵌入的特殊类型的嵌入,它不仅捕获数据的语义意义,而不是数据出现的上下文。例如,给定句子中的“银行”一词,“我坐在河边,我把钱存入银行”,Voyages 嵌入模型将为每个银行实例生成不同的向量,反映上下文隐含的不同含义。

Voyage 托管并许可其模型供本地、私有云或公共云使用,并为选择支付此服务费用的客户微调其模型。在这方面,OpenAI 也不是独一无二的,它也提供可定制的嵌入服务,但 Ma 声称 Voyages 模型以更低的成本提供更好的性能。

在 RAG 中,给出问题或查询,我们首先检索相关信息他解释说,它是从非结构化知识库中获取的,就像图书管理员在图书馆中搜索书籍一样。传统的 RAG 方法在信息编码过程中经常会遇到上下文丢失的问题,从而导致相关信息检索失败。Voyages 嵌入模型具有一流的检索精度,这意味着 RAG 系统的端到端响应质量。

这些大胆的主张得到了 OpenAI 主要竞争对手 Anthropic 的认可;Anthropic 支持文档将 Voyages 模型描述为最先进的。

Voyages 方法使用在公司数据上训练的向量嵌入来提供上下文感知检索,Ma 说,这显着提高了检索准确性。

马云表示,总部位于帕洛阿尔托的 Voyage 仅有 250 多个客户。他拒绝回答有关收入的问题。

9 月份,拥有大约 12 名员工的 Voyage 完成了由 CRV 领投、Wing VC、Conviction、Snowflake 和 Databricks 参与的 2000 万美元 A 轮融资。马云表示,此次注入的现金使 Voyages 筹集的资金总额达到 2800 万美元,将支持新嵌入模型的推出,并使公司规模扩大一倍。

关于《Voyage AI 正在构建 RAG 工具以减少 AI 产生幻觉 - TechCrunch》
暂无评论

摘要

这对于任何经常使用它的人来说都没有吸引力,尤其是对于企业来说,错误的结果可能会损害利润。Voyage 解决方案针对特定领域(例如编码、金融、法律和多语言应用程序)以及公司数据量身定制。他解释说,在 RAG 中,给定问题或查询,我们首先从非结构化知识库中检索相关信息,就像图书管理员从图书馆搜索书籍一样。Ma 表示,Voyages 方法使用在公司数据上训练的向量嵌入来提供上下文感知检索,这显着提高了检索准确性。9 月份,拥有大约 12 名员工的 Voyage 完成了由 CRV 领投、Wing VC、Conviction、Snowflake 和 Databricks 参投的 2000 万美元 A 轮融资。