作者:Written by Jason Perlow, Senior Contributing Writer Nov. 15, 2024 at 1:07 p.m. PT
在快速发展的格局中生成式人工智能(Gen AI),大型语言模型(LLM),例如OpenAI 的 GPT-4,谷歌的杰玛,Meta 的 LLaMA 3、Mistral.AI、Falcon 等人工智能工具正在成为不可或缺的商业资产。
该领域最有前途的进步之一是检索增强生成(RAG)。但 RAG 到底是什么?它如何与您的业务文档和知识集成?
RAG 是一种将 Gen AI LLM 与信息检索技术相结合的方法。从本质上讲,RAG 允许法学硕士访问数据库、文档和其他信息存储库中存储的外部知识,从而增强他们生成准确且与上下文相关的响应的能力。
正如 Maxime Vermeir,AI 战略高级总监泰比文档处理和人工智能解决方案领域的领先公司解释道:“RAG 使您能够将向量存储与法学硕士本身相结合。这种组合使法学硕士不仅可以根据自己预先存在的知识进行推理,还可以根据您所掌握的实际知识进行推理。”通过具体提示提供更准确且与上下文相关的答案。”
另外: 为 RAG 腾出空间:Gen AI 的力量平衡正在如何转变
对于需要从大量非结构化数据源(例如 PDF、Word 文档和其他文件格式)中提取和利用特定知识的企业来说,此功能尤其重要。正如维米尔在他的博客中详细介绍的那样,RAG 使组织能够充分利用其数据的潜力,提供更高效、更准确的方式与人工智能驱动的解决方案进行交互。
传统的法学硕士接受海量数据集的训练,这些数据集通常被称为“世界知识”。然而,这种通用培训数据并不总是适用于特定的业务环境。例如,如果您的企业从事利基行业,那么您的内部文件和专有知识比一般信息更有价值。
Maxime 指出:“在为您的企业创建 LLM 时,尤其是旨在增强客户体验的 LLM 时,该模型必须深入了解您的特定业务环境,这一点至关重要。这就是 RAG 发挥作用的地方,因为它允许 LLM 访问和利用对您的组织真正重要的知识进行推理,从而针对您的业务需求做出准确且高度相关的响应。”
通过将 RAG 集成到你的人工智能策略,您确保您的法学硕士不仅仅是一个通用工具,而是一个了解您的业务运营、产品和服务的细微差别的专业助手。
RAG 的核心是向量数据库的概念。矢量数据库将数据存储在矢量中,矢量是数值数据表示。这些向量是通过称为嵌入的过程创建的,其中数据块(例如文档中的文本)被转换为法学硕士可以在需要时理解和检索的数学表示形式。
Maxime 阐述道:“使用向量数据库首先要摄取和构建数据。这涉及获取结构化数据、文档和其他信息,并将其转换为数字嵌入。这些嵌入代表数据,允许法学硕士在处理时检索相关信息。”准确查询。”
另外: 生成式人工智能的最大挑战是显示投资回报率 - 这就是原因
此过程允许法学硕士访问与查询相关的特定数据,而不是仅仅依赖其一般训练数据。因此,法学硕士生成的回答更加准确且与上下文相关,从而减少了“幻觉”(用于描述幻觉的术语)的可能性。人工智能生成的内容实际上不正确或具有误导性。
评估您的数据格局:评估您的组织生成和存储的文档和数据。确定对您的业务运营最重要的关键知识来源。
选择合适的工具:根据您现有的基础设施,您可以选择 AWS、Google、Azure 或 Oracle 等提供商提供的基于云的 RAG 解决方案。或者,您可以探索开源工具和框架允许更多定制的实施。
数据准备和结构化:在将数据输入矢量数据库之前,请确保其格式和结构正确。这可能涉及将 PDF、图像和其他非结构化数据转换为易于嵌入的格式。
实施矢量数据库:设置矢量数据库来存储数据的嵌入表示。该数据库将作为 RAG 系统的骨干,实现高效、准确的信息检索。
与法学硕士整合:将您的向量数据库连接到支持 RAG 的法学硕士。根据您的安全和性能要求,这可能是基于云的 LLM 服务或本地解决方案。
测试和优化:RAG 系统到位后,进行彻底的测试以确保其满足您的业务需求。监控表现、准确性和任何幻觉的发生,并根据需要进行调整。
持续学习和改进:RAG 系统是动态的,应该随着您的业务发展而不断更新。定期用新数据更新您的矢量数据库重新培训您的法学硕士,以确保其保持相关性和有效性。
多种开源工具可以帮助您在组织内有效实施 RAG:
浪链是一种多功能工具,通过将检索步骤集成到对话模型中来增强法学硕士。LangChain支持从数据库和文档集合中进行动态信息检索,使LLM的回答更加准确和上下文相关。
骆驼指数是一个高级工具包,允许开发人员从各种数据源查询和检索信息,使法学硕士能够有效地访问、理解和综合信息。LlamaIndex 支持复杂查询并与其他 AI 组件无缝集成。
草垛是一个用于构建可定制、生产就绪的 RAG 应用程序的综合框架。Haystack 将模型、矢量数据库和文件转换器连接到可以与数据交互的管道中,支持问答、语义搜索和对话代理等用例。
维尔巴是一个开源 RAG 聊天机器人,可简化数据集探索和见解提取。它支持本地部署以及与 OpenAI、Cohere 等 LLM 提供商的集成抱脸。Verba 的核心功能包括无缝数据导入、高级查询解析以及通过语义缓存加速查询,使其成为创建复杂 RAG 应用程序的理想选择。
凤凰专注于AI可观测与评估。它提供了诸如LLM Traces之类的工具,用于理解LLM应用程序并对其进行故障排除,以及LLM Evals用于评估应用程序的相关性和毒性。Phoenix 支持用于 A/B 测试和漂移分析的嵌入、RAG 和结构化数据分析,使其成为改进 RAG 管道的强大工具。
MongoDB是一个功能强大的 NoSQL 数据库,专为可扩展性和性能而设计。其面向文档的方法支持类似于 JSON 的数据结构,使其成为管理大量动态数据的流行选择。MongoDB 非常适合 Web 应用程序和实时分析,并且它与 RAG 模型集成以提供强大的、可扩展的解决方案。
英伟达提供一系列支持 RAG 实施的工具,包括尼莫用于构建和微调人工智能模型的框架NeMo 护栏用于向对话式人工智能系统添加可编程控件。英伟达梅林增强数据处理和推荐系统,可适用于 RAG,同时Triton 推理服务器提供可扩展的模型部署能力。英伟达的DGX平台和急流软件库它还提供处理大型数据集和嵌入操作所需的计算能力和加速,使它们成为强大的 RAG 设置中的宝贵组件。
国际商业机器公司已发布其花岗岩 3.0 法学硕士及其衍生产品Granite-3.0-8B-指令,它内置了代理人工智能的检索能力。也发布了多克林,一个 MIT 许可的文档转换系统简化流程将非结构化文档转换为 JSON 和 Markdown 文件,使法学硕士和其他基础模型更容易处理它们。
企业人工智能开放平台(OPEA):由英特尔贡献的沙盒项目,LF 人工智能与数据基金会新举措旨在为企业标准化和开发开源 RAG 管道。OPEA 平台包括用于生成人工智能系统、架构蓝图和四步评估的可互换构建块用于对性能和准备情况进行分级,以加速 AI 集成并解决 RAG 采用的关键痛点。
这超大规模云提供商提供多种工具和服务,使企业能够高效地开发、部署和扩展 RAG 系统。
亚马逊基岩是一项完全托管的服务,可提供高性能基础模型 (FM),并具有以下功能:构建生成式人工智能应用程序。Bedrock 可自动执行矢量转换、文档检索和输出生成。
亚马逊肯德拉是一项企业搜索服务,提供优化的 Retrieve API,可通过高精度搜索结果增强 RAG 工作流程。
Amazon SageMaker JumpStart提供机器学习 (ML) 中心,提供可加速 RAG 实施的预构建 ML 解决方案和基础模型。
Vertex AI 矢量搜索是一款专门构建的工具,用于以高容量和低延迟存储和检索向量,从而实现 RAG 系统的实时数据检索。
Cloud SQL 和 AlloyDB 中的 pgvector 扩展向数据库添加向量查询功能,以更快的性能和更大的向量大小增强生成式 AI 应用程序。
Vertex AI 上的浪链:Google Cloud 支持使用 LangChain 来增强 RAG 系统,将实时数据检索与丰富的 LLM 提示相结合。
使用 RAG 的 Azure 机器学习(预览版)允许通过轻松实施Azure OpenAI 服务,FAISS(向量)索引查找, 和Azure 人工智能搜索,以及用于数据分块、向量存储和无缝集成到 MLOps 工作流程的工具。
OCI 生成式 AI 代理提供 RAG 作为与 OpenSearch 集成的托管服务作为知识库。对于更多定制的 RAG 解决方案,Oracle Database 23c 中提供的 Oracle 矢量数据库可以与 Python 和 Cohere 的文本嵌入模型结合使用来构建和查询知识库。Oracle 数据库 23c
支持矢量数据类型,并有助于构建可与广泛的内部数据集交互的 RAG 解决方案,从而提高 AI 生成的响应的准确性和相关性。思科网讯
通过 RAG 将人工智能与业务知识相集成具有巨大的潜力,但也带来了挑战。成功实施 RAG 需要的不仅仅是部署正确的工具。该方法需要深入了解您的数据、仔细准备并周全地集成到您的基础设施中。
一项主要挑战是“垃圾进、垃圾出”的风险。如果输入矢量数据库的数据结构不良或过时,人工智能的输出将反映这些弱点,导致不准确或不相关的结果。此外,管理和维护向量数据库和法学硕士可能会导致 IT 资源紧张,尤其是在缺乏专门的人工智能和数据科学专业知识。
另一个挑战是抵制将 RAG 视为万能解决方案的冲动。并非所有业务问题都需要 RAG 或从 RAG 中受益,过度依赖该技术可能会导致效率低下或错失应用更简单、更具成本效益的解决方案的机会。
为了减轻这些风险,投资于高质量的数据管理非常重要,并确保您的数据干净、相关且定期更新。清楚地了解您希望通过 RAG 解决的具体业务问题并使技术与您的战略目标保持一致也至关重要。
此外,在扩大规模之前,请考虑使用小型试点项目来完善您的方法。让跨职能团队(包括 IT、数据科学和业务部门)参与其中,以确保 RAG 得到集成以补充您的整体数字化战略。