作者:Olaf Kopp
一个新的流行语正在科技界掀起波澜,它有几个名字:大型语言模型优化(LLMO)、生成引擎优化(GEO) 或生成人工智能优化 (GAIO)。
GEO 的核心是优化生成式 AI 应用程序在结果中呈现您的产品、品牌或网站内容的方式。为简单起见,我将在本文中将此概念称为 GEO。
我以前曾探索是否有可能塑造生成式人工智能系统的输出。那次讨论是我第一次涉足 GEO 主题。
从那时起,这一领域迅速发展,新的生成式人工智能应用程序引起了人们的广泛关注。现在是更深入地研究这个迷人领域的时候了。
ChatGPT、Google AI Overviews、Microsoft Copilot 等平台困惑正在彻底改变用户搜索和消费信息的方式,并改变企业和品牌在人工智能生成的内容中获得可见性的方式。
快速免责声明:该领域尚不存在经过验证的方法。
它仍然太新了,让人想起早期的日子搜索引擎优化当搜索引擎排名因素未知时,进展依赖于测试、研究以及对信息检索和搜索引擎的深入技术理解。
了解自然语言处理 (NLP) 和大语言模型(法学硕士)的功能在这个早期阶段至关重要。
扎实掌握这些技术对于识别 SEO、数字品牌建设和内容策略的未来潜力至关重要。
这里概述的方法基于我对科学文献、生成人工智能专利的研究以及十多年的语义搜索经验。
在加入 GEO 之前,必须对法学硕士背后的技术有基本的了解。
就像搜索引擎一样,了解底层机制有助于避免追逐无效的黑客或错误的推荐。
花几个小时来掌握这些概念可以避免不必要的措施,从而节省资源。
法学硕士,例如 GPT 模型、Claude 或 LLaMA,代表了搜索技术和生成人工智能的变革性飞跃。
它们改变了搜索引擎和人工智能助手处理和响应查询的方式,超越简单的文本匹配,提供细致入微、上下文丰富的答案。
根据 Microsoft 的“大型搜索模型:重新定义法学硕士时代的搜索堆栈”等研究,法学硕士在语言理解和推理方面表现出了卓越的能力,超越了简单的文本匹配,可以提供更细致的上下文响应。
法学硕士在搜索领域的核心功能是处理查询并生成自然语言摘要。
这些模型不仅可以从现有文档中提取信息,还可以生成全面的答案,同时保持准确性和相关性。
这是通过一个统一的框架来实现的,该框架将所有(与搜索相关的)任务视为文本生成问题。
这种方法特别强大的原因在于它能够通过自然语言提示定制答案。系统首先生成一组初始查询结果,LLM 会对其进行细化和改进。
如果需要其他信息,法学硕士可以生成补充查询来收集更全面的数据。
编码和解码的底层过程是其功能的关键。
编码过程
编码涉及将训练数据处理和构建为标记,这是语言模型使用的基本单位。
令牌可以代表单词、n-gram、实体、图像、视频或整个文档,具体取决于应用程序。
然而,值得注意的是,法学硕士并不是人类意义上的“理解”——他们以统计方式处理数据,而不是理解数据。
将标记转换为向量
下一步,标记将转换为向量,形成 Google Transformer 技术和基于 Transformer 的语言模型的基础。
这一突破改变了人工智能领域的游戏规则,也是当今人工智能模型广泛采用的关键因素。
向量是标记的数字表示,其中的数字捕获描述每个标记属性的特定属性。
这些属性允许向量在语义空间内进行分类并与其他向量相关,这一过程称为嵌入。
然后可以使用以下方法来测量向量之间的语义相似性和关系余弦相似度或欧几里得距离。
解码过程
解码是关于解释模型为每个可能的下一个标记(单词或符号)计算的概率。
目标是创建最合理或最自然的序列。解码时可以使用不同的方法,例如top K采样或top P采样。
可能会使用概率分数来评估后续单词。根据模型的“创意范围”有多高,前 K 个单词被视为可能的下一个单词。
在具有更广泛解释的模型中,除了 Top 1 概率之外,还可以考虑以下单词,从而在输出中更具创意。
这也解释了同一提示可能出现不同结果的原因。使用“严格”设计的模型,您总是会得到相似的结果。
生成人工智能中的编码和解码过程依赖于自然语言处理。
通过使用 NLP,可以扩展上下文窗口以考虑语法句子结构,从而能够在自然语言理解过程中识别主要和次要实体。
生成式人工智能不仅限于文本,还包括音频等多媒体格式,有时还包括视觉效果。
然而,这些格式通常在编码过程中转换为文本标记以进行进一步处理。(本讨论重点是基于文本的生成人工智能,这与 GEO 应用最相关。)
生成式人工智能的主要挑战包括确保信息保持最新、避免幻觉以及提供有关特定主题的详细见解。
基础法学硕士通常接受肤浅信息的培训,这可能导致对特定查询的回答笼统或不准确。
为了解决这个问题,检索增强生成已成为一种广泛使用的方法。
RAG 为法学硕士提供额外的特定主题数据,帮助他们更有效地克服这些挑战。
除了文档之外,还可以使用知识图或转换为向量的实体节点来集成特定于主题的信息。
这使得能够包含有关实体之间关系的本体信息,从而更接近真正的语义理解。
RAG 为 GEO 提供了潜在的起点。虽然确定或影响初始训练数据中的来源可能具有挑战性,但 GEO 允许更有针对性地关注首选的特定主题来源。
关键问题是不同的平台如何选择这些来源,这取决于它们的应用程序是否能够访问能够根据相关性和质量评估和选择来源的检索系统。
检索模型充当信息看门人,在 RAG 架构中发挥着至关重要的作用。
他们通过搜索大型数据集来识别文本生成的相关信息,就像专门的图书馆员一样,他们确切地知道要检索给定主题的哪些“书籍”。
这些模型使用算法来评估和选择最相关的数据,从而能够将外部知识集成到文本生成中。这增强了上下文丰富的语言输出并扩展了传统语言模型的功能。
检索系统可以通过各种机制来实现,包括:
并非所有系统都可以访问此类检索系统,这给 RAG 带来了挑战。
这种限制可以解释为什么 Meta 现在正在开发自己的搜索引擎,这将允许它使用专有的检索系统在其 LLaMA 模型中利用 RAG。
Perplexity 声称使用自己的索引和排名系统,尽管有人指责它从谷歌等其他引擎抓取或复制搜索结果。
Claude 的方法尚不清楚是否将 RAG 与其自己的索引和用户提供的信息一起使用。
Gemini、Copilot 和 ChatGPT 略有不同。Microsoft 和 Google 利用自己的搜索引擎进行 RAG 或特定领域的培训。
ChatGPT 历史上一直使用 Bing 搜索,但随着 SearchGPT 的推出,不确定 OpenAI 是否运行自己的检索系统。开放人工智能
已声明SearchGPT 采用了多种搜索引擎技术,包括 Microsoft Bing。– 搜索模型是 GPT-4o 的微调版本,使用新颖的合成数据生成技术进行后训练,包括从 OpenAI o1-preview 中提取输出。
ChatGPT 搜索利用第三方搜索提供商以及我们的合作伙伴直接提供的内容来提供用户正在寻找的信息。
Microsoft 是 ChatGPT 的合作伙伴之一。
当 ChatGPT 被问到最好的跑鞋时,Bing 搜索结果中排名靠前的页面与其答案中使用的来源之间存在一些重叠,尽管重叠率明显低于 100%。
其他因素可能会影响 RAG 管道的评估。
提示比典型的搜索查询更复杂并且更符合自然语言,典型的搜索查询通常只是一系列关键术语。
提示通常由明确的问题或连贯的句子构成,提供更多的上下文并提供更准确的答案。
区分 AI 概述优化和 AI 助理结果优化非常重要。
为了弥补这一差距,RAG 流程必须在后台将提示转换为搜索查询,保留关键上下文以有效识别合适的来源。
GEO 的目标在讨论中并不总是明确定义。
有些人专注于在引用的源链接中引用自己的内容,而另一些人的目标是在生成人工智能的输出中直接提及他们的名称、品牌或产品。
这两个目标都是有效的,但需要不同的策略。
实现这两个目标的基本步骤是在首选或经常选择的来源中建立存在,因为这是实现任一目标的先决条件。
人工智能应用程序的不同结果表明,每个平台都使用自己的流程和标准来推荐命名实体和选择来源。
未来,可能需要使用多种大型语言模型或人工智能助手并了解它们的独特功能。对于习惯了 Google 主导地位的 SEO 来说,这需要进行调整。
未来几年,监控哪些应用程序在特定市场和行业中获得关注并了解每个应用程序如何选择其来源将至关重要。
未来几年,更多的人将依靠人工智能应用程序来搜索产品和服务。
例如,类似这样的提示:
该提示提供了关键的上下文信息,包括年龄、体重、身高和距离作为属性,以慢跑鞋作为主要实体。
经常与此类背景相关的产品更有可能被生成人工智能提及。
Gemini、Copilot、ChatGPT 和 Perplexity 等测试平台可以揭示这些系统考虑的上下文。
根据引用来源的标题,所有四个系统似乎都是从我超重的属性中推断出来的,从标题如下的帖子中生成信息:
副驾驶会考虑年龄和体重等属性。
根据引用的来源,它从此信息中识别出超重上下文。
所有引用的来源都是信息内容,例如测试、评论和列表,而不是电子商务类别或产品详细信息页面。
ChatGPT 考虑了距离和重量等属性。从引用的来源中,它得出了超重和远距离的上下文。
所有引用的来源都是信息内容,例如测试、评论和清单,而不是典型的商店页面,例如类别或产品详细信息页面。
Perplexity 考虑权重属性并从引用的来源中得出超重上下文。
来源包括信息内容,例如测试、评论、列表和典型商店页面。
Gemini 不直接在输出中提供源。然而,进一步的研究表明它还处理年龄和体重的背景。
每个主要的法学硕士都会列出不同的产品,只有一款鞋被所有四个经过测试的人工智能系统一致推荐。
所有系统都表现出一定程度的创造力,在不同的会话中建议不同的产品。
值得注意的是,Copilot、Perplexity 和 ChatGPT 主要引用非商业来源,例如商店网站或产品详细信息页面,与提示的目的保持一致。
克劳德没有接受进一步的测试。虽然它也建议鞋款,但其建议仅基于初始训练数据,无法访问实时数据或自己的检索系统。
从不同的结果中可以看出,每个法学硕士都有自己的选择来源和内容的流程,这使得 GEO 的挑战更大。
这些建议受到同时出现、共同提及和上下文的影响。
一起提及的特定标记越频繁,它们就越有可能与上下文相关。
简单来说,这增加了解码期间的概率得分。
深入挖掘:如何获得生成式 AI 答案的可见性:GEO for Perplexity 和 ChatGPT
获取搜索营销人员信赖的时事通讯。
GEO 专注于在法学硕士的培训数据中定位产品、品牌和内容。了解法学硕士的培训过程对于识别潜在的包容机会至关重要。
以下见解来自研究、专利、科学文献、E-E-A-T 研究和个人分析。中心问题是:
最近的研究,特别是关于人工智能概述、困惑和副驾驶的来源选择,表明所选来源存在重叠。
例如,Google AI 概述显示来源选择大约有 50% 的重叠,这一点由以下研究证明:里奇·桑格和权威和冲浪者。波动幅度非常大。
2024 年初以来的研究重叠率仍约为 15%。然而,一些研究发现 99% 的重叠。
检索系统似乎影响了大约 50% 的 AI 概述结果,这表明正在进行的实验以提高性能。这与对人工智能概述输出质量的合理批评是一致的。
人工智能答案中参考来源的选择凸显了以适合上下文的方式定位品牌或产品的好处。
区分模型初始训练期间使用的源和 RAG 过程中根据特定主题添加的源非常重要。
检查模型训练过程可以让我们更加清晰。例如,Google 的 Gemini(一种多模式大型语言模型)可以处理多种数据类型,包括文本、图像、音频、视频和代码。
其训练数据包括网络文档、书籍、代码和多媒体,使其能够有效地执行复杂的任务。
对人工智能概述及其最常引用的来源的研究可以深入了解谷歌在预训练期间将哪些来源用于其索引和知识图谱,从而提供了调整内容以纳入内容的机会。
在 RAG 流程中,会合并特定领域的来源以增强上下文相关性。
Gemini 的一个关键特性是它使用专家混合 (MoE) 架构。
与作为单个大型神经网络运行的传统 Transformer 不同,MoE 模型分为较小的“专家”网络。
该模型根据输入类型有选择地激活最相关的专家路径,从而显着提高效率和性能。
RAG 流程可能已集成到该架构中。
Gemini 是由 Google 通过多个训练阶段开发的,利用公开数据和专门技术来最大限度地提高其生成内容的相关性和准确性:
预训练
有监督微调(SFT)
根据人类反馈进行强化学习 (RLHF)
扩展和检索增强
用户反馈和持续优化
一种可能性是人工智能应用程序访问现有的检索系统并使用其搜索结果。
研究表明,在各自搜索引擎中的强大排名会增加被引用为互联人工智能应用程序来源的可能性。
然而,正如所指出的,重叠尚未显示出最高排名和参考来源之间的明确相关性。
另一个标准似乎会影响来源选择。
例如,Google 的方法强调在选择预训练和 RAG 来源时遵守质量标准。
分类器的使用也被提到作为此过程中的一个因素。
在命名分类器时,可以建立一个到E-E-A-T的桥梁,其中也使用质量分类器。
来自 Google 的有关培训后的信息还引用了使用 E-E-A-T 根据质量对源进行分类。
对评估者的提及与质量评估者在评估 E-E-A-T 中的作用有关。
大多数搜索引擎中的排名受到文档、领域和作者或源实体级别的相关性和质量的影响。
可以较少地选择源以考虑相关性,而更多地考虑域和源实体级别的质量。
这也是有意义的,因为必须在后台重写更复杂的提示,以便创建适当的搜索查询来查询排名。
虽然相关性取决于查询,但质量保持一致。
这种区别有助于解释排名与生成人工智能引用的来源之间的弱相关性,以及为什么有时会包含排名较低的来源。
为了评估质量,Google 和 Bing 等搜索引擎依赖于分类器,包括 Google 的 E-E-A-T 框架。
谷歌强调,E-E-A-T 因主题领域而异,需要针对特定主题的策略,特别是在 GEO 策略中。
据一位人士称,引用的域名来源因行业或主题而异,维基百科、Reddit 和亚马逊等平台扮演着不同的角色。BrightEdge 研究。
因此,必须将行业和主题特定因素纳入定位策略。
深入挖掘:如何实施生成式引擎优化 (GEO) 策略
如前所述,目前还没有经过证实的成功案例可以影响生成式人工智能的结果。
平台运营商本身似乎不确定如何验证 RAG 流程中选择的来源。
这些要点强调了确定优化工作应重点关注的重要性 - 具体来说,确定哪些来源足够值得信赖并且与优先级相关。
下一个挑战是了解如何使自己成为这些来源之一。
研究论文 –GEO:生成引擎优化– 引入了 GEO 的概念,探索如何影响生成式 AI 输出并确定造成影响的因素。
研究表明,GEO的可见性和有效性可以通过以下因素来增强:
这些因素的有效性因领域而异,这表明将特定领域的、有针对性的定制合并到网页中对于提高可见性至关重要。
以下战术DOSGEO 和 LLMO 可以从论文中得出:
此外,战术不该做的事还可以识别:
BrightEdge 根据上述研究概述了以下战略考虑因素:
反向链接和同被引的不同影响
为人工智能驱动的搜索量身定制策略
预测引文格局的变化
以下是 GEO 针对特定行业的战术和战略措施。
B2B技术
电子商务
继续教育
金融
健康
保险
餐厅
旅游/旅游
GEO 对公司的重要性取决于后代是否会调整他们的搜索行为并从 Google 转向其他平台。
该领域的新兴趋势在未来几年应该会变得明显,并可能影响搜索市场份额。
例如,ChatGPT 搜索在很大程度上依赖于 Microsoft Bing 的搜索技术。
如果 ChatGPT 确立自己作为占主导地位的生成式 AI 应用程序的地位,那么在 Microsoft Bing 上的良好排名对于旨在影响 AI 驱动应用程序的公司来说可能变得至关重要。
这一发展可能为微软必应提供间接获得市场份额的机会。
LLMO 或 GEO 是否会演变成指导法学硕士实现特定目标的可行策略仍不确定。
然而,如果确实如此,实现以下目标将至关重要:
LLM 优化的成功与市场规模相关。在利基市场中,由于竞争减少,更容易在其主题背景下定位品牌。
将品牌与法学硕士中的相关属性和实体联系起来需要更少的合格媒体共现。
相反,在较大的市场中,实现这一目标更具挑战性,因为竞争对手通常拥有广泛的公关和营销资源以及完善的影响力。
实施 GEO 或 LLMO 需要比传统 SEO 更多的资源,因为它涉及大规模影响公众的看法。
公司必须为这些转变做好战略准备,这就是像这样的框架的地方数字权限管理发挥作用。这一概念有助于组织在结构和运营上进行调整,以在人工智能驱动的未来取得成功。
未来,大品牌凭借其优越的公关和营销资源,很可能在搜索引擎排名和生成人工智能输出方面占据显着优势。
然而,传统的搜索引擎优化仍然可以通过利用高排名内容在培养法学硕士方面发挥作用。
这种影响的程度取决于检索系统在训练过程中如何权衡内容。
最终,公司应优先考虑其品牌/产品与相关属性和实体的共现,同时在合格媒体中优化这些关系。
深入挖掘:塑造搜索未来的 5 个 GEO 趋势
特邀作者受邀为 Search Engine Land 创建内容,并因其专业知识和对搜索社区的贡献而被选中。我们的贡献者在以下机构的监督下工作编辑人员我们会检查贡献的质量以及与读者的相关性。他们表达的意见是他们自己的。