当然,这些差异并不一定意味着人工智能生成的结果“更糟”。研究人员发现,基于 GPT 的搜索更有可能引用企业实体和百科全书等来源来获取信息,而几乎从不引用社交媒体网站。
基于LLM的分析工具发现人工智能驱动的搜索结果也往往涵盖与传统前 10 个链接相似数量的可识别“概念”,这表明结果的细节、多样性和新颖性水平相似。与此同时,研究人员发现,“生成引擎倾向于压缩信息,有时会忽略传统搜索保留的次要或模糊的方面。”对于更模糊的搜索词(例如不同人共享的名字)尤其如此,研究人员发现,“有机搜索结果提供了更好的覆盖范围”。
对于带有搜索工具的 GPT-4o 来说尤其如此,它通常不引用任何网络资源,只是根据其训练提供直接响应。
但这种对预先训练数据的依赖可能会成为搜索及时信息的限制。对于从 Google 9 月 15 日趋势查询列表中提取的搜索词,研究人员发现带有搜索工具的 GPT-4o 经常会回复类似“您能否提供更多信息”的消息,而不是实际在网络上搜索最新信息。
虽然研究人员没有确定基于人工智能的搜索引擎总体上比传统搜索引擎链接“更好”还是“更差”,但他们确实敦促未来研究“新的评估方法,共同考虑生成搜索系统中的来源多样性、概念覆盖范围和综合行为”。