作者:Noah B. Cooper
在当今混乱的世界中,专业的情报分析人员必须应对几乎无穷无尽的数据流,这些数据流有可能使他们不堪重负,同时也会加剧认知偏见的影响。人工智能是解决方案吗,还是当前困扰人工智能的缺陷带来了更多的风险?
事实上,人工智能既不是万能药也不是威胁。和其他新兴技术一样,人工智能不是一个即时的“开箱即用”的解决方案,而是一个不断发展的能力。今天,人工智能可以增强人类的能力,并通过解决特定挑战来提升分析过程。然而,人工智能并非没有问题。这意味着其价值在于作为人类智能分析师的专业知识和判断力的一种补充能力。
在全面采用人工智能支持情报分析之前,必须了解分析师面临的具体问题:应对大量数据;从非传统来源获取数据;以及可能最具挑战性的问题,即认知偏见对情报评估客观性的影响。只有在将人类保持在决策循环中时,人工智能才能发挥缓解这些问题的价值。
数据过载、完整性与偏见
去粗取精,或者每天收集的海量信息中进行筛选和整理,是当今美国情报界面临的主要问题。尽管在自动化的收集手段以及相应的存储、组织和结构化批量数据以供未来检索和分析的情报分析师使用方面进行了大量投资。尽管这一令人印象深刻的流程可能消耗了相当大的一部分预算,美国情报界的预算信息仍然“被搁置一旁”或未被人力分析师分析。
一个简单的论点认为,过多的数据比数据不足的情况更可取。然而,像这样的情报失败表明,2003年对伊拉克大规模杀伤性武器的误判, 以色列情报失败以辨别1973年埃及和叙利亚领导的阿拉伯联军即将发动的大规模入侵(导致了斋月战争),以及可能的2023年10月7日哈马斯对以色列的突然入侵和袭击表明,过多的信息可能对至关重要的情报分析过程产生不利影响,特别是如果分析师无法筛选可用信息以识别对手意图的关键指标。
处理越来越多的信息要求情报分析师梳理、识别并综合不同的数据点,从而形成判断——如果做得好,可以减少不确定性。然而,认知偏见伴随着数据过多或数据质量差的问题困扰着这一过程,导致评估不够精确,可能会影响政策和决策的失败、增加军事行动的风险以及其他不利且连锁反应。鉴于情报分析的挑战性,人工智能能否帮助避免这些后果,并为决策者提供关键的、客观的和准确的信息?
如果AI的承诺若成立,则生成式人工智能技术例如ChatGPT之类的基于大型语言模型的工具可以提高分析过程的效率。例如,生成式AI能够总结长篇文本(例如外语灰色文献),翻译外语,进行开源情感分析,并执行各种其他功能。此外,生成式人工智能可以协助情报评估的开发。这并不能减轻人类情报分析师的关键作用。然而,生成式人工智能可以作为分析过程的辅助工具,帮助识别分析中的缺陷或不一致之处。
尽管这些功能很有前景,并且可以合理地假设情报机构已经将此类技术融入日常流程中,生成式人工智能并非没有缺点。首先,生成式人工智能在缓解长期存在的分析偏差问题上收效甚微。基于大型语言模型构建的生成式人工智能技术依赖于预先存在的数据集,而这些数据集本质上是无结构且可能有缺陷的。与此相关的是,当今的生成式人工智能模型容易出现错误,并能提供虚假或不准确的内容。这些问题包括:幻觉与生成式AI模型的发展相关;尽管使用了大量的数据进行训练,但如果生成式AI系统遇到一个不熟悉的单词、短语或主题——或者如果数据不足——它会基于其对语言的理解做出推断,并给出系统认为合乎逻辑但可能是错误的答案。
确定对手的能力和意图所需的信息是不再仅仅是政府的专属领域非政府组织、私人实体、社交媒体公司等已经崛起成为重要的参与者数据经纪人掌握理解战略环境和构建准确情报评估所需的信息。在情报分析中使用生成式人工智能需要解决相关的数据访问、质量以及偏见等问题。
思考与思维:心态的有害性质
认为人类完全控制自己的思维过程是一种谬误。人类的思想过程表现出本能和无意识的趋势处理新信息。例如,人类倾向于寻找模式,如因果关系,这有助于分析未知的事物或面对新的问题集时。此外,作为生存本能的一部分,个体无意识地发展出心理模型或认知及感知偏差,这些因素影响人的判断和决策。心智模型是人类潜意识中的组成部分,通过我们无意识控制的情况下执行的心理捷径来指导我们的日常行为。
在情报分析方面,心智模型是一种指导分析师思考对手行为或情况发展方式的范式。与心智模型相关的优点因上下文和环境而异。然而,心智模型可以促进批判性思维,辅助决策,并将多种视角融入到分析或决策过程中。理想情况下,结合多个心智模型可以有助于更积极的情报分析结果。
相反,某个主题的丰富经验和知识可能会产生负面影响,因为心智模型可能导致个体拒绝新的或与其已有认知相矛盾的信息,或者错误地处理这些信息。最令人担忧的心智模型特征之一是抗拒变化的倾向。一旦分析师完成了评估,尤其是在该评估经过审查和批准之后,分析师的心智模型可能使他们无法接受会改变其评估本质的新且实质性的信息。
一个明显的例子是,心理模型加剧了分析偏差,即以色列情报机构在1973年赎罪日战争前夕未能正确识别阿拉伯意图的失败。在1967年的六日战争取得胜利之后,以色列建立了一种组织和制度上的倾向,这种倾向被以色列情报界称为“概念。”这一概念充当了以色列情报机构和政策制定者的分析框架,塑造了他们对阿拉伯活动的看法。该观点认为,在1967年战争中取得压倒性胜利的情况下,除非埃及和叙利亚互相支援,否则它们不会发动攻击;除非拥有能够威胁并危及以军机场和以色列平民的飞毛腿导弹等远程地对地弹道导弹,否则阿拉伯部队也不会发起进攻;并且除非通过提供苏联防空能力来与以色列的空中优势抗衡,否则联合起来的阿拉伯军队也不会发动袭击。以色列情报分析人员倾向于仅根据这一概念来审视传入的情报,并试图基于战略计算而非战术现实推断阿拉伯意图,这导致了不准确的评估,最终促使联合阿拉伯部队发起了突袭。
救援来临? AI能救场吗?
情报机构是以信息为中心的组织,这意味着该组织的基础依赖于持续不断的数据流入。分析师随后将这些“转变为可利用的情报。"原始文本将数据转化为连贯的信息,以便向客户展示或传达。几乎从来不会有一个问题的所有事实都呈现出来以达到近乎确定性的结论。相反,情报机构通过依赖于从情报收集活动中获得的不完全确凿的事实以及分析人员的知识、专业知识和假设得出的推断,在其评估中力求准确。训练尽管他们对问题的历史方面十分熟悉,并且更重要的是,他们的 tradecraft心智模型的负面影响一直笼罩在情报评估之上。鉴于心智模型可能产生的无意识和非自愿的影响,生成式人工智能能否穿透人类认知中的固有偏见,提供客观且不带偏见的评估?
为了回答这个问题,首先需要理解生成式AI如何能够使情报分析过程变得更为高效。生成式AI对情报分析最重要的贡献功能之一就是能够将复杂性提炼成分析师可以更易于管理的核心组成部分。具体来说,人工智能可以处理来自多个不同来源的大量结构化和非结构化数据,并确定人类分析师难以察觉的数据之间的关联。此外,假设生成式AI的大语言模型具备相应的能力,它可以融合来自多个智能学科(例如信号、人力、地理空间情报等),以更快的速度提供更清晰的问题描述。在时间敏感的情景中,可操作性情报的价值很高,因此,AI在识别模式和相关性方面的处理速度大大加快,这对分析师来说非常有价值。作为附带好处,及时交付可操作性情报增强了情报组织与其客户之间的关系。
人类与生成式AI系统交互的能力——即使提示中包含混乱的语法、拼写错误和缺乏标点符号——并收到有用的回复,这是对的证明。 注意:根据上下文,“这是对的证明”似乎不完整或可能有误,正确的表达可能是“这是……能力的证明”,请确认需要补充的部分。自然语言处理自然语言处理促进了人类与人工智能之间的交互,并使系统能够处理和理解人类的文本和语音。据估计存在大约当今世界上的语言有7,164种此外,每天产生的数据量可能在范围内300至400百万万亿字节从智能角度来看,即使只是分析其中一小部分数据,尤其是当源语言是外语时,这也是一项困难且耗时的任务。自然语言处理减轻了翻译负担,并有助于从文章、书籍和其他文档中提取相关信息。也许更重要的是,随着这项技术的成熟,招募、培训和保留掌握难懂和专业语言人才的需求会减少。
一切都是关于数据
数据分析和自然语言处理只是生成式人工智能在情报操作中的应用示例。事实上,AI的潜力可能在这两个功能之外的情报分析领域带来多方面的益处。然而,AI并非没有问题。重要的是要强调,生成式AI的核心功能源自用于训练模型的数据。如果数据集存在偏差,模型将继续传播甚至放大这些偏见。因此,我们回到了负面心理模型影响分析的长期存在的问题,这些问题可能会潜在地滋养生成式AI系统。利用现有情报数据集的主要后果是成品分析产品中所含偏见的未知含义。注入此类数据集可能继续扩散扭曲的分析,形成一个循环过程,指数级地增加了不准确甚至可疑的情报产品的数量。
生成式AI系统根据训练数据中的可观察模式来评估下一个词、短语、图像或其他输出的组合,以提供可能不准确或误导性的内容,这是当前AI技术的一个常见问题和内在局限。在缺乏数据或存在无关数据的情况下,生成式AI会推断出最有可能的内容序列,这些序列可能会包含虚假信息。因此,在这项技术成熟之前,人类的知识、经验、专长和直觉将继续是智能技艺中的关键组成部分。
因此,高质量的数据对于使用生成式AI进行情报分析至关重要。也许同样重要的是获取这些数据。数据无疑是一种商品:一种值得购买、出售或收藏的有利可图的产品。尽管情报机构可能花费了不成比例的资金用于复杂的智能收集能力,这些能力获取高度机密的信息,但随着公开可用或开源信息的扩散,政府不再对数据拥有垄断权。私营部门的数据可以证明与从高科技手段收集到的数据一样有价值,甚至更有价值。因此,情报组织应该追求此类数据的获取。然而,当政府试图从私营部门获取数据时,会出现一些挑战,包括信任问题、知识产权关切和兼容性问题。
通常,私人部门收集个人数据为了通过个性化产品和服务来提升公司的业绩,了解消费者行为,并提高客户保留率。我们很可能都经历过基于我们的浏览历史、过往购买记录和人口统计学信息的定向营销活动。此外,多媒体流媒体公司经常通过播放列表或推荐接下来要听或要看的内容提供定制化的体验。最终,以消费者为基础的公司会分析数据来发展并维持与客户的良好关系,迎合他们的需求。虽然这些数据看起来微不足道,但如果公司随意将这些数据分享给政府,则可能会造成损害消费者信任并产生对公司负面的公众印象。此外,关于分享个人数据存在伦理问题,特别是关于个人是否(或没有)同意将自己的数据与政府机构共享的问题。
除了以消费者为基础的公司之外,还存在一个庞大的行业收集和出售个人及企业的数据。数据经纪人从各种公共和私人来源收集数据,并将其转售用于市场营销、风险分析等目的。商业智能此外,智库、非政府组织、教育机构以及其他开展数据收集和分析活动的各种实体也产生了大量可供公开获取的数据。然而,与政府部门共享这些数据可能会出现问题。私人组织可能认为他们的数据专有的因为它提供了竞争优势,因此分享可能会对其市场地位产生影响。此外,私人实体会根据其特定用途来构建数据,从而导致兼容性问题如数据模式变体、数据完整性和数据安全可能会需要代价高昂的集成解决方案。
当总体来看,编纂这些数据有可能增加情报数据的汇总,并提供丰富的见解以解决复杂的情报问题。很难反对纳入额外的数据,因为它将增强情报分析过程。但是,情报机构如何获取和利用这些信息仍然是一个问题。信任、专有数据和兼容性的问题无疑会加剧获取此类信息的难度。然而,这仍然是值得的,因为将更多的数据集引入情报数据库中,特别是那些由生成式人工智能支持的数据集,将增强分析过程。在这样做时,情报组织应表现出谨慎,以避免继承原始数据中的偏见。
结论
情报问题通常是由于分析不当,而不是信息收集不足造成的。面对情报失败,部署新的、高度复杂的收集能力并不一定是解决办法。人工智能肯定能提供帮助。快速识别大数据集中关系的能力将大大提高情报分析的效率,并有助于构建更为精确的评估结果。生成式人工智能也可以有所帮助,但并不能完全解决认知偏差和思维模型相关的问题。但这要求情报组织在训练模型时清洗数据,确保这些数据代表经过深思熟虑且验证过的、力求避免偏见的分析方法。此外,由于数据是任何AI系统的核心组成部分,情报机构应寻求合法的方式获取私营部门的数据,并同时认识到与该数据相关的兼容性、结构和信任问题。这是一项具有挑战性的任务,因为私营部门可能会出于担心影响经济底线或违反消费者信任的原因而不愿向政府机构提供数据。解决这种情况需要强有力的互动策略来确保数据获取的同时平衡私企的担忧。
为了应对幻觉问题,更高质量的训练数据结合使用工具如检索增强生成(一个能够核查来源真实性的功能)会有帮助。在短期内,生成式人工智能在情报领域的应用仍然需要分析师花费时间来验证和复核AI的贡献,这让人质疑这项技术的实际效用。然而,目前所做的这些时间和投入在未来肯定会带来回报,因为情报组织将对各种模型进行测试和实验。采用并试验这一技术将促进其成熟,并且训练数据可以得到改进,从而推动生成式人工智能更深入地融入情报工作方法中。
或许,生成式人工智能在智能领域的成功最重要的基石是分析社区的接受。AI技术不是人类的替代品;相反,它们是仍然需要“人在回路中”操作并提高功能性的赋能系统。情报行动应对模糊性和复杂性,以快速识别环境中的变化,并相应地向有权势的人提供这些信息以便他们做出和执行决策。自动化和速度并不能免除情报分析师在恰当的时间提出和考虑正确问题的主要职责,从而提供及时准确的情报。情报专业人士不应将AI视为万能药或威胁,而应将其视为一种无疑会随着时间改进的工具。.
诺亚·B·库珀是一位拥有近20年经验的美国陆军军事情报军官。他从约翰霍普金斯大学获得了硕士学位,并且在伦敦国王学院也取得了硕士学位。本文中的观点仅代表作者本人,不代表美国陆军、美国国防部或美国政府的官方政策或立场。
图像:下士埃莱娜·尼维斯