AI为伊朗学校爆炸事件承担责任。真相更令人担忧
2026 年 2 月 28 日,史诗愤怒行动的第一个早晨,美军袭击了南部地区米纳布的 Shajareh Tayyebeh 小学。伊朗,在上午的会议期间至少两次撞击建筑物。美军杀害了 175 至 180 人,其中大多数是 7 至 12 岁的女孩。
几天之内,组织报道的问题是 Anthropic 制造的聊天机器人 Claude 是否选择了这所学校作为目标。国会写信给美国国防部长皮特·赫格斯 (Pete Hegseth),询问人工智能在袭击中的使用程度。《纽约客》杂志询问克劳德是否可以相信在战斗中服从命令,是否可以诉诸勒索作为自保策略,以及五角大楼的主要关注点是否应该是聊天机器人具有个性。这些几乎都与现实没有任何关系。史诗狂怒行动的目标运行在一个名为 Maven 的系统上。没有人争论 Maven。
八年前,Maven 是硅谷最具争议的项目。2018年,超过4000名谷歌员工签署了一封信反对该公司为五角大楼的目标系统构建人工智能的合同。工人们组织了一次罢工。工程师辞职了。谷歌最终放弃了这份合同。由 Peter Thiel 共同创立的数据分析公司和国防承包商 Palantir Technologies 接手了该公司,并在接下来的六年里将 Maven 打造成一个目标基础设施,该基础设施将卫星图像、信号情报和传感器数据结合在一起,以识别目标,并执行从首次检测到下达打击命令的每一步。
米纳布的这座建筑在国防情报局数据库中被列为军事设施,据美国有线电视新闻网报道,尚未更新以反映该建筑已与邻近的伊斯兰革命卫队大院分离并改建为一所学校,这一变化卫星图像显示最晚在 2016 年发生。聊天机器人并没有杀死那些孩子。人们未能更新数据库,而其他人构建的系统速度足够快,足以使这种故障致命。到伊朗战争开始时,Maven——实现这种速度的系统——已经进入管道,它已经成为军队基础设施的一部分,而争论的焦点都是克劳德。这种对克劳德的痴迷是一种人工智能精神病,尽管不是我们通常谈论的那种,它对这项技术的批评者和反对者的影响与它的支持者一样强烈。你不必使用语言模型来让它组织你的注意力或扭曲你的思维。
2019 年,学者摩根·艾姆斯 (Morgan Ames) 出版了《魅力机器》(The Charisma Machine),该书研究了某些技术如何吸引人们的注意力、资源和归属感,将注意力、资源和归因转向自身而不是其他一切。理解这种动态的通常框架是“炒作”,但炒作只描述了助推器的作用,它赋予批评者一个特权揭穿角色,但技术仍然处于每个争论的中心。一项魅力非凡的技术塑造了它周围的整个领域,就像磁铁组织铁屑的方式一样。法学硕士可能是历史上此类类型中最强大的实例。
到战争开始时,“人工智能安全”、“结盟”、“幻觉”和“随机鹦鹉”已经成为所有关于人工智能的争论的术语,构建和限制了我们甚至可以说的话。更糟糕的是,“人工智能”本身已经成为法学硕士的代名词。当学校被炸时,这些是人们所寻求的术语,尽管事实上这种关键设备并不适合涉及目标定位的较旧、更成熟的技术堆栈。真正的问题,几乎没有人问过的问题,与 Claude 或任何语言模型无关。这是一个关于杀伤链发生了什么的官僚问题,答案是 Palantir。一个
用军事术语来说,“杀伤链”是一个非常诚实的术语。本质上,它指的是组织检测某物和摧毁某物之间步骤的官僚框架。我能找到的对该术语本身最古老的引用是在 20 世纪 90 年代,但这个想法相当古老——至少可以追溯到 1760 年代,当时法国炮兵改革者开始用弹道表、仰角螺钉和标准化射击程序取代炮手经验丰富的眼睛。杀伤链中的步骤会不断变化,以跟上目标理论的变化,同时也纳入困扰军方战略思想家的任何管理时尚。80年来,美军一直对这些台阶进行命名和重新命名。在第二次世界大战中,顺序是发现、修复、战斗、完成。到 20 世纪 90 年代,空军已将其功能扩展至发现、修复、跟踪、瞄准、交战、评估或 F2T2EA。每一代军事技术的销售承诺都是为了缩短杀伤链,除了缩写词。
Palantir 的 Maven 智能系统是这种压缩的最新版本,它源于奥巴马第二任期战略思维的转变。2014 年,国防部长查克·哈格尔 (Chuck Hagel) 和他的副手罗伯特·沃克 (Robert Work) 宣布了他们所谓的“第三次抵消战略—。这种思路的一个“抵消”是押注技术优势可以弥补该国无法直接解决的战略弱点。前两次抵消解决了同样的问题:美国在常规力量方面无法与苏联匹敌。他们的想法是,红军可以继续派遣人员解决问题,就像他们在斯大林格勒所做的那样,或者,不合时宜地,就像当代俄罗斯军队在巴赫穆特和阿夫季夫卡所做的那样。核武器作为第一个抵消因素,使人员优势在 20 世纪 50 年代变得无关紧要。当苏联在 20 世纪 70 年代达到核均势时,精确制导弹药和隐身技术提供了以较小的力量击败较大的力量的希望。到了 2014 年,这一优势正在消失。中国和俄罗斯花了二十年的时间获取精确制导弹药并建立防御系统,旨在将美军排除在射程之外。罗伯特·沃克坚持认为第三次抵消不是关于任何特定的技术,而是利用技术重组军队的运作方式,让美国比中国和俄罗斯更快地做出决策,通过保持比敌人更快的作战节奏来压倒和迷惑敌人。

2017 年 4 月,在特朗普第一届政府执政初期,沃克帮助建立了算法战跨职能团队,指定为 Maven 项目。负责监督 Maven 的将军之一杰克·沙纳汉 (Jack Shanahan) 中将明确提出了问题:数千名情报分析师将 80% 的时间花在平凡的任务上,淹没在没人有时间观看的无人侦察机的镜头中。一次“捕食者”无人机任务可能会生成数百小时的视频,而负责理解这一点的分析师面临着信息过载的问题。“我们不会通过投入更多的人来解决这个问题,”沙纳汉说。“这是我们真正想做的最后一件事。”该项目的核心理念是机器可以观察,以便分析师可以思考。
五角大楼需要有人来建造它。谷歌接受了这份合同,接下来发生的事情成为硅谷历史上最引人注目的劳工行动。
一个谷歌放弃 Maven 合同后,Palantir 于 2019 年接管了它。第十八空降军开始在一项名为“赤龙,该演习于 2020 年开始,最初是在布拉格堡一个没有窗户的地下室进行的桌面兵棋推演。它的指挥官迈克尔·埃里克·库里拉中将想要建造他所谓的第一艘——人工智能赋能的军团— 在军队里。目标是测试该系统是否能够为小团队提供以前需要数千人的定位能力。
在接下来的五年里,“猩红之龙”演变成一场使用实弹的军事演习,横跨多个州和武装部队分支,来自 Palantir 的“前沿部署工程师”和其他承包商与士兵并肩作战。每次进行练习时,都是为了回答同一个问题:系统从检测到决策的速度有多快?基准是 2003 年入侵伊拉克,当时大约有 2,000 人参与了整场战争的目标确定过程。在《猩红之龙》期间,20 名士兵使用 Maven 处理了相同数量的工作。到 2024 年,既定目标一小时内做出 1,000 个目标决策。也就是说,每个决定需要 3.6 秒,或者从个体“目标制定者”的角度来看,每 72 秒就有一个决定。
Maven 智能系统是这些练习中产生的平台,它(而不是克劳德)被用来在伊朗生产“目标包”。像我这样的平民对这个系统的了解确实有限,以下内容基于公开信息,这些信息来自 Palantir 产品演示、会议以及为军事用户制作的指导材料。但我们可以知道很多。
Maven 界面看起来像是企业项目管理软件的军用版本与地图应用程序的结合。建立目标列表的军事分析师看到的要么是一张分层的情报数据地图,要么是一个按列组织的屏幕,每个列代表目标确定过程的一个阶段。各个目标在每个阶段的进展过程中从左到右穿过列,这种格式借鉴自看板,看板是丰田开发的“精益制造”工作流程系统,现在广泛用于软件开发。
在 Maven 之前,操作员同时在八个或九个独立的系统上工作,从一个系统中提取数据,在另一个系统中交叉引用,在平台之间手动移动检测结果,以收集每次攻击所需的情报和批准。Maven 将所有这些整合到一个界面中。五角大楼首席数字和人工智能官卡梅伦·斯坦利称其为“抽象层–,软件工程中的一个常用术语,意思是隐藏其复杂性的系统。人类负责瞄准。在界面下,机器学习系统分析卫星图像和传感器数据来检测和分类物体,并根据系统对识别正确的信心对每个识别进行评分。单击三下即可将地图上的数据点转换为正式检测并将其移至目标管道中。然后,这些目标会在代表不同决策过程和参与规则的列中移动。该系统会建议如何打击每个目标——使用哪架飞机、无人机或导弹,搭配哪种武器——军方称之为“行动方案”。官员从排名的选项中进行选择,系统根据使用它的人,将目标包发送给官员进行批准或将其移至执行。
界面下的人工智能不是语言模型,或者至少重要的人工智能不是。核心技术与识别照片库中的猫或让自动驾驶汽车将其摄像头、雷达和激光雷达组合成单一道路图片的基本系统相同,应用于无人机镜头、雷达和军事目标的卫星图像。它们早于大型语言模型多年。克劳德和任何其他法学硕士都不会检测目标、处理雷达、融合传感器数据或将武器与目标配对。法学硕士是 Palantir 生态系统的最新成员。2024 年末,即核心系统投入运行多年后,Palantir 添加了一个 LLM 层(这就是 Claude 所在的位置),让分析师可以用简单的英语搜索和总结情报报告。但对于这个系统来说,语言模型从来都不是最重要的。重要的是 Maven 对目标确定过程所做的事情:它整合了系统,压缩了时间并减少了人员。这不是什么新想法。自从这种差距存在以来,美国军方就一直在试图缩小看到某物和摧毁它之间的差距,而每一次尝试都会导致同样的失败。Maven 甚至可能不是最极端的情况。
20 世纪 60 年代末,美国在越南也面临着同样的问题。补给品沿着胡志明小道向南运送,穿过军方无法看到的丛林。解决方案是“白色冰屋行动”,这是一项每年耗资 10 亿美元的计划,沿路分布了 20,000 个声学和地震传感器。这些传感器将数据传输到头顶上的中继飞机,再将信号传送给泰国那空拍侬空军基地的 IBM 360 计算机。计算机分析传感器数据并预测车队所在位置,并将攻击机引导至这些坐标。

系统可以感知,但看不到。它可以检测到振动,但无法区分卡车和牛车。北越人想通了。他们播放卡车发动机的录音,将动物聚集在传感器附近以触发振动检测,并将尿液桶挂在树上以触发化学探测器。该系统可能会被愚弄,因为在此过程中没有人能够看到它所感知的内容。空军声称,在战役过程中,有 46,000 辆卡车被摧毁或损坏。中央情报局报告称,一年的索赔数量超过了据信北越全境存在的卡车总数。系统自身的产出是衡量其性能的唯一标准,系统之外的任何人都没有资格挑战它。空军历史学家伯纳德·纳尔蒂后来将空军的伤亡计算称为“形而上学而不是数学的练习”,而他的同事厄尔·蒂尔福德得出的结论是“空军只是在欺骗自己”。当白天的侦察飞行未能找到所有这些卡车的残骸时,空军人员发明了一种生物来解释失踪的原因。他们称其为“伟大的老挝卡车食客”。
越南的模式——一种只能衡量自身表现并最终相信自己输出的目标系统——实际上比数字计算更古老。迈克尔·雪利 (Michael Sherry) 1987 年出版的《美国空中力量的崛起》一书将其追溯到精确轰炸的基本原则,这种原则对自己的方法充满信心,因此无需研究这些方法会产生什么结果。“对成功的信念,”雪莉写道,“鼓励了对如何实现成功的不精确性。”到 1944 年,大西洋两岸的作战分析师都在用工业优化的共同语言来衡量轰炸。被炸出家园的平民被记录为“无家可归”。每投下一吨炸弹,分析人士就会计算出它摧毁了多少个小时的敌方劳动力。英国的一项评估将轰炸机本身视为一项资本资产:对德国城市的一次出击就消除了制造飞机的成本,而此后的一切都是“明显的利润”。雪莉将由此产生的心态称为“技术狂热”。
雪莉的观点并不是说有人选择毁灭。而是炼化轰炸之术的人们不再问轰炸是为了什么。但即使当运筹学研究人员开始着手确定目标时,这种逻辑也已经成型。正如科学史学家威廉·托马斯(William Thomas)所言,作战分析师并没有将这种逻辑强加给军队;而是将这种逻辑强加给军队。军方已经将作战经验转化为系统程序,并且已经持续了数十年。没有人停止做出判断。但判断不再是轰炸是否具有战略目的。他们是关于如何测量它以及如何围绕这些测量进行优化。
十九世纪普鲁士将军卡尔·冯·克劳塞维茨(Carl von Clausewitz)的著作至今仍是西方军事思想的基础,他对优化所遗漏的一切都有一个词。他称之为“摩擦”,即不确定性、错误和矛盾的积累,导致任何操作都无法按计划进行。但摩擦也是判断形成的地方。克劳塞维茨观察到,大多数情报都是错误的,报告相互矛盾。经历过这一过程的指挥官学会了观察眼睛适应黑暗的方式,不是通过获得更好的光线,而是通过停留足够长的时间来利用现有的光线。这种“停留”需要时间。压缩时间,摩擦力并没有消失。你只是不再注意到它。克劳塞维茨将这种计划称为“纸上战争”。该计划毫无阻力地进行,不是因为没有阻力,而是因为将计划与现实世界联系起来的一切都被剥夺了。
空中力量尤其容易受到这种影响。飞行员永远看不到炸弹击中的物体。分析师根据图像、坐标和数据库进行工作。整个企业是由目标的表征而不是目标本身来调节的,这意味着包和世界之间的差距可能会扩大,而过程中的任何人都不会感觉到。2003年的入侵伊拉克行动就是一个典型的例子,后来赤龙行动以此为基准。马克·加拉斯科 (Marc Garlasco) 是五角大楼在入侵期间负责高价值目标定位的负责人,他执行了美国迄今为止最快的目标定位周期。他建议对伊拉克高级领导层发动 50 次袭击。炸弹是精确的——它们准确地击中了目标——但其背后的情报却并非如此。50 人中没有一人杀死了预定目标。入侵两周后,加拉斯科离开五角大楼,加入人权观察组织,前往伊拉克,站在他自己瞄准的袭击的火山口中。“这些不仅仅是无名、不露面的目标,”他后来说。“这是一个人们将在很长一段时间内感受到影响的地方。”定位周期足够快,可以攻击 50 座建筑物,而且速度太快,以至于无法发现它击中了错误的建筑物。
空军自己的目标指南(在伊拉克战争期间生效)表示,这种情况根本不应该发生。该报告于 1998 年发布,将目标定位的六大功能描述为“相互交织”,目标制定者“向后”移动以细化目标,“向前”移动以评估可行性。手册指出,“最好的分析是结合事实和结论进行理性思考,而不是清单。”但是,曾在科索沃担任海军情报官员、后来研究了针对伊拉克的特种作战的乔恩·林赛 (Jon Lindsay) 发现了一些不同的东西。一旦目标在 PowerPoint 幻灯片上具体化(目标情报包或 TIP),它就变成了一个黑匣子。随着搜寻力度的加大,质疑其背后的假设变得更加困难,因为文件夹中充满了林赛所说的“代表性残留物”。用于建造目标的机械比用于检查其建造质量的机械更多。工作人员不愿意询问某些目标是否是潜在的盟友,或者根本不是坏人,因为产生目标就意味着参与狩猎。定位指南也对此发出了警告。“如果目标制定者不提供全面的目标服务,”它写道,“那么其他善意但缺乏培训和经验不足的团体就会介入。”Maven 最终会介入。
林赛的书《信息技术和军事力量》是我发现的关于目标定位实际运作方式最仔细的研究,至少部分是因为它是由实际执行此操作的人撰写的。在科索沃空战期间,韦斯利·克拉克将军要求有 2,000 个目标,这使得任何目标都可以很容易地证明与米洛埃维政府有联系。中央情报局在整个战争期间只指定了一个目标:联邦供应和采购局。分析师有街道地址,但没有坐标,因此他们尝试根据三张过时的地图对位置进行逆向工程。他们最终击中了最近搬迁的中国大使馆,距他们目标建筑 300 米。国务院知道大使馆已经搬迁。军方设施数据库没有。目标评论未能注意到,因为每次验证都依赖于最后一次。Lindsay 将其称为“循环报告”:支持文件的积累,“造成了多重验证的假象”,同时放大了单个错误。这张 PowerPoint 幻灯片看起来和北约袭击的其他数百张幻灯片一样经过了严格审查。罢工当晚,一名情报分析员致电总部表达疑虑。当被具体问及附带损害时,他无法表达出自己的担忧。罢工继续进行。三名中国记者被杀。林赛当时在日记中写道,这一结果是“一个完美的巨大错误”。

2005年,美国空军约翰·法伊夫中校发表了一项研究2003 年入侵期间对时间敏感的目标定位。菲夫强调了英国和美国军队应对这一挑战的不同方式。在联合空中作战中心,英国皇家空军军官与美国同行一起担任关键领导职务。他们在更严格的交战规则下运作。费夫指出,他们“更加矜持、保守的性格”产生了他所谓的“对有时忙碌、混乱的进攻行动节奏产生非常积极的抑制作用”。转变之间的对比是显而易见的:美国领导人全力推进,而英国官员在批准执行之前有条不紊地重新考虑风险和成本效益权衡。在英国主导的行动中,没有发生友军误伤事件,也没有发生重大附带损害。法伊夫指出,英国负责官员曾多次阻止行动进展顺利。下一代改革者所衡量的延迟——确定目标和实现目标之间的延迟——是可以发现错误的窗口。
从效率框架内部来看,Fyfe 描述的每个功能都被注册为缺陷。英国的转变速度较慢。有限的交战规则增加了限制。阻尼效果增加了时间。有人认为,速度可以拯救生命,但在 Maven 之前最快的目标循环是 Garlasco 的,它袭击了 50 座建筑物,但没有击中任何一个预定目标。赤龙将其全部消灭。关于目标的分歧停止了。深思熟虑、犹豫不决以及有人有时间反对或注意到某些事情不对劲的时刻也是如此。
氧按正式程序运行的组织需要流程内部的人员来解释规则、注意到例外情况、识别类别何时不再适合实际情况。如果组织承认其结果取决于执行人员的自由裁量权,那么该程序就不再是程序,而是建议,并且该组织从表面上受规则约束而获得的权威就会崩溃。所以判断必须发生,而且必须看起来像别的东西。它必须看起来像是遵循程序而不是解释它。
我开始认为这是“官僚主义的双重束缚”——如果没有判断,组织就无法运作,并且它无法在不损害自身和被视为“政治”的情况下承认判断。解决这个问题的一种方法是用数字代替判断。在他 1995 年出版的《相信数字》一书中,科学史家西奥多·波特认为,组织采用定量规则并不是因为数字更准确,而是因为它们更容易站得住脚。判断在政治上是脆弱的。规则不是。这个程序的存在是为了让自由裁量权消失,或者看起来。该系统的实际灵活性完全存在于这种未被承认的解释工作中,这意味着任何误认为它效率低下的人都可以将其删除。
1984 年,历史学家戴维·诺布尔 (David Noble) 指出,当美国军方和美国制造商实现工厂车间自动化时,他们始终选择速度较慢、成本较高的系统,但这些系统将决策权从工人手中转移到了管理层手中。重点不在于效率——它常常造成极大的浪费——而在于控制。一个了解自己在做什么的工人可以做出机构无法管辖的判断。将这种理解转移到系统中,工人除了遵循指示之外别无他法。Palantir 首席执行官 Alex Karp 在他的 2025 年著作《科技共和国》中准确描述了这一成就。“软件现在掌舵,”他写道,而硬件则成为在世界上实施人工智能建议的手段。“他的模型来自自然:蜂群和椋鸟的低语声。“一旦侦察兵返回蜂巢,就不会再对他们捕获的信息进行调解,”卡普写道。椋鸟不需要得到上面的许可,他们要求“不需要向中层管理人员每周报告,不需要向更高层领导进行演示,不需要为其他会议做准备的会议或电话会议”。这听起来很自由,甚至是乌托邦。但未经中介而传递的信号也是无人能质疑的信号。
卡普认为他正在摧毁官僚机构。他正在对其进行编码。蔑视会议、每周向高级领导人汇报和演示;他将这些视为官僚程序本身。他们不是。它们是人们解释程序的地方,是人们可以注意到类别不再适合情况的地方。瞄准原则仍然存在。它们现在是工作流程板上的列,是目标在被击中之前所经历的阶段。卡普消除的是该机构永远不会承认其所依赖的自由裁量权。剩下的就是一个可以执行其规则但无人解释这些规则的官僚机构。软件中编码的官僚主义不会屈服。它破碎了。时间
Shajareh Tayyebeh 学校的目标一揽子计划提供了军事设施。露西·苏克曼 (Lucy Suchman) 于 1987 年出版的《计划与情景行动》一书,至今仍然是对正式程序如何掩盖实际产生结果的工作的最尖锐的描述,她对此不会感到惊讶。事后计划看起来总是很完整。他们通过过滤掉其类别中无法识别的所有内容来实现完整性。这个包裹看起来和队列中的其他包裹没什么两样。但除此之外,该学校还出现在伊朗企业名单中。它在谷歌地图上可见。搜索引擎本来可以找到它。没有人搜索。每小时要做 1,000 个决策,没有人会这么做。一位前高级政府官员问了一个显而易见的问题: – 该建筑多年来一直在目标清单上。然而这一点却被错过了,问题是如何做到这一点。——确实是如何做到的。

国会没有授权这场战争。两周内,美军袭击了 6,000 个目标。学校就是其中之一。美军杀死了近 200 人,报道提到了“人工智能错误”,从而将这一事件归结为更好的算法或更好的护栏本来可以防止的事情。
在罢工发生后的几天里,人工智能的魅力组织了围绕该技术的整个政治对话:克劳德是否产生了幻觉,模型是否一致,人类是否对其部署负有责任。谁授权这场战争的宪法问题以及这次袭击是否构成战争罪的法律问题被一个技术问题所取代,这个问题更容易提出,但无法以其规定的条件来回答。克劳德的辩论吸收了能量。这就是魅力的作用。
它还掩盖了更深层次的事情:导致 175 至 180 人被杀的人为决定,其中大多数是 7 至 12 岁的女孩。有人决定压缩杀戮链。有人认为深思熟虑是一种延迟。有人决定建立一个每小时生成 1,000 个目标决策的系统,并称其为高质量。有人决定发动这场战争。数百人坐在国会山上,拒绝阻止。将其称为“人工智能问题”,为这些决策和人员提供了一个隐藏的地方。
本文的早期版本出现在人为官僚主义,Kevin T Baker 的子堆栈