生成式人工智能能否进入高管层,甚至取代首席执行官?
乍一看,人工智能取代首席执行官的想法似乎与成功晋升一名初级分析师领导董事会。毕竟,人工智能很容易出现重大错误,例如产生错误或误导性信息的幻觉,以及在过程中容易丢失任务的趋势。这些通常不是与有效领导相关的品质,特别是在需要平衡多个利益相关者的利益、分析历史趋势、发现市场微妙变化以及制定塑造公司未来的战略决策的角色中。
尽管如此,生成式人工智能已经正在重塑既需要精度又需要创造力的行业。例如,AlphaFold 以前所未有的精度彻底改变了蛋白质折叠,改变了生物物理学领域,而 OpenAIs Codex 可以根据简单的人类指令生成整个软件程序,从而提高软件工程的能力。这些复杂、困难的任务在几年前似乎还远远超出了人工智能的能力。那么,为什么担任首席执行官的角色是遥不可及的呢?
迄今为止,几乎没有关于人工智能在现实场景中如何担任首席执行官的实证数据,特别是与人类相比类似条件下的决策。人工智能的优势和劣势只有在广泛的情况下进行测试才能充分显现出来。我们已经朝着这个方向迈出了第一步,进行了大规模的现实世界实验,为更深入地探索人工智能在高管层中的潜在作用和影响打开了大门。
我们的实验从 2024 年 2 月到 7 月进行,涉及 344 名参与者(包括来自中亚和南亚大学的本科生和研究生以及南亚银行的高管)和 GPT-4o,一种当代大语言模型(LLM)由 OpenAI 创建。参与者进行了游戏化模拟,旨在复制首席执行官面临的各种决策挑战,并使用各种指标来跟踪他们的选择质量。该模拟是美国汽车行业的粗粒度数字孪生,结合了基于汽车销售真实数据、市场变化、历史定价策略和弹性以及经济趋势和 Covid-19 影响等更广泛影响的数学模型。(披露:该游戏是由我们位于英国剑桥的初创公司 Strategize.inc 开发的)。
玩家通过游戏界面以每轮为基础做出一系列公司战略决策。每轮代表一个财政年度,这种结构使参与者能够在几个模拟的、相互关联的年份中应对战略挑战。因此,该游戏每轮有超过 500,000 种可能的决策组合,并且没有固定的获胜公式。游戏的目标很简单,就是在不被虚拟棋盘解雇的情况下尽可能长时间地生存,同时最大化市值。前者由董事会设定的一组独特的关键绩效指标(KPI)决定,后者由可持续增长率和自由现金流共同驱动。这一目标可以作为衡量现实世界 CEO 绩效的现实指标。
人类参与者完成轮流后,我们将控制权移交给 GPT-4o。然后,我们针对四名人类参与者(两名顶尖学生和两名高管)对 GPT-4os 的性能进行了基准测试。结果既令人惊讶又具有挑战性,挑战了我们关于领导力、战略以及人工智能在最高业务层决策中的潜在作用的许多假设。
GPT-4os 作为 CEO 的表现非常出色。大语言模型在几乎所有指标上都始终优于顶尖人类参与者。它设计的产品具有外科手术般的精度,在保持严格成本控制的同时最大限度地提高吸引力。它对市场信号反应良好,使其非生成式人工智能竞争对手保持优势,并建立了如此强劲的势头,以至于领先三轮超过了表现最好的学生市场份额和盈利能力。
但是,有一个问题严重缺陷:GPT-4o 被虚拟板发射的速度比玩游戏的学生更快。
为什么?人工智能在 Covid-19 大流行期间与市场崩溃等黑天鹅事件作斗争。我们对这些不可预测的冲击进行了编程,以改变客户需求、降低价格水平并给供应链带来压力。表现最好的学生采取了适合他们的长期策略。他们避免了严格的合同,最大限度地降低了库存风险,并谨慎地管理增长,确保了市场状况发生变化时的灵活性。他们的策略很明确:保持适应性,而不是追逐激进的短期收益。
GPT-4o 另一方面,在取得一系列早期成功之后,锁定了短期优化思维,不断地最大化增长和盈利能力,直到市场冲击破坏了其连胜势头。人工智能可以在受控环境中快速学习和迭代,这使得它不太适合应对需要人类直觉和远见的高度破坏性事件。有趣的是,高管们也陷入了这个陷阱。他们和 GPT-4o 一样,被虚拟板解雇的速度比学生更快。GPT-4o 和高管都陷入了同样的缺陷,即对一个奖励灵活性和长期思考以及积极进取的野心的系统过度自信。
尽管如此尽管存在局限性,GPT-4o 却提供了令人印象深刻的性能。虽然它比人类顶级玩家被解雇的次数更多,但它在与全球 344 名参与者中最优秀、最聪明的玩家的较量中仍然保持着自己的优势。那么,基于该实验的元策略制定对现实世界有何影响?以下是一些初步想法:
在企业战略中忽视生成式人工智能已不再可行。该实验表明,即使是未经调整的模型,如果得到适当的提示,也可以提供独特且富有创意的策略方法,从而产生强有力的结果。如果生成式人工智能可以帮助公司更有效地实现股东价值最大化,为什么要抵制呢?毕竟,股东价值最大化才是首席执行官这一角色存在的理由。
人工智能要在企业战略中脱颖而出,需要高质量的数据。GPT-4o 在这个实验中表现良好,因为它可以从模拟器获取丰富的数据。然而,许多公司在速度、数量、准确性和多样性方面生成的数据不够多。在将生成式人工智能引入董事会之前,建立强大的数据基础设施至关重要。
虽然人工智能驱动的效率可以创造显着的收益,但它也伴随着风险。如果没有足够的监督,人类高管采取激进的股价最大化策略可能会导致灾难性的后果。对于无人监督的人工智能或在没有监督的情况下使用人工智能的人类来说没有什么不同。
以与人类首席执行官相同的方式让人工智能负责几乎是不可能的。删除该系统并不能消除错误决策造成的损害,从而引发了有关责任和公共保护的关键问题。建立透明的护栏,确保人工智能驱动的决策符合公司价值观和社会公益,对于防止意外后果至关重要。
企业的现实数字孪生由多个大语言模型代理组成的生态系统可以作为人工智能领导力的一个有价值的沙箱,为人工智能在完全独立的情况下可能犯下的现实世界失误提供缓冲,同时为首席执行官做出重大决策提供丰富的见解。在这样一个封闭的环境中,人工智能可以犯错误,识别价值池,并以优化的策略返回以实现公司的目标。我们想象一组专门针对公司数字孪生的 LLM 代理,在针对该组织及其生态系统量身定制的沙箱(或道场,使用硅谷的另一个术语)环境中不断发展(披露:我们的初创公司 Strategize.inc 正在努力提供向企业和政府机构提供这种能力。)
人工首席执行官的崛起可能会颠覆传统的战略咨询和内部战略部门。像麦肯锡这样的公司可能会发现他们的服务被针对其客户生态系统量身定制的人工智能系统所补充甚至取代。
退后一步,我们认为主要的结论是:尽管人工智能表现令人印象深刻,但它不能假设首席执行官在为人类服务的市场中承担全部责任。相反,它可以显着改进战略规划流程,并有助于防止代价高昂的错误。我们已经看到第一代人工智能如何通过价格匹配和广告库存管理等任务成功推动亚马逊和谷歌等科技巨头的功能级微观策略。再加上强大的学习和网络效应,就是这些企业巨头的秘密武器。生成式人工智能是该运营模式的下一个逻辑演进:元人工智能充当首席执行官,在数字孪生沙箱中与其他人工智能竞争和协作,从而使人类首席执行官做出比其他情况下更好的决策。
生成式人工智能的最大优势不在于取代人类首席执行官,而在于增强决策能力。通过自动执行大量数据分析和对复杂场景进行建模,人工智能使人类领导者能够专注于人类擅长的战略判断、同理心和道德决策领域。
人类首席执行官面临的真正风险是什么?执着于我们将独自掌控未来的幻想。领导力的未来是混合型的,人工智能将补充人类首席执行官对愿景、价值观和长期可持续性的关注。蓬勃发展的首席执行官将是那些掌握这种协同作用的人,他们利用人工智能作为决策的合作伙伴,而不是竞争对手。