技术的流行历史通常始于个人计算机,并且有充分的理由:这是大多数人使用过的第一个高科技设备。唯一比将“让每张办公桌、每个家庭配备一台电脑”作为企业目标这一大胆举措更令人印象深刻的是,微软在其长期竞争对手苹果公司的帮助下实现了这一目标。
事实上,不过,个人计算机浪潮是第二次技术浪潮,特别是对于大型企业而言。就经济影响而言,第一波浪潮,可以说是更重要的浪潮是后端办公室的数字化。这些是真实存在的工作:
这些是 1908 年银行的簿记员和出纳员;快进三十年,技术已经进步:
这张 1936 年盖蒂图片社照片的标题很有趣:
维护国家安全银行支票账户的新系统和纽约的信托公司(被称为“Checkmaster”)非常受欢迎,以至于银行不得不增加员工和设备。储户无需维持最低余额,而是为其账单上的每一项支付少量服务费。迄今为止,该银行已吸引了超过 30,000 个活跃账户。簿记员在 Checkmaster 帐户上发布条目时会显示出来。
令人惊讶的是,对流程变更的第一反应是提出一种以覆盖新边际成本为基础的业务模型;只有到了后来,公司才会考虑更大的前景,比如低边际成本的支票账户如何为银行整体带来更多业务,而这些业务量可以通过上述新技术得到支持。
再向前推进三十年,银行的后台看起来像这样:
现在图像是彩色的,所有员工都是女性,但也许令人惊讶的是,尽管所有的工作人员都是女性,但这张图像是彩色的。迄今为止发生的技术变革,特别是在打字机和计算器方面,与前两张没有太大不同。
然而,这张 1970 年的照片是同类照片中最后的一张:拍摄这张照片时,拍摄这张照片的美国银行已经开始将其所有会计和簿记工作转向计算机;美国的大多数企业很快就跟进了,其中两个主要应用程序是会计和企业资源规划。这些工作主要由手工完成。现在它们是由计算机完成的,不再需要双手。
2018 年,我使用四大消费科技公司:谷歌和 Facebook 描述了科技的两种哲学一边是苹果和微软。
在 Google 看来,计算机可以帮助你完成工作,并通过为你做事来节省你的时间。Duplex 是最令人印象深刻的例子,计算机可以为你打电话,但一般概念适用于谷歌的许多其他演示,特别是那些基于人工智能的演示:谷歌照片不仅会排序和标记你的照片,而且现在会提出具体的编辑;Google 新闻将为您查找新闻,地图将为您查找附近的新餐馆和商店。而且,恰如其分的是,主题演讲以 Waymo 的演讲结束,这将激励你
扎克伯格,就像 Facebook 经常出现的情况一样,给人一种更热情、更令人毛骨悚然的版本谷歌:Facebook 不仅想为你做事,还想做其首席执行官明确表示不会做的事情。然而,去年扎克伯格似乎已经感受到弥赛亚般的热情,这仅仅意味着 Facebook 采用了指导 Google 的同一理念的更极端版本:计算机为人们做事。
谷歌和 Facebook 的做法是有道理的,因为它们作为聚合器的地位,凭借其固有的实用性吸引最终用户。另一方面,苹果和微软是诞生于早期计算时代的平台:
这是技术的第二个哲学,它与另一个哲学是正交的:期望不是计算机计算机为您做您的工作,而是让您能够更好、更高效地完成工作。而且,有了这种理念,就产生了不同的责任感。皮查伊在谷歌主题演讲的开场白中承认,我们对解决这一问题负有深深的责任感,但这一声明的内在本质是谷歌的中心地位及其管理者的直接责任。另一方面,纳德拉坚持认为,责任在于科技行业的集体责任,以及我们所有寻求单独利用科技行业的人的责任
第二种哲学,即计算机是人类的帮助,而不是人类的替代品,是两者中年龄较大的一个;它最伟大的支持者先知,如果你愿意的话,就是微软最大的竞争对手,而他选择的类比,巧合的是,也与交通有关。不是汽车,而是自行车:
你可以在这些公司的人工智能方法中看到这一理念的轮廓。谷歌是最先进的,这要归功于它看到人工智能在其聚合产品中的明显应用,特别是搜索和广告。Facebook(现在的 Meta)在过去几年中取得了重大进展,它彻底改革了推荐算法和广告产品,使其也具有概率性,这既是为了应对 TikTok 在客户注意力方面的崛起,也是为了应对其确定性广告的切断由苹果应用程序跟踪透明度倡议推出的产品。在这两种情况下,他们作为聚合者的地位迫使他们单方面走出去,为人们提供可供查看的东西。
与此同时,苹果公司正在大力依赖Apple Intelligence,但我认为其最新的广告活动是有原因的感觉有点奇怪,事实上它正在宣传一项尚未提供给非测试版客户的功能。苹果与你手里拿着的宝石般的设备和普通人可以使用的软件联系在一起。让你的手机通过幻灯片来拯救一场鱼葬礼,感觉与史蒂夫·乔布斯在 iMovie 发布期间在舞台上制作电影的感觉不一致:
右边有一个骑自行车的人。
微软同时在技术上也处于领先地位,与 OpenAI 的合作关系日益紧张。然而,他们最初的人工智能产品重点显然是作为一种工具,正如他们最新的座右铭所说,让地球上的每个人和每个组织都能取得更大的成就。
首席执行官萨蒂亚·纳德拉 (Satya Nadella) 表示在最近宣布 Copilot Wave 2 的预先录制的主题演讲中:
您可以将 Copilot 视为 AI 的 UI。它可以帮助您打破工作工件、通信和业务流程之间的这些孤岛。而我们才刚刚开始。事实上,根据缩放法则,随着人工智能变得更加强大,甚至更加具有代理性,模型本身变得更加商品化,所有价值都是由你如何利用业务数据和工作流程引导、基础和微调这些模型来创造的。它如何与人与 AI 与人交互的 UI 层组合变得至关重要。
今天我们宣布了 Microsoft 365 Copilot 第 2 波。您将看到我们以三种主要方式发展 Copilot:首先,它将网络、工作和页面结合在一起,作为知识工作的新人工智能系统。通过 Pages,我们将向您展示 Copilot 如何从网络或您的工作中获取任何信息,并将其转化为多人 AI 驱动的画布。您可以使用人工智能进行构思并与其他人协作。这真是太神奇了。就像我们今天所知道的 PC 诞生的办公生产力工具一样,网络使这些画布具有协作性,每次平台转变都从根本上改变了工作工件,而 Pages 是人工智能时代的第一个新工件。
请注意,纳德拉像大多数流行历史学家(包括您真正的历史学家!)一样,正在伸出手来与个人计算机建立联系,但在这里,相关的个人计算机历史给纳德拉的类比带来了更多的阴影而不是光明。最初的个人电脑浪潮只不过是玩具,包括在当地无线电商店出售的 Commodore 64 和 TRS-80;1976 年发布的 Apple I 最初作为裸电路板出售:
一年后,Apple 发布了 Apple II;现在有一个案例,但你需要带上自己的电视:
两年后,Apple II 推出了一款杀手级应用程序,预示着个人电脑将进入工作场所:VisiCalc,第一个电子表格。
VisiCalcs 的商业实用性事实上是显而易见的,它是丹·布里克林 (Dan Bricklin) 在观看哈佛商学院讲座时构想出来的。不过,该实用程序并不是运行会计或 ERP 系统等关键业务软件;而是运行它。相反,拥有 Apple II 和 VisiCalc 的员工可以主动对他们的业务进行建模,并以基于计算水平的视图了解事物的运作方式,这种计算水平对于一个人来说太多了,但不足以雇用大量后台人员员工,或者,在这一点上,越来越多地在大型机上预留时间。
但请注意,这与苹果和微软构建工具的哲学是如何一致的:工具是用来使用的,但它们需要自愿以最大化其效用。我认为,这对于 Copilot 的使用来说是一个挑战:甚至在 Copilot 出现之前,员工就已经主动思考如何使用其他人工智能工具来更有效地完成工作。Copilot 的想法是,您可以拥有更好的 AI 工具,因为它集成了 Microsoft Graph 中的信息,并使其广泛可供您的员工使用,从而提高员工的工作效率。
To换句话说,Copilot 面临的真正挑战是变革管理问题:按每个席位每月收取 30 美元的费用是一回事,为所有员工提供一种令人惊叹的新工作方式是一回事;让所有员工改变他们的工作方式以便从您的投资中受益,并使 Copilot Pages 成为人工智能时代的新神器,这完全是一件更加困难的事情,与个人中的电子表格一致。计算机时代。
Salesforce 首席执行官马克·贝尼奥夫 (Marc Benioff) 在上周的 Dreamforce 主题演讲中对 Copilot 的慷慨程度要低得多。在将机器学习定义为人工智能的第一波浪潮之后,贝尼奥夫表示,Copilot 是第二波浪潮,从微软的角度来看,它从那里开始走下坡路:
我们进入了这个 Copilot 世界,但 Copilot 世界已经这是一个偶然的世界。在副驾驶世界中,客户对我们说,嘿,我有这些副驾驶,但他们的表现并不完全符合我们的要求。我们不知道副驾驶世界将如何让我们实现人工智能的真正愿景,即提高生产力,实现我们一直在寻找的更好的业务成果。我们只是不认为 Copilot 是我们未来的关键一步。在某些方面,他们将 Copilot 视为新的 Microsoft Clippy,我明白这一点。
Clippy 的比较很刻薄,但并非完全不公平,特别是在那些不这样做的用户的背景下知道足够的知识来凭意志进行操作。微软前高管史蒂文·辛诺夫斯基在《硬核软件》中解释道:
为什么微软要经历这一切并制造这些有风险甚至前卫的产品?当时许多人对此感到困惑。为了理解今天的这一点,我们必须认识到,在 20 世纪 90 年代初(及之前)使用 PC 不仅困难,而且令人困惑、令人沮丧、难以理解,而且总的来说,大多数人完全无法使用,除非您必须学习如何在工作中使用它。
Clippy 是 Office 专家的替代品,当人们想要在 Microsoft Office 中做一些他们知道可能但不可能的事情时,他们会咨询 Office 专家。发现;辛诺夫斯基承认,一个严重的错误是让 Clippy 对简单的任务太有帮助,比如当你输入“亲爱的约翰”并按回车键时,观察“看起来你正试图写一封信”。辛诺夫斯基反思道:
Clippy 的旅程(尽管我们尽了最大努力,这也是该功能后来的名称)对我来说在很多方面都与 PC 相似。这不仅仅是一个失败的功能,也不仅仅是像许多微软功能那样对一个太早出现的功能的讽刺性赞美。相反,Clippy 代表了试图为典型或普通人修复桌面隐喻的最后尝试,以便他们可以使用计算机。
每个人都逐渐意识到,PC 是一个代际变化,对于那些成长中的人来说,这是一个代际变化。与个人电脑相比,它只是生活中另一个随意使用的设备。正如我们所知,孩子们不需要不同的软件。他们只需要访问一台电脑。一旦他们拥有了 PC,他们就会用 Office 制作比我们更酷、更快、更有趣的文档。孩子们喜欢艺术字以及 Word 和 PowerPoint 中的新图形,他们比婴儿潮一代或 X 一代更容易、更频繁地使用它们,试图将打字机映射到计算机的功能上。
这不是复杂性让人们放慢了脚步,但真正担心的是错误的事情可能会毁掉数小时的工作。孩子们还没有那种恐惧。我们不需要担心软件的简单化,而需要更多地担心如何以风险低得多的方式完成更复杂的事情。
对于人工智能来说,这是一个重要的见解、副驾驶以及变革管理的概念:X一代和婴儿潮一代的一小部分人可能发明了个人电脑,但对于他们的其他人来说,他们只有在不得已的情况下才使用电脑(愤恨地),只有到那时,他们才使用电脑。完成其工作所需的一小部分功能。后来的几代人是伴随着个人计算机长大的,几乎不会再考虑在文档中插入表格或图形(如果事实上,他们甚至知道文档是什么)。对于千禧一代来说,使用个人电脑并不需要意志力,而是需要意志力。这只是生活中的一个事实。
不过,计算并不是从个人计算机开始的,而是从后台办公室的更换开始的。或者,用更可怕的术语来说,计算的最初价值并不是通过帮助婴儿潮一代更有效地完成工作而创造的,而是通过完全取代他们的整个群体而创造的。
贝尼奥夫含蓄地同意;副驾驶 Clippy 的侮辱是特工讨论的序言:
但这正在推动我们,他们试图说,下一步是什么?我们现在确实正处于那个时刻。这就是为什么这个节目是我们有史以来最重要的梦想力量。毫无疑问,这是最激动人心的梦想之力,也是最重要的梦想之力。您将在本次展会上看到的是您以前从未见过的技术您第一次为您的公司构建和部署第一个自主代理,这将帮助您提高生产力、增强员工能力并让这些变得更好业务成果,您会记得,就像第一次出现在您的 Waymo 中一样。这是人工智能的第三次浪潮。它的特工
特工不是副驾驶;他们是副驾驶。他们是替补。首先,它们确实可以代替人类认为的呼叫中心等,并且它们具有软件的所有优势:始终可用,并且可以根据需求上下扩展。
我们知道劳动力已经不堪重负。他们正在做这些低价值的任务。大流行后,他们的情况完全不同了。生产力处于不同的位置。能力处于不同的地方我们确实看到劳动力是不同的,我们意识到 41% 的时间似乎浪费在低价值和重复性任务上,我们希望解决这个问题。客户期望更多:零等待时间、更加个性化和同理心、始终与专家合作、即时安排事情。这就是我们的愿景,我们对这些代理商的梦想
如果这些劳动力完全没有限制怎么办?哇。这是一个奇怪的想法,但却是一个很大的想法。你开始把所有这些东西放在一起,然后你就可以建立另一种公司。我们可以构建不同类型的技术平台。我们可以利用我们已经拥有的 Salesforce 技术平台,以及大家在 Salesforce 平台上投入了大量资金,我们可以提供下一个功能。下一个功能将提高我们公司的生产力。让我们的员工更加充实。只是为了提供更好的业务成果。这就是 Agentforce。
本文不是关于 Agentforce 的可行性;而是关于 Agentforce 的可行性。我有些怀疑,至少在短期内是这样,原因我稍后会讲到。相反,关键部分是最后几句话:贝尼奥夫不是在谈论如何提高员工的生产力,而是在谈论公司;适用于员工的动词是augmented,听起来比replace要好听得多;还规定了最终目标:业务成果。这就是技术的第三个理念:提高大型企业的利润。
请注意,这个框架如何适用于大型机计算浪潮:会计和 ERP 软件提高了公司的生产力并推动了积极的业务成果;增加的员工是经理,他们可以更快地获得更准确的报告,而过去从事这项工作的员工则被替换。至关重要的是,是否做出这一改变的决定并不取决于普通员工改变工作方式,而是取决于高管决定冒险一试。
当贝尼奥夫于 1999 年创立 Salesforce 时,他想出了一个违反直觉的徽标:
当然 Salesforce 是软件;但它是软件。它不是软件,就像他以前的雇主甲骨文出售的那样,这在当时意味着可能需要数年时间的痛苦安装和迁移,甚至经常会失败。Salesforce 不同:它是一个云应用程序,您永远不需要安装或更新;它是一个云应用程序。您只需订阅即可。
基于云的软件即服务公司现在已成为常态,这在一定程度上要归功于贝尼奥夫的愿景。而且,正如 Salesforce 最初主要为您提供服务一样,您猜对了!销售人员,SaaS 应用程序可以专注于公司的各个部门。事实上,过去十年的一大趋势是 SaaS 应用程序,至少在早期,通过个人或团队领导者的口碑和试用而增长;毕竟,您只需一张信用卡即可开始使用,如果有免费增值模式,甚至连信用卡都不需要!
这一趋势是更大趋势的一部分,即所谓的 IT 消费化。道格拉斯·尼尔 (Douglas Neal) 和约翰·泰勒 (John Taylor) 在 2001 年首次创造了该术语,并在 2004 年的立场文件中写道:
公司必须将用户视为消费者,通过提供选择、简单性来鼓励员工承担责任、主人翁精神和信任和服务。许多IT部门传统上对最终用户采取的父/子态度现在已经过时了。
这实际上是Sinofsky所做的另一种说法:企业IT客户,即公司员工,不不再需要学习如何使用计算机;他们和他们一起长大,并期望计算机能够像他们的消费设备一样工作。此外,消费设备的数量意味着创新现在将来自技术方面,而企业跟上潮流的最佳方式是理想地采用消费基础设施,除此之外,还要寻求同样易于使用的基础设施。
这可能就是人工智能的表现;这就是迄今为止所发生的事情,因为由 OpenAI、Anthropic、Google 或 Meta 构建的大型模型是根据公开数据进行训练的,然后可针对特定于企业的用例进行微调。然而,这种方法的局限性在于人为因素:你需要有意愿使用人工智能的员工,但这种方法会带来固有的问题,包括不良数据、幻觉、安全问题等。只要有动力的人处于循环之中;在我看来,任何类型的自主代理实际上都不太可能以一种可以提高公司效率的方式运作,而无需大量的监督,最终使整个努力变得更加昂贵。
此外,在这种情况下对于 Agentforce 具体而言,以及更广泛的其他代理计划,我不相信管理自回归大型语言模型所需的基础设施最终将如何可行和可扩展。我在此更新中遇到了一些挑战:
传统大语言模型面临的最大挑战是它们是路径依赖的;虽然他们可以从整体上考虑这个谜题,但一旦他们做出特定的猜测,他们就会陷入困境,注定会失败。这是所谓的自回归大型语言模型的一个根本弱点,迄今为止,这是所有这些模型的一个根本弱点。
为了大大简化,大型语言模型会生成一个标记(通常是一个单词,或单词的一部分)基于生成令牌之前的所有令牌;特定的标记是从模型训练中得出的统计上最有可能的下一个可能的标记(这也变得复杂,因为输出的温度决定了从最佳可能选项中进行选择的随机性水平;低温选择最有可能的下一个标记令牌,而更高的温度更有创意)。不过,要理解的关键是,这是一个串行过程:一旦生成了令牌,它就会影响接下来生成的令牌。
这种方法的问题是,在在填字游戏之类的上下文中,生成的标记是错误的;如果该标记是错误的,则下一个标记也更有可能是错误的。当然,即使第一个标记是正确的,第二个标记也可能是错误的,从而影响第三个标记,依此类推。更大的模型可以降低特定标记错误的可能性,但这种可能性总是存在的,即可以说,自回归大语言模型不仅不可避免地会出现错误,而且还会出现复合错误。
请注意,即使有专门的提示,例如坚持大语言模型要逐步进行或将问题分解为组成部分;它们仍然是串行输出机器,一旦出错,就注定会给出错误的答案。同时,这对于很多应用程序来说也很好,比如写作;问题出现的地方是任何需要逻辑或迭代推理的事情。在这种情况下,一个足够复杂的填字游戏就足够了。
该更新是关于 OpenAI 的新
o1模型,我认为这是可行性方面的一步改变代理人;我在该更新中使用的示例是解决填字游戏,该任务无法一次性完成,但可以通过
o1完成。
o1明确训练如何解决问题,其次,o1旨在在推理时生成多个解决问题的流,选择最好的一个,并迭代每个步骤在此过程中,当它意识到自己犯了错误时。这就是为什么它花了很长时间才把填字游戏弄对。
o1引入了一个新的潜在改进向量:而自回归大语言模型的质量随着训练集的增加而扩大大小(以及所需的计算量),
o1缩放推理。该图片来自 OpenAIs 公告页面:
第二张图片是 Copilot 范式中的一个潜在问题:当然,更智能的模型可能会提高员工的工作效率,但生产力的提高必须通过两者来平衡更大的推理成本和更多的等待模型的时间(
o1比
4o等模型明显慢)。然而,当你谈论更换工人时,代理方程是截然不同的:那里的成本伞绝对是巨大的,因为即使是最昂贵的模型也便宜得多,超越了其他好处,例如始终可用并且数量可扩展。
更重要的是,扩展计算正是技术行业所擅长的。从 PC 到 SaaS 和 IT 消费化的第一波计算的一个共同点是,由计算控制的问题不是通过过早的优化而是通过处理能力的进步来解决。关键的挑战是知道要扩展什么,我相信 OpenAI 已经展示了将从中受益的架构。
剩下的就是数据部分,而贝尼奥夫尽管 Salesforce 吹嘘拥有所有数据,但它并没有拥有一切,而且它所拥有的数据分散在构成 Salesforce 平台的应用程序和存储层的方阵中。事实上,微软面临着同样的问题:虽然他们的 Copilot 愿景在这种情况下包括用于第三方代理的 API,但来自其他公司的数据现实是,一个有效的代理(即工人替代者)需要以一种可以推理的方式访问所有内容。。大型语言模型处理非结构化数据的能力是革命性的,但事实仍然是,更好的数据仍然会带来更好的输出;例如,明确的逐步推理数据是
o1工作原理的重要组成部分。
为此,我最感兴趣的公司是我最感兴趣的公司认为将是AI的第一波浪潮的是Palantir。直到 2023 年采访首席技术官 Shyam Sankar 和全球商务主管 Ted Mabrey 之前,我才完全了解这家公司;我建议阅读或聆听整个内容,但我想特别指出这次交流:
是否有一个顿悟时刻,您有这个概念,您现在在开头使用这个短语你所有的财务报告,就是你企业的操作系统。现在,显然这仍然是政府时代,但有趣的是 S-1 使用了这条线,但再往下看,它不是主导的东西。这是后来出现的东西还是这样,不,我们必须成为从一开始就到位的所有想法的接口?
Shyam Sankar:我认为其中的关键部分是真正意识到我们构建原始产品的前提是我们的客户已集成数据,我们可以专注于集成数据后进行的分析。我觉得创始创伤是意识到实际上每个人都声称他们的数据是集成的,但这是一团糟,实际上我们业务中更有趣和更有价值的部分是开发使我们能够将数据集成产品化的技术,而不是让它就像一个为期五年永不停歇的咨询项目,这样我们就可以做我们真正开始业务时要做的事情。
这种集成看起来像公司网页上的插图Foundry,他们称之为现代企业本体驱动的操作系统:
此图值得注意的是 Palantir 需要深入企业运营才能实现其目标。这不是您的团队领导在信用卡上添加的消费 SaaS 应用程序;这是 Salesforce 寻求超越的软件。
但是,如果您认为人工智能不仅仅是计算的下一步,而且是一个全新的范式,那么企业认为人工智能是有道理的解决方案可能会回到未来。从用户行为来看,我们已经看到了这种情况:大多数员工与人工智能的关系就像 20 世纪 80 年代大多数企业员工与 PC 的关系一样;当然,如果有必要,他们会使用它,但他们不想改变他们的工作方式。这将落在下一代人身上。
然而,高管们现在就想要人工智能的好处,我认为,就像第一波计算浪潮一样,这种好处将来自于取代人类,而不是提高他们的效率。推而广之,这将意味着自上而下的长达数年的举措,而随之而来的巨大业务成果将证明这些举措是合理的。这也意味着进入市场的动作和商业模式将发生变化:成功的人工智能公司将需要从高层进入,而不是通过有机增长来实现被动销售。而且,我们最终可能会获得更类似于席位更换许可证的东西,而不是按席位许可证(值得注意的是,Salesforce 将针对其代理之一完成的每个呼叫收取 2 美元的费用)。服务和集成团队也将卷土重来。值得注意的是,这是对 Palantirs 模式的一贯批评,但我认为这是来自 SaaS 色彩的观点;四十年前的科技高管和投资者对长达数年的参与的想法更加熟悉。
大多数历史驱动的人工智能类比通常来自互联网,这是可以理解的:这不仅是一个划时代的变化,而且在我们的集体记忆中也更加新鲜。然而,我在这里的核心论点是,人工智能确实是一种新的计算方式,这意味着更好的类比是计算本身。变压器是晶体管,大型机是当今的模型。可以说,GUI 仍处于待定状态。
如果这是正确的,那么最大的机会在于自上而下的企业实施。企业哲学比我之前写的两种消费者哲学更古老:它的动机不是用户,而是买家,他们想要增加收入和削减成本,并且对于如何实现这一目标(包括运行期望值)会非常理性。对代理人犯错误的计算)。这将是证明扩展代理能力所需的计算合理性的唯一方法,也是证明在人类可以被取代的状态下获取数据所需的多年工作的唯一方法。企业哲学的本质将迫使我们这样做。
而且,推而广之,我们等待人工智能接管消费领域的时间可能比我们预期的要长,至少在一定规模上是这样。例如智能手机或社交媒体。对于所有用户自愿的 MKBHD 来说,这都是个好消息,但对于其他人来说,最大的回报可能是在娱乐和游戏等领域。人工智能真正的消费化将留给下一代,他们将永远不会知道没有人工智能的世界。