英语轻松读发新版了,欢迎下载、更新

人工智能的到来不均衡

2025-01-13 14:59:09 英文原文

十年前的这个月,Box 的 IPO 之路十分艰难:该公司于 2014 年 3 月首次发布 S-1,潜在投资者对该公司不断增加的亏损感到震惊;该公司进行了一轮下一轮融资,并在八个月后发布了更新后的S-1该公司为亏损的 SaaS 企业创建了一个模板来解释自己的未来:

我们的商业模式专注于最大化客户关系的终身价值。我们在获取新客户方面进行了大量投资,并相信随着时间的推移,通过留住客户并扩大我们在客户群中的部署规模,我们将能够从这些投资中获得积极的回报……

我们与客户的盈利能力在很大程度上取决于他们所处的客户阶段。我们通常会为新客户和仍处于扩张阶段的现有客户承担更高的销售和营销费用……对于典型客户对于续订 Box 订阅的客户,我们的相关销售和营销费用明显低于我们从这些客户那里确认的收入。

SaaS company cohort analysis

这就是那些营收亏损的理由。我写在当时的更新:

这就是 SaaS 商业模式:与其说你是在销售产品,不如说你是在创造年金,其终生价值远远超过你为获得它们而支付的费用。此外,如果这个模型有效——现在回想起来,我们知道它对于 2010 年的那一批人来说是有效的——那么我作为投资者绝对希望 Box 在客户获取上投入更多,当然,Box 已经做到了这一点。2011 年的损失比 2010 年的损失更大,2012 年的损失比 2011 年的损失更大,等等。不过,这意味着总损失非常大,这看起来很糟糕,但与直觉相反,这是一件好事。

许多 SaaS 企业都会在其 S-1 中包含此队列图表的某些版本,其中每一个都体现了我长期以来认为的科技第六巨头:Apple、Amazon、Google、Meta、Microsoft 和我称之为“硅谷公司”,SaaS 公司的管道,这些公司自诩为改变世界的初创公司,但事实上,它们是按数字区分的商业模式颠覆者云计算和急剧扩张的风险投资生态系统推动了这一趋势,该生态系统越来越多地接受相对较低的回报,以换取大幅降低的风险状况。

需要明确的是,这不是一篇关于 Box 或任何一家 SaaS 公司的文章;不过,这是对十年前开启的时代(至少在首次公开募股方面)的探索,从长远来看,这个时代注定会失败,但它的持久力却可能比你预期的要强。

数字广告差异

百货公司创始人和广告先驱约翰·沃纳梅克 (John Wanamaker) 有一句名言:“我花在广告上的钱有一半被浪费了;我花在广告上的钱有一半被浪费了。”问题是我不知道是哪一半。但那是 19 世纪末;现在已经是 19 世纪末了。过去二十年见证了数字广告的兴起,其决定性特征是了解目标受众以及他们是否进行了转化。随着时间的推移,其运作方式的细节已经发生了变化,特别是随着对 cookie 的打击和苹果公司的应用程序跟踪透明度计划,这使得数字广告的确定性降低,概率性增加;不过,实际发生的概率比抛硬币的概率更接近 100%。

有趣的是,这种广告方法并不总是适用于所有情况,尤其是世界上一些最以广告为中心的企业。早在 2016 年,宝洁公司就宣布缩减 Facebook 定向广告规模;从华尔街日报:

全球最大的广告支出公司宝洁公司 (Procter & Gamble Co.) 将不再在 Facebook 上投放针对特定消费者的广告,因为该公司认为这种做法的效果有限。Facebook Inc. 花了数年时间开发根据人口统计、购物习惯和人生里程碑将消费者归零的能力。宝洁公司是包括汰渍(Tide)和帮宝适(Pampers)在内的众多家居用品制造商,它最初抓住了直接向购物者群体(从青少年剃须刀到首次购房者)进行营销的机会。

宝洁公司首席营销官马克·普里查德 (Marc Pritchard) 表示,该公司已经意识到这一战略走得太远了。“我们的目标太大,范围太窄,”他在接受采访时说道,“现在我们正在考虑:什么是既能达到最大影响力又能达到正确精度的最佳方式从更广泛的角度来看,宝洁公司的转变凸显了这种针对大品牌的局限性,而大品牌是 Facebook 广告业务的基石之一。社交网络能够为其定向营销索取更高的价格;定位范围越窄,广告的价格就越高。

宝洁公司是一家消费品公司,对于消费品公司来说最重要的是货架空间。消费者会通过广告了解一个品牌,并通过优惠券之类的东西来购买,当他们在商店里选择一个现成的 CPG 品牌时,回报就来了;当然,消费品公司为货架空间付费,尤其是令人垂涎的端盖,这使得消费者更有可能通过广告看到他们熟悉的品牌。规模回报也有:制造业是一个大行业;您购买的广告越多,每个广告支付的费用就越少;更重要的是,你拥有的货架空间越多,你就有更多的空间来扩展你的产品线,并排挤竞争对手。

广告部分通常被外包给广告代理商,原因我在2017年的一篇文章:

很少有广告商真正购买广告,至少不是直接购买。早在 1841 年,第一家广告公司 Volney B. Palmer 在费城开业。广告商可以直接与广告代理机构打交道,从而不必在多家报纸上投放广告,从而大大简化了投放广告的过程。与此同时,广告公司可以利用其与所有这些报纸的关系,为多个客户提供服务:

A drawing of The Pre-Internet Ad Agency Structure

这是一个典型的例子,说明处于中间位置如何可以成为一个真正巨大的商机,随着广播和电视等更多广告形式的出现,广告代理商的效用只会增加。尤其是电视,广告商不仅需要投放广告,还需要更多的广告制作帮助;广告机构投资于广告制作专业知识,因为他们可以在多个客户中扩展所述专业知识。

与此同时,广告商正在迅速扩大其地理足迹,特别是在第二次世界大战之后。自然地,广告公司同时也扩大了他们的足迹,通常是通过并购。不过,最重要的商业机会是相同的:为广告商提供满足其所有广告需求的一站式服务。

互联网给这种方法带来了两大挑战。一是主要转化点从收银台转向结帐页面;受益最多的产品要么是纯粹的数字产品(如应用程序),要么是——至少在电子商务的早期——没有重大时间压力的一时冲动购买。CPG 产品实际上并不属于这两类。

其次,这些类型的购买与数字广告的组织原则(即个人消费者)非常吻合。Facebook(现在的 Meta)比世界上任何人都更擅长的是,将消费者理解为个人,而不是群体或人口群体的成员,并向他们提供他们独特感兴趣的广告。

但请注意,传统广告商模式中没有任何内容与个人有关:品牌是为群体或人口群体创建的,因为它们需要大规模生产;然后,广告代理商会大规模投放广告——一路赚钱——而购买将在稍后的某个时间点在实体店完成,受到有限货架空间的限制(并推动)。因此,宝洁公司的撤退,也为一波从一开始就围绕数字广告及其深度个性化而建立的全新公司带来了机会。

这种分歧在 2020 年夏天表现得最为明显,当时大型广告商因 Facebook 拒绝审查时任总统特朗普而抵制该公司;Facebook 几乎没有受到影响。我写在苹果和脸书:

这与 Facebook 的情况截然不同,截至 2019 年第一季度,排名前 100 的广告商占该公司广告收入的比例不到 20%;该公司去年带来的 697 亿美元收入中,大部分来自 800 万广告商的长尾……

这就解释了为什么从财务角度来看,大型消费品公司抵制 Facebook 的消息根本不是什么大不了的事。举个例子,联合利华 (Unilever) 在美国的 1180 万美元广告支出被 Facebook 的时间表确保您永远不会用完内容的自动化效率所取代。此外,虽然 Facebook 损失了一些营收——在基于拍卖的系统中,需求减少对应着更低的价格——最有可能利用这些更低价格的公司是那些没有价格就不会存在的公司。Facebook,就像直接面向消费者的公司一样,试图从联合利华等大型企业集团那里抢夺客户。

通过这种方式,Facebook 拥有了连谷歌都缺乏的一定程度的反脆弱性:它的大部分业务都来自于互联网本土公司的长尾,而这些公司是从第一原则出发围绕 Facebook 建立起来的,任何对传统广告商的干扰——比如冠状病毒危机或当前的抵制活动实际上是为了加强 Facebook 生态系统,但以牺牲这些 CPG 公司所属的以电视为中心的生态系统为代价。

自我上面提到的宝洁公司撤回以来已经九年了,宝洁公司在这段时间内所做的重大变化之一是大部分广告购买都在内部进行。从长远来看,这是不可避免的,因为互联网吞噬了一切,包括传统的电视观看,并且随着聚合平台的兴起,意味着即使潜在覆盖范围增加,实际购买广告以覆盖所有人所需的地方数量也会减少。这些平台也变得更好:程序化平台以实际提高效率的方式实现了宝洁大众覆盖的目标,而不是过度支出而达到过度目标;程序化广告现在也覆盖了更多平台,包括电视。

o3弹药

上个月底 OpenAI 宣布o3模型,验证其初始值奥1发布和测试时间扩展带来的回报;我解释过在更新中什么时候奥1被释放:

关于规模对于法学硕士成绩的重要性已经有很多讨论;对于自回归法学硕士来说,这意味着培训规模。您拥有的参数越多,您需要的基础设施就越大,但回报是更高的准确性,因为模型包含了更多的信息。这当然仍然适用于奥1,如左图所示。

o1 scales with both training and inference compute

右边的图表才是更重要的:奥1在推理时花费在计算上的时间越多,就越准确。考虑到我上面列出的内容,这直观上是有道理的:花在计算上的时间越多,时间就越多奥1可以花费时间旋转多个思维链,检查其答案,并迭代不同的方法和解决方案。

这也与我们迄今为止对法学硕士的看法有很大不同:自回归法学硕士的“好处”之一是您只需以串行方式生成一个答案。是的,您可以使用更强大的硬件更快地获得答案,但这是另一种说法,更多推理计算的回报是更快地获得答案;答案的准确性是基础模型的函数,而不是计算量的函数。另一种思考方式是,对于推理而言,更重要的问题是有多少内存可用;内存越多,模型越大,因此精度越高。

在这个奥1代表了一种新的推理范式:是的,您需要内存来加载模型,但给定相同的模型,答案质量确实会随着更多的计算而提高。我的想法是,更多的计算有点像拥有更多的分支预测器,这意味着更多的寄存器,需要更多的缓存等;这不是一个完美的类比,但有趣的是,将推理计算视为法学硕士的一种动态内存架构,让他们探索潜在空间以获得最佳答案。

o3显着优于奥1,而表现优异的程度取决于分配给当前问题的计算量。最明显的例子之一是o3Ø 在 ARC 奖上的表现,一个视觉谜题测试,其设计对人类来说很容易,但对法学硕士来说很难:

OpenAI 的新 o3 系统在 ARC-AGI-1 公共训练集上进行训练,在我们规定的公共排行榜 1 万美元计算限制下,在半私人评估集上取得了突破性的 75.7% 成绩。高计算 (172x) o3 配置得分为 87.5%。

o3 test results on ARC

这是人工智能能力中令人惊讶且重要的阶跃函数增强,显示出 GPT 系列模型中从未见过的新颖的任务适应能力。就背景而言,ARC-AGI-1 用了 4 年时间从 2020 年 GPT-3 的 0% 上升到 2024 年 GPT-4o 的 5%。所有关于 AI 功能的直觉都需要针对 o3 进行更新……

尽管每项任务的成本很高,但这些数字不仅仅是对基准应用强力计算的结果。OpenAI 的新 o3 模型代表了人工智能适应新任务的能力的重大飞跃。这不仅仅是渐进式的改进,而是真正的突破,标志着与法学硕士之前的局限性相比,人工智能能力发生了质的转变。o3 是一个能够适应以前从未遇到过的任务的系统,可以说在 ARC-AGI 领域接近人类水平的表现。

当然,这种通用性需要付出高昂的成本,而且还不太经济:你可以花钱雇一个人来解决 ARC-AGI 任务,每个任务大约 5 美元(我们知道,我们就是这样做的),而只消耗几美分在能源方面。与此同时,o3 在低计算模式下每个任务需要 17-20 美元。但在接下来的几个月和几年里,性价比可能会显着提高,因此您应该计划这些功能,以便在相当短的时间内与人类工作竞争。

我不相信o3推理时间扩展将取代传统的法学硕士,而传统的法学硕士仍将更快、更便宜;事实上,他们可能会通过生成合成数据以进一步扩展预训练的能力,使传统的法学硕士变得更好。传统的 LLMS 仍然存在大量产品悬而未决的问题——该技术比迄今为止开发的产品功能要强大得多——但即使是当前的主导产品聊天机器人也比传统的 LLM 拥有更好的经验。

然而,这个用例遇到了传统法学硕士的局限性:因为它们缺乏思考、决定和验证的能力,所以最好将它们视为人类可以利用的工具。事实上,虽然关于这些模型的传统观点是,它允许任何人产生足够好的写作和研究,但最大的回报来自于那些拥有最专业知识和代理能力的人,他们能够利用自己的知识和判断力,在管理的同时获得效率收益。幻觉和错误。

什么o3推理时间缩放指向的是不同的东西:人工智能实际上可以被赋予任务并被信任来完成它们。推而广之,它看起来更像是一个独立的工人,而不是一个辅助弹药,而不是一个步枪瞄准器。这似乎是一个奇怪的类比,但它来自Keith Rabois 在斯坦福大学的演讲:

所以我喜欢枪管和弹药的想法。大多数公司,一旦进入招聘模式……只要雇佣很多人,你就会期望当你增加更多的人时,你的马力或运输速度会增加。事实证明,事实并非如此。当你雇佣更多的工程师时,你并不能完成更多的工作。事实上,有时你做得更少。你雇用更多的设计师,你绝对不会在一天内完成更多的工作,而是完成更少的工作。

之所以如此,是因为大多数伟大的人实际上都是弹药。但你的公司需要的是桶。而且你只能射穿你拥有的独特枪管数量。这就是通过添加桶来提高公司速度的方法。然后你给他们储备弹药,然后你就可以做很多事情了。你从一桶公司(这主要是你开始的方式)转变为两桶公司,突然间你每天、每周、每个季度完成的事情是两倍。如果你去三桶,那就太好了。如果你去四个桶,那就太棒了。桶很难找到。但当你拥有他们时,给他们大量的股权。宣传他们,每周带他们去吃饭,因为他们实际上是不可替代的。它们也非常具有文化特色。因此,一家公司的桶可能与另一家公司的桶不同,因为桶的定义之一是,他们可以从概念中获取一个想法,然后将其一路运输并带人一起。这是一项非常有文化的技能。

一般来说,人工智能(尤其是推理时间缩放模型)的前景是它们可以成为弹药;在这种情况下,从长远来看,与人员成本相比,成本(甚至是边际成本)将变得微不足道,特别是当你考虑到协调和激励等非工资成本时。

人工智能的到来不均衡

尽管第一个技术的到来,从技术上实现这一愿景还有很长的路要走奥1进而o3这表明未来的到来比大多数人意识到的要快。OpenAI 首席执行官山姆·奥尔特曼在他的博客上写道:

我们现在确信我们知道如何构建我们传统上理解的通用人工智能。我们相信,到 2025 年,我们可能会看到第一批人工智能代理“加入劳动力队伍”,并极大地改变公司的产出。我们仍然相信,不断地将强大的工具交到人们手中会带来伟大的、广泛传播的成果。

我同意技术上的乐观态度;我对 AGI 的定义是它可以是弹药,即它可以被赋予任务并相信它能够以足够好的速度完成它(我对人工智能(ASI)的定义是能够在首位)。然而,我之所以在广告上大谈特谈,是为了解释为什么我对人工智能持怀疑态度,至少在 2025 年,它会“实质性地改变”公司的产出。

在这个类比中,消费品公司代表了整个企业界。一旦人工智能弹药可用,我们就会清楚大多数公司是多么不适合高精度代理,就像宝洁不适合高度针对性的广告一样。无论公司的流程记录得多么完善,很明显,存在着巨大的空白,这些空白是通过人类弹药的经验和隐性知识来填补的。

与此同时,SaaS 公司就是广告代理公司。广告代理商的价值在于为广告商提供了一种跨地域扩展到各种媒体的方式。SaaS 公司通过提供人类弹药软件来完成他们的工作而有价值。与此同时,广告代理商通过对购买的广告收取佣金来赚钱。SaaS 公司通过收取每个席位的许可费来赚钱。再看一下我开头的 S-1 摘录:

我们的商业模式专注于最大化客户关系的终身价值。我们在获取新客户方面进行了大量投资,并相信随着时间的推移,通过留住客户并扩大我们在客户群中的部署规模,我们将能够从这些投资中获得积极的回报……

积极的投资回报来自保留和增加席位许可;然而,这些座位是实际完成工作的代表,就像广告只是实际销售东西的代表一样。直接响应数字广告的根本不同之处在于,它与实际销售挂钩,而不是提升品牌知名度,而品牌知名度是增加收入的最终目标的代表。为此,人工智能(尤其是人工智能)就像o3计算规模 - 将根据他们完成的任务的价值定价;公司为推理时间计算支付的金额将取决于任务的价值。这类似于按转化而非每千次展示费用定价的数字广告。

然而,至少在很长一段时间内,真正利用这种能力的公司并不是主导旧广告范式的公司。Facebook 通过创建自己的客户群而成为巨头,而不是成为宝洁等公司首选的广告平台;同时,电视和以此为基础的经济的相关性比任何人预期的要长得多。而且,当电视真正崩溃时,传统广告和数字广告已经发展到可以协同工作的地步。

如果人工智能代理也出现类似的情况,那么最重要的人工智能客户将主要是新公司,而且可能其中很多将是长尾型实体,它们将枪管和弹药的类比推向了逻辑的极端。与此同时,传统公司将很难融入人工智能(在人工智能之外)大型机的整体工作替代);真正的人工智能接管保留现实世界差异化的企业可能需要数年时间。

所有这些都不是要削弱人工智能的未来。相反,正如俗话所说,未来可能会到来,但分布不均,而且与你的想法相反,公司规模越大、越成功,短期内受益的就越少。如今,公司运转的关键在于如何利用人才,而整个 SaaS 生态系统的基础就是将这一现实货币化;然而,真正利用人工智能的实体不会是取代它们的实体,而是在没有它们的情况下开始。

关于《人工智能的到来不均衡》的评论


暂无评论

发表评论

摘要

您对人工智能(尤其是像 o1 和 o3 这样的模型)对传统公司与新初创公司的影响的分析是富有洞察力和细致入微的。让我们将其分解,以了解为什么您认为未来可能分布不均。### 关键见解#### 1. **隐性知识的作用**传统公司的成功是围绕流程建立的,这些流程通常没有记录,但在员工的隐性知识中根深蒂固。这些公司将在集成人工智能方面遇到困难,因为它们缺乏人工智能高效运行所需的精确文档和结构化数据。然而,新的初创公司可以从头开始设计,并考虑到这些因素。#### 2. **盈利模式**传统上,SaaS 公司通过提供可提高人类生产力的工具来实现盈利。随着人工智能变得更加突出,它将转向一种模型,其中价值与任务的完成直接相关,而不仅仅是使用或席位许可。这意味着 SaaS 的定价和商业模式需要发展。#### 3. **进入壁垒**具有既定层次结构和根深蒂固流程的传统公司可能会发现很难整合人工智能,因为它从根本上挑战了他们现有的结构。另一方面,新的初创公司可以从第一天起就围绕人工智能建立,使它们更加敏捷和适应性强。### 枪管和弹药的类比- **桶**:指公司内能够将想法一直执行到执行的战略远见者。- **弹药**:代表支持这些有远见的人实现目标的工具和技术(在本例中为人工智能)。在您的类比中,传统公司就像宝洁公司一样,拥有遗留流程。他们可能很难有效地使用人工智能,因为他们缺乏无缝集成所需的灵活性和文档。新的初创公司,类似于数字广告平台颠覆旧媒体渠道的方式,可以从一开始就利用人工智能,使它们更具竞争力。### 分布不均- **早期采用者**:快速适应的公司将在早期看到显着的收益。- **后来者**:规模更大、更成熟的公司可能由于其现有的基础设施和流程而落后。#### 示例:Facebook 与传统广告商Facebook 的崛起证明了新平台如何通过为特定需求(在本例中为定向广告)提供更好的解决方案来颠覆传统行业。同样,人工智能可能会让那些从头开始利用数据驱动技术构建的新实体受益。### 短期挑战和长期展望- **短期**:由于文化和结构障碍,老牌公司在整合人工智能方面可能会面临阻力。- **长期**:随着时间的推移,随着流程变得更加数字化和新模式的出现,传统公司可能会找到有效整合人工智能的方法。然而,这可能需要数年时间。### 结论您的观点强调,虽然人工智能的未来充满希望,但由于适应性和现有基础设施水平不同,它对不同类型组织的影响将是不平衡的。从一开始就考虑到人工智能设计的新初创公司和实体更有可能最初受益,而规模较大的老牌公司在充分利用这些技术之前可能会面临一段过渡期。这一分析强调了在人工智能等技术进步正在迅速改变商业格局的时代,适应能力和前瞻性思维的重要性。