企业不再无脑烧 token,这对 OpenAI 和 Anthropic 才是真压力
据 CNBC 报道,美国企业正在更认真地控制 AI 花费。一些公司开始把流量从 OpenAI、Anthropic 这类高价前沿模型,转向 DeepSeek 等更便宜的开放权重模型,或者通过模型路由把不同任务分配给不同模型。
陈墨
据 CNBC 报道,美国企业正在更认真地控制 AI 花费。一些公司开始把流量从 OpenAI、Anthropic 这类高价前沿模型,转向 DeepSeek 等更便宜的开放权重模型,或者通过模型路由把不同任务分配给不同模型。
这条新闻不是“企业不用 AI 了”。恰恰相反,是 AI 用得足够多,账单大到 CFO 必须进场。Lindy CEO Flo Crivello 告诉 CNBC,公司把 100% 流量从 Anthropic Claude 切到 DeepSeek 后,成本曲线明显下降,并称这是“survival for the business”。这句话有点夸张,但方向很真实:如果 AI 产品的毛利被模型调用吃掉,再好的增长曲线也会变成压力。
过去两年很多公司有一种 tokenmaxxing 心态:鼓励员工尽量多用 AI,先把体验和产出跑起来,成本以后再说。现在进入第二阶段,预算、权限、用量上限和 ROI 开始接管。Uber 就被报道设置了 AI 工具支出层级,基础层每月 1500 美元,更高额度需要申请。

这对开发者很实际。以前做 AI 功能,最省事的方案是把所有请求都丢给最强模型。现在更合理的方案是拆任务:简单分类、摘要、客服走便宜模型;复杂推理和高风险决策走强模型;敏感数据走私有部署;代码生成再根据上下文长度、错误成本和复核方式选择模型。这不是省小钱,而是决定产品能不能规模化。
OpenAI 和 Anthropic 的压力也在这里。它们当然仍然站在模型能力前排,但如果客户开始精细控费,增长率可能不会永远像早期那样好看。CNBC 引用分析师观点称,当前增长率可能是 Anthropic 和 OpenAI 未来最高的一段,因为大客户会逐步限制失控的 token 支出。
这也解释了为什么 Microsoft、Google、Amazon 都在强调低成本模型和路由能力。它们不只是想做“更便宜的 ChatGPT”,而是在抢企业 AI 预算控制层。一旦企业把模型选择交给云平台或内部路由器,单一前沿模型公司的议价能力就会被削弱。
OC 的判断很简单:AI 成本优化不是 AI 降温,而是 AI 成熟。一个技术真正进入企业预算时,一定会从“尽量多试”变成“该花才花”。对开发者来说,这意味着未来的 AI 工程能力不只是会调 API,还包括会评估任务难度、设计 fallback、做缓存、控 token、选模型,以及把错误成本写进系统设计。
参考来源
- CNBC:OpenAI and Anthropic face new AI reality as companies shift from tokenmaxxing to efficiency:原始报道,提供企业控费、Lindy 切换模型、Uber 支出层级和模型路由背景。
- CNBC:China's Zhipu is closing in on top U.S. AI models:相关报道,补充开源模型性价比对闭源前沿模型的压力。
评论
围绕这篇文章补充信息、提出问题或分享观察。