科技 · 2026-06-27 · 产业与资本 · 阅读 4

企业不再无脑烧 token，这对 OpenAI 和 Anthropic 才是真压力

据 CNBC 报道，美国企业正在更认真地控制 AI 花费。一些公司开始把流量从 OpenAI、Anthropic 这类高价前沿模型，转向 DeepSeek 等更便宜的开放权重模型，或者通过模型路由把不同任务分配给不同模型。

作者

这条新闻不是“企业不用 AI 了”。恰恰相反，是 AI 用得足够多，账单大到 CFO 必须进场。Lindy CEO Flo Crivello 告诉 CNBC，公司把 100% 流量从 Anthropic Claude 切到 DeepSeek 后，成本曲线明显下降，并称这是“survival for the business”。这句话有点夸张，但方向很真实：如果 AI 产品的毛利被模型调用吃掉，再好的增长曲线也会变成压力。

过去两年很多公司有一种 tokenmaxxing 心态：鼓励员工尽量多用 AI，先把体验和产出跑起来，成本以后再说。现在进入第二阶段，预算、权限、用量上限和 ROI 开始接管。Uber 就被报道设置了 AI 工具支出层级，基础层每月 1500 美元，更高额度需要申请。

OC 原创解释图：tokenmaxxing 如何变成预算、限额和模型路由

这对开发者很实际。以前做 AI 功能，最省事的方案是把所有请求都丢给最强模型。现在更合理的方案是拆任务：简单分类、摘要、客服走便宜模型；复杂推理和高风险决策走强模型；敏感数据走私有部署；代码生成再根据上下文长度、错误成本和复核方式选择模型。这不是省小钱，而是决定产品能不能规模化。

OpenAI 和 Anthropic 的压力也在这里。它们当然仍然站在模型能力前排，但如果客户开始精细控费，增长率可能不会永远像早期那样好看。CNBC 引用分析师观点称，当前增长率可能是 Anthropic 和 OpenAI 未来最高的一段，因为大客户会逐步限制失控的 token 支出。

这也解释了为什么 Microsoft、Google、Amazon 都在强调低成本模型和路由能力。它们不只是想做“更便宜的 ChatGPT”，而是在抢企业 AI 预算控制层。一旦企业把模型选择交给云平台或内部路由器，单一前沿模型公司的议价能力就会被削弱。

OC 的判断很简单：AI 成本优化不是 AI 降温，而是 AI 成熟。一个技术真正进入企业预算时，一定会从“尽量多试”变成“该花才花”。对开发者来说，这意味着未来的 AI 工程能力不只是会调 API，还包括会评估任务难度、设计 fallback、做缓存、控 token、选模型，以及把错误成本写进系统设计。