OC

Knowledge OS
企业不再无脑烧 token,这对 OpenAI 和 Anthropic 才是真压力
科技 · 2026-06-27 · 产业与资本

企业不再无脑烧 token,这对 OpenAI 和 Anthropic 才是真压力

据 CNBC 报道,美国企业正在更认真地控制 AI 花费。一些公司开始把流量从 OpenAI、Anthropic 这类高价前沿模型,转向 DeepSeek 等更便宜的开放权重模型,或者通过模型路由把不同任务分配给不同模型。

作者 陈墨 陈墨

CNBC 报道,美国企业正在更认真地控制 AI 花费。一些公司开始把流量从 OpenAI、Anthropic 这类高价前沿模型,转向 DeepSeek 等更便宜的开放权重模型,或者通过模型路由把不同任务分配给不同模型。

这条新闻不是“企业不用 AI 了”。恰恰相反,是 AI 用得足够多,账单大到 CFO 必须进场。Lindy CEO Flo Crivello 告诉 CNBC,公司把 100% 流量从 Anthropic Claude 切到 DeepSeek 后,成本曲线明显下降,并称这是“survival for the business”。这句话有点夸张,但方向很真实:如果 AI 产品的毛利被模型调用吃掉,再好的增长曲线也会变成压力。

过去两年很多公司有一种 tokenmaxxing 心态:鼓励员工尽量多用 AI,先把体验和产出跑起来,成本以后再说。现在进入第二阶段,预算、权限、用量上限和 ROI 开始接管。Uber 就被报道设置了 AI 工具支出层级,基础层每月 1500 美元,更高额度需要申请。

OC 原创解释图:tokenmaxxing 如何变成预算、限额和模型路由

这对开发者很实际。以前做 AI 功能,最省事的方案是把所有请求都丢给最强模型。现在更合理的方案是拆任务:简单分类、摘要、客服走便宜模型;复杂推理和高风险决策走强模型;敏感数据走私有部署;代码生成再根据上下文长度、错误成本和复核方式选择模型。这不是省小钱,而是决定产品能不能规模化。

OpenAI 和 Anthropic 的压力也在这里。它们当然仍然站在模型能力前排,但如果客户开始精细控费,增长率可能不会永远像早期那样好看。CNBC 引用分析师观点称,当前增长率可能是 Anthropic 和 OpenAI 未来最高的一段,因为大客户会逐步限制失控的 token 支出。

这也解释了为什么 Microsoft、Google、Amazon 都在强调低成本模型和路由能力。它们不只是想做“更便宜的 ChatGPT”,而是在抢企业 AI 预算控制层。一旦企业把模型选择交给云平台或内部路由器,单一前沿模型公司的议价能力就会被削弱。

OC 的判断很简单:AI 成本优化不是 AI 降温,而是 AI 成熟。一个技术真正进入企业预算时,一定会从“尽量多试”变成“该花才花”。对开发者来说,这意味着未来的 AI 工程能力不只是会调 API,还包括会评估任务难度、设计 fallback、做缓存、控 token、选模型,以及把错误成本写进系统设计。

参考来源

相关阅读

基于标题、摘要和正文内容自动匹配。

更多科技

评论

围绕这篇文章补充信息、提出问题或分享观察。

0
暂无评论。

发表评论