作者:Kyle Wiggers
为了与像Google这样的竞争对手AI公司更积极地竞争,Openai正在启动弹性处理,一种API选项,可提供较低的AI模型使用价格,以换取较慢的响应时间和偶尔的资源不可用。”
Flex Processing,可在Openai的Beta版中获得,最近发布O3和O4-MiniOpenai说,推理模型针对较低优先级和非生产任务,例如模型评估,数据丰富和异步工作负载。
它将API成本恰好减少了一半。对于O3,Flex处理为每百万美元的输入令牌(约750,000个单词)和20万美元的输出令牌,而标准为每百万美元的10美元输入令牌和每百万美元的产出代币40美元。对于O4-Mini,Flex将价格降至每百万美元的投入令牌,每百万美元的产出代币2.55美元,从每百万美元的投入令牌11美元,每百万美元的输出令牌4.40美元。
弹性处理的推出随着Frontier AI的价格继续攀升竞争对手发布更便宜,更有效的预算模型。周四,Google推出了双子座2.5闪存,匹配或最佳的推理模型DeepSeek S R1在较低输入令牌成本的性能方面。
在电子邮件给客户宣布推出Flex定价,OpenAI还表示,其使用层层次结构的1-3级开发人员必须完成新引入的ID验证过程访问O3。层由在OpenAI服务上花费的资金数量确定。O3和其他模型的推理摘要和流媒体API支持也是验证背后的。
Openai此前曾表示,ID验证旨在阻止坏演员违反其使用政策。
Kyle Wiggers是TechCrunch的AI编辑。他的写作出现在VentureBeat和数字趋势中,以及一系列小工具博客,包括Android警察,Android Authority,Droid-Life和XDA-Developers。他与他的伴侣,音乐治疗师一起住在曼哈顿。