2024-10-01 22:13:49 · 英文原文

OpenAI 刚刚宣布 4 项新的 AI 功能现已上市 - Inc.

OpenAI 刚刚宣布了 4 项新的人工智能功能，现已推出

OpenAI DevDay 的公告专门针对构建人工智能驱动的产品和功能的企业家。

BYBEN SHERRY，工作人员记者 @BENLUCASSHERRY

照片：Getty Images

OpenAI 今天在旧金山举行的开发者日活动上宣布了其 API 服务的一系列更新。这些更新将使开发人员能够进一步定制模型，开发新的基于语音的应用程序，降低重复提示的价格，并从较小的模型中获得更好的性能。

OpenAI 在活动期间宣布了四项主要的 API 更新：蒸馏、提示缓存、视觉微调以及引入名为 RealTime 的新 API 服务。对于外行来说，API（应用程序编程接口）使软件开发人员能够将外部应用程序的功能集成到他们自己的产品中。

模型蒸馏

该公司推出了一种新方法来增强通过使用较大模型的输出进行微调（称为模型蒸馏），可以增强 GPT-4o mini 等较小模型的功能。该公司在一篇博客文章中表示，到目前为止，蒸馏是一个多步骤、容易出错的过程，需要开发人员跨离线工具手动协调多个操作，从生成数据集到微调模型和衡量性能改进。

为了提高流程效率，OpenAI 在其 API 平台内构建了模型蒸馏套件。该平台使开发人员能够使用 GPT-4o 和 o1-preview 等高级模型来构建自己的数据集，以生成高质量的响应，微调较小的模型以跟踪这些响应，然后创建并运行自定义评估来衡量模型执行特定任务。

OpenAI 表示，截至 10 月 31 日，它将在 GPT-4o mini 上每天提供 200 万个免费训练代币，在 GPT-4o 上每天提供 100 万个免费训练代币，以帮助开发人员开始蒸馏。（令牌是人工智能模型为了理解请求而处理的数据块。）训练和运行精炼模型的成本与 OpenAI 标准微调价格相同。

提示缓存

OpenAI 一直致力于降低其 API 服务的价格，并通过 Prompt Caching 朝着这个方向又迈出了一步，这是一项新功能，使开发人员能够重复使用常见的提示，而无需每次都支付全价。

许多使用 OpenAIs 模型的应用程序在提示前包含冗长的前缀，详细说明模型在完成特定任务时应如何操作，例如指示模型以清晰的语气响应所有请求或始终格式化要点答复。较长的前缀通常会改进模型并有助于保持响应的一致性，但它们也会增加每次 API 调用的成本。

现在，OpenAI 表示 API 将自动保存或缓存较长的前缀长达一个小时。如果 API 检测到具有相同前缀的新提示，它将自动对输入成本应用 50% 的折扣。对于具有非常集中的用例的人工智能应用程序开发人员来说，新功能可以节省大量资金。OpenAI 竞争对手 Anthropic 在 8 月份为其自己的模型系列引入了即时缓存。

视觉微调

开发人员现在不仅可以使用图像微调 GPT-4oOpenAI 表示，这将增强模型理解和识别图像的能力，从而实现增强的视觉搜索功能、改进自动驾驶汽车或智能城市的对象检测以及更准确的医学图像分析等应用。

通过上传OpenAIs 平台上有标记图像的数据集，开发人员可以在理解图像时磨练模型性能。OpenAI 表示，Coframe 是一家构建人工智能驱动的增长工程助手的初创公司，它已使用视觉微调来提高助手为网站生成代码的能力。通过为 GPT-4 提供数百张网站图像以及用于创建它们的代码，与基础 GPT-4o 相比，他们将模型生成具有一致视觉风格和正确布局的网站的能力提高了 26%。

为了让开发人员入门，OpenAI 将在 10 月份每天发放 100 万个免费培训代币。从 11 月开始，使用图像对 GPT-4o 进行微调的费用为每 100 万个代币 25 美元。

实时

上周，OpenAI 向所有人提供了其人声高级语音模式ChatGPT 订阅者。现在，该公司正在帮助开发人员使用其技术构建语音转语音应用程序。

如果开发人员之前想要创建一个可以与用户对话的人工智能应用程序，他们首先需要转录音频，将文本传递到 GPT-4 等语言模型进行处理，然后将输出发送到文本转语音模型。OpenAI 表示，这种方法通常会导致情感、重点和口音的损失，以及明显的延迟。

使用 Realtime API，音频会立即由 API 处理，无需将多个应用程序链接在一起，从而速度更快，更便宜，反应更灵敏。该 API 还支持函数调用，这意味着由它支持的应用程序将能够执行操作，例如订购披萨或进行预约。Realtime 最终将进行更新，以处理包括视频在内的各种多模态体验。

为了处理文本，API 每百万个输入令牌的成本为 5 美元，每百万个输出令牌的成本为 20 美元。处理音频时，API 将针对每 100 万个输入令牌收取 100 美元的费用，每 100 万个输出令牌收取 200 美元的费用。OpenAI 表示，这相当于每分钟音频输入约 0.06 美元，每分钟音频输出约 0.24 美元。

最新科技新闻的每周综述

关于《OpenAI 刚刚宣布 4 项新的 AI 功能现已上市 - Inc.》的评论

暂无评论

发表评论

摘要

OpenAI 刚刚宣布了 4 项新的人工智能功能，现已推出 OpenAI DevDay 的公告专门针对构建人工智能驱动的产品和功能的企业家。该平台使开发人员能够使用 GPT-4o 和 o1-preview 等高级模型来构建自己的数据集，以生成高质量的响应，微调较小的模型以跟踪这些响应，然后创建并运行自定义评估来衡量模型执行特定任务。Prompt CachingOpenAI 一直致力于降低其 API 服务的价格，并通过 Prompt Caching 朝着这个方向又迈出了一步，这是一项新功能，使开发人员能够重复使用常见的提示，而无需每次都支付全价。通过为 GPT-4 提供数百张网站图像以及用于创建它们的代码，与基础 GPT-4o 相比，他们将模型生成具有一致视觉风格和正确布局的网站的能力提高了 26%。处理音频时，API 将针对每 100 万个输入令牌收取 100 美元的费用，每 100 万个输出令牌收取 200 美元的费用。

OC