OpenAI 的 DevDay 2024:4 项重大更新将使 AI 更容易获得且更实惠 - VentureBeat

2024-10-01 17:15:00 英文原文

加入我们的每日和每周时事通讯,了解有关行业领先人工智能报道的最新更新和独家内容。了解更多

与去年引人注目的活动形成鲜明对比的是,OpenAI 在周二举行了一场更为低调的 DevDay 会议,没有发布重大产品,而是对其现有的 AI 工具和 API 套件进行渐进式改进。

p>

该公司今年的重点是为开发者提供支持并展示社区故事,这标志着随着人工智能领域的竞争日益激烈,其战略发生了转变。

该公司在此次活动中推出了四项主要创新: 愿景微调、实时 API、模型蒸馏和提示缓存。这些新工具凸显了 OpenAI 的战略重点是增强其开发者生态系统,而不是直接在最终用户应用程序领域竞争。

及时缓存:开发者预算的福音

最重要的之一重要的公告是引入提示缓存,该功能旨在降低开发人员的成本和延迟。

该系统自动对模型最近处理的输入令牌应用 50% 的折扣,可能会带来大量节省OpenAI 平台产品主管 Olivier Godement 在公司旧金山总部举行的小型新闻发布会上表示,我们一直很忙,为开发者大会拉开了序幕。就在两年前,GPT-3 取得了胜利。现在,我们已将[这些]成本降低了近 1000 倍。我试图举出一个在两年内将成本降低了近 1000 倍的技术的例子,但我无法举出一个例子。

这种成本的大幅降低为初创公司和企业提供了探索的重大机会视觉微调:视觉人工智能的新前沿

另一个重大公告是引入视觉微调功能GPT-4o,OpenAI最新的大语言模型。此功能允许开发人员使用图像和文本来自定义模型的视觉理解功能。

此更新的影响是深远的,可能会影响自动驾驶汽车、医学成像和视觉搜索功能等领域。

据 OpenAI 称,东南亚领先的食品配送和拼车公司 Grab 已经利用这项技术来改进其地图服务。

据报道,仅使用 100 个示例,Grab 就实现了车道计数准确度提高了 20%,限速标志定位提高了 13%。

这一现实应用展示了视觉微调在广泛领域显着增强人工智能驱动服务的可能性。使用小批量视觉训练数据的行业。

实时 API:缩小对话式 AI 的差距

OpenAI 还推出了其实时 API,目前处于公开测试阶段。这一新产品使开发人员能够创建低延迟、多模式体验,特别是在语音到语音应用程序中。这意味着开发人员可以开始向应用程序添加 ChatGPT 语音控件。

为了说明 API 的潜力,OpenAI 演示了 Wanderlust 的更新版本,这是去年会议上展示的一款旅行规划应用程序。

通过实时 API,用户可以直接与应用程序对话,进行自然的对话来计划他们的旅行。该系统甚至允许句子中间中断,模仿人类对话。

虽然旅行计划只是一个例子,但实时 API 为各个行业的语音应用程序开辟了广泛的可能性。

p>

从客户服务到教育和辅助工具,开发人员现在拥有强大的新资源来创建更直观、响应更快的人工智能驱动体验。

每当我们设计产品时,我们基本上都会考虑两者Godement 解释道,“初创企业和企业”。因此,在 alpha 阶段,我们有很多企业使用 API、新产品的新模型。

实时 API 本质上简化了构建语音助手和其他对话式 AI 工具的过程,无需将多个模型拼接在一起进行转录、推理和文本到语音转换。

像 Healthify(营养和健身教练应用程序)和 Speak(语言学习平台)这样的早期采用者已经将 Realtime API 集成到他们的产品中。

这些实现展示了 API 在从医疗保健到教育等领域创造更自然、更具吸引力的用户体验的潜力。

Realtime API 定价结构,虽然音频输入每分钟 0.06 美元、音频输出每分钟 0.24 美元的价格并不便宜,但对于希望创建基于语音的应用程序的开发人员来说,仍然代表着一个重要的价值主张。

模型蒸馏:迈向更易于访问的一步人工智能

也许最具变革性的公告是模型蒸馏的引入。这种集成的工作流程允许开发人员使用 o1-preview 和 GPT-4o 等高级模型的输出来提高 GPT-4o mini 等更高效模型的性能。

该方法可以使小型公司利用功能与先进模型类似,但不会产生相同的计算成本。

它解决了人工智能行业中尖端的资源密集型系统与更易于访问但能力较差的系统之间长期存在的分歧。

考虑一家小型医疗技术初创公司,为农村诊所开发人工智能驱动的诊断工具。使用模型蒸馏,该公司可以训练一个紧凑的模型,该模型可以在标准笔记本电脑或平板电脑上运行时捕获大型模型的大部分诊断能力。

这可以为资源有限的环境带来复杂的人工智能功能,从而有可能改善

OpenAIs 战略转变:构建可持续的人工智能生态系统

OpenAIs DevDay 2024 标志着该公司的战略支点,将生态系统开发置于引人注目的产品发布之上。

这种方法虽然对公众来说不那么令人兴奋,但展示了对人工智能行业当前挑战和机遇的成熟理解。

今年的活动与 2023 年 DevDay 形成鲜明对比。随着 GPT 商店和自定义 GPT 创建工具的推出,引起了像 iPhone 一样的兴奋。

然而,从那时起,人工智能领域发展迅速。竞争对手已经取得了显着的进步,并且对培训数据可用性的担忧也加剧了。OpenAI 专注于完善现有工具并为开发人员提供支持,这似乎是对这些转变的精心设计的回应。通过提高模型的效率和成本效益,OpenAI 旨在保持其竞争优势,同时解决对资源强度和环境影响的担忧。

随着 OpenAI 从颠覆者转变为平台提供商,其成功将取决于很大程度上取决于其培育繁荣的开发者生态系统的能力。

通过提供改进的工具、降低成本和增加支持,该公司正在为人工智能领域的长期增长和稳定奠定基础。

虽然直接影响可能不太明显,但这一战略最终可能会导致许多行业更加可持续和广泛地采用人工智能。

关于《OpenAI 的 DevDay 2024:4 项重大更新将使 AI 更容易获得且更实惠 - VentureBeat》
暂无评论

摘要

加入我们的每日和每周时事通讯,了解有关行业领先人工智能报道的最新更新和独家内容。Realtime API 从本质上简化了构建语音助手和其他对话式 AI 工具的过程,无需将多个模型拼接在一起进行转录、推理和文本到语音转换。这些实施展示了 API 在医疗保健和教育等领域创造更自然、更具吸引力的用户体验的潜力。使用模型蒸馏,该公司可以训练一个紧凑的模型,该模型在标准笔记本电脑或平板电脑上运行时,可以捕获较大模型的大部分诊断能力。OpenAI 专注于完善现有工具并为开发人员提供支持,这似乎是对这些转变的精心设计的回应。