大规模释放您的创造力:Azure AI Foundry的多模式革命|Microsoft Azure博客

2025-10-06 18:03:45 英文原文

作者:Steve Sweetman, Naomi Moneypenny

想象一个平台,每个开发人员都可以解锁AI的完整范围:文本,图像,音频和视频。这个Openai Devday,Azure AI铸造厂使该愿景变得真实。随着如今的OpenAI GPT-Image-1-Mini,GPT-Realtime-Mini和GPT-Audio-Mini,以及对GPT-5的主要安全升级,您现在拥有创建,实验和扩展多模态解决方案的最终工具包。

想象一个平台,每个开发人员是为创业公司建造还是全球企业都可以解锁AI的完整范围:文本,图像,音频和视频。这个openai devday,Azure AI铸造厂使这个愿景真实。随着如今的OpenAI GPT-Image-1-Mini,GPT-Real Time-Mini和GPT-Audio-Mini,以及对GPT-5的重大安全升级,您现在拥有最终的工具包来创建,实验和扩展多模式解决方案的速度,并且比以往任何时候都更快。我们很高兴分享Openai今天宣布的模型现在将在Azure AI Foundry推出,大多数客户能够于2025年10月7日开始。

今天的公告加入了我们上周宣布的重大创新Microsoft代理框架的发布(现在在预览中),私人预览中的铸造代理服务中的多代理工作流程,统一的可观察性,Live Live API通用可用性以及新的负责人AI功能。Microsoft代理框架(github)是一种商业级,开源SDK和运行时,旨在简化多代理系统的编排。它将语义内核的业务就绪基础与Autogen的多代理功能统一,从而为开发人员提供了速度和信心来构建智能,可扩展的代理解决方案的工具。

通过使用最新的OpenAI型号扩展Azure AI铸造厂并推进我们的代理AI框架,我们可以使客户能够具有无与伦比的选择,灵活性和业务能力,从而使开发人员能够建立智能代理系统,以满足复杂的业务需求并扩大创新。

满足新型号:为开发人员建造,为任何事情做好准备

GPT-Image-1-Mini:视觉创造力的紧凑功能

GPT-Image-1-Mini是针对需要在大规模上生成快速,资源高效图像生成的组织和开发人员的专门构建的。它的紧凑型体系结构可实现高质量的文本形象和图像对图像创建,同时消耗较少的计算资源,从而使团队甚至可以在受约束的设置中部署多模式AI。它基于Image-1模型构建的强大体系结构优化了已经利用Azure AI铸造中多模式AI的组织的一致性和易用性。

是什么让它特别?

  • 灵活的图像生成:部署高质量文本对图像图像到图像功能而没有打破预算。
  • 快速推理:实时生成图像,与现有的Azure AI铸造工作流无缝集成。

用例:

  • 为教室和在线学习生成教育材料。
  • 设计故事书和视觉叙述。
  • 生产游戏资产,用于快速原型制作和开发。
  • 加速对应用程序和网站的UI设计工作流程。

表1:GPT-Image-1-Mini的定价和Azure AI铸造厂的部署(每个1M令牌)*

Table with pricing information.

GPT-Realtime-Mini和GPT-Audio-Mini:高效且负担得起的语音解决方案

这两个新的迷你车型是为需要快速,具有成本效益的多模式AI的组织和开发人员而设计的,而无需牺牲质量。这些模型轻巧且高度优化,可以实时语音交互和音频产生,并具有最少的资源要求。他们简化的体系结构可快速推断和低潜伏期,使其非常适合速度和响应率至关重要的场景,例如基于语音的聊天机器人,实时翻译和动态音频内容创建。通过消耗更少的计算资源,这些模型可以帮助企业和开发人员团队降低运营成本,同时在广泛的应用程序中扩展多模式功能。

是什么让他们与众不同?

  • 实时响应能力:电源聊天机器人,助手和翻译工具的潜伏期接近零。
  • 资源光:在最小基础架构上运行高级语音和音频模型。
  • 负担得起的缩放:降低您的运营成本,同时扩大多模式功能。

用例:

  • 基于语音的聊天机器人用于客户服务和支持。
  • 全球通信的实时翻译。
  • 媒体和娱乐的动态音频内容创建。
  • 企业和消费者应用程序的交互式语音助手。

GPT实时AI型AI Foundry中的Mini使我们的客户能够以较低的延迟,更好的指导依从性和成本效率的功能来构建我们的客户价值的能力,驱动更短的手柄时间,更光滑的对话,并更快地进行时间的价值。

AndyOâDower,产品副总裁,Twilio

表2:gpt-realtime-mini和gpt-audio-mini的定价和Azure AI铸造厂的部署(每个1M令牌)*

Table with pricing information.

GPT-5-chat-Latest:提高安全性和福祉的标准

Azure AI Foundry中最新的GPT-5-Chat-lat-lat-latt最新更新引入了更强大的安全护栏集,旨在在敏感对话中更好地保​​护用户。通过增强的检测和响应功能,GPT-5-Chat-Latest现在能够更有效地识别和管理可能导致心理或情绪困扰的对话。这些改进反映了我们对负责人AI的持续承诺,确保每次互动不仅聪明且有用,而且还可以安全和支持,这对充满挑战的时刻的用户提供了支持。

表3:gpt-5-chat-latest-latt-lat-lat-lat-lat-lat-late-ai ai foundry中的部署(每1m令牌)*

Table with pricing information.

GPT-5-PRO:推理和分析的巅峰

GPT-5-PRO代表了Azure AI铸造生态系统中先进的推理和分析的巅峰之作,提供了研究级智能。当通过Foundry部署时,GPT-5-Pro的比赛风格的体系结构利用多种推理途径来确保最高的准确性和可靠性,使其非常适合复杂的分析,代码生成和决策工作流程。借助Azure AI铸造厂,组织将释放GPT-5-Pro的全部潜力,推动更智能的决策,并在其最关键的业务流程中加速创新。

表4:Azure AI Foundry中的GPT-5-PRO定价和部署(每1M令牌)*

Table with pricing information.

开发人员的边缘:建造,实验和运输更快

有了这些新型号,Azure AI铸造厂不仅可以保持步伐。开发人员现在可以超越文本,利用图像和音频生成,编辑和理解。结果?从教育和游戏到企业自动化的每个行业中,更富裕,更聪明的工作流程。

偷窥:Sora 2 - 下一级视频和音频一代

而且还有更多。Azure AI Foundry中的Sora 2即将推出,将高级视频和音频发电带入单个API。想象一下,物理驱动的动画,同步对话和客串功能通过Azure AI Foundry为开发人员提供。请继续关注下一波沉浸式,生成的体验。

您准备好创造一个沉浸式的多式联运体验的下一波浪潮吗?Azure AI铸造厂是您所有可能性的平台。


*截至2025年10月,定价准确。

关于《大规模释放您的创造力:Azure AI Foundry的多模式革命|Microsoft Azure博客》的评论


暂无评论

发表评论

摘要

Azure AI Foundry宣布在OpenAi Devday推出OpenAI GPT-Image-1-Mini,GPT-Real Time-Mini和GPT-Audio-Mini,为开发人员提供了更有效,有效地创建多模式解决方案的工具。还针对GPT-5-chat-Latest进行了重大安全升级,从而增强了敏感对话中的用户保护。这些进步以及即将到来的Sora 2 API用于高级视频和音频生成,使开发人员能够在各个行业进行创新。部署从2025年10月7日开始,截至该日期提供了定价细节。

相关讨论