英语轻松读发新版了,欢迎下载、更新

Google Cloud 在 Vertex 上推出 Veo AI 视频生成器模型

2024-12-03 21:45:28 英文原文

作者:Shubham Sharma

Frame from a video of a cowboy riding a horse made with Google's Veo AI video generation model.

图片来源:Google Veo/作者截图

加入我们的每日和每周时事通讯,了解有关行业领先人工智能报道的最新更新和独家内容。了解更多


随着亚马逊在人工智能领域迈出重要一步新 Nova 系列基础型号,谷歌正在加倍加强自己的多模式人工智能能力。这家科技巨头的云部门宣布其最新的视频和图像生成模型,维奥图像3,现在可以在顶点人工智能

此举使团队能够将尖端的视频和图像生成功能集成到他们的人工智能工作流程中,从而解锁不同的用例,尤其是在营销和广告领域。它还使谷歌云成为第一个向客户提供视频模型的超大规模提供商。 

虽然 Veo 模型目前处于私人预览阶段,但 Imagen 3 将从下周开始向所有 Vertex AI 用户开放。值得注意的是,Imagen 3 还包括编辑功能,使用户能够优化生成的图像以满足特定的创意需求。

Veo 和 Imagen 3 提供什么?

首次亮相于Google 的 I/O 开发者大会Veo 是 Google DeepMind 针对 Runway Gen-3 和 OpenAI Sora 等竞争对手的回应,提供了复杂的视频生成体验。该模型将文本或图像提示转换为各种视觉风格的电影高清视频,生成长度超过 60 秒的剪辑。它的与众不同之处在于帧级一致性,确保拍摄对象在镜头内无缝移动。

同样来自 DeepMind 的 Imagen 3 承担了文本到图像生成的任务,生成各种风格的逼真视觉效果。谷歌声称它在细节、照明精度和伪影减少方面超越了其前辈。

除了生成之外,Google 许可名单上的用户还可以使用 Imagen 3 访问高级自定义选项。其中包括图像放大、修复、外绘和背景替换,所有这些都由文本提示引导。此外,用户还可以提供参考图像,使 Imagen 3 能够创建符合特定品牌美学、徽标或产品功能的内容。

对行业更广泛的影响

Vertex AI 长期以来一直是 Google Cloud 简化 AI 应用程序开发和部署的旗舰平台。通过集成 Veo 和 Imagen 3,该平台为组织提供了一套更全面的工具,用于在营销、销售等方面进行创新。

例如,Imagen 3 简化了产品图像和社交媒体内容等高质量资产的创建,而 Veo 通过为团队提供将这些视觉效果转换为精美视频的选项来扩展此功能。它加快了生产速度,降低了成本,并加速了原型制作,使团队能够快速迭代他们的创意策略。

“像 Agoda 这样的客户正在利用 Veo、Gemini 和 Imagen 等人工智能模型的力量来简化视频广告制作,从而显着缩短制作时间,”谷歌产品管理高级总监 Warren Barkley 表示,在一个博客文章。他还强调,这两种模型都包含数字水印和内容审核护栏等安全功能,以减轻与生成人工智能相关的风险。

其他早期采用者包括 Mondelez International(拥有 Oreo、Cadbury 和 Milka 等品牌)以及全球营销和传播服务公司 WPP。随着 Google 基础模型的影响力不断扩大,各行各业的企业都有了一个强大的机会来重新构想他们如何创建和交付视觉内容。 

竞争持续升温

虽然包括谷歌云、亚马逊网络服务和微软 Azure 在内的所有主要云提供商都在各自的人工智能编排平台上提供图像生成模型,但到目前为止,视频生成还相当罕见。Google 今天推出私人预览版 Veo 的举动改变了这一点。 

有趣的是,在 Veo 发布后不久,AWS 就在 re:Invent 上宣布了新星卷轴,一个基础模型,可根据文本和图像提示生成六秒长的工作室质量视频。

该型号以及 Nova 系列的其他型号将通过以下渠道提供:亚马逊基岩,该公司的完全托管服务旨在简化生成式人工智能应用程序的创建和部署。 

就微软而言,现阶段似乎在这一领域处于落后地位。它是人工智能代工不包括视频生成模型。然而,我们预计,一旦 OpenAI 的 Sora 上市,这种情况就会改变。

VB日报

保持了解!每天在您的收件箱中获取最新消息

订阅即表示您同意 VentureBeat 的服务条款。

感谢您的订阅。查看更多VB 时事通讯在这里

发生错误。

关于《Google Cloud 在 Vertex 上推出 Veo AI 视频生成器模型》的评论


暂无评论

发表评论