Luma 在 Runway 几小时后宣布 Dream Machine API,AI 视频竞争加剧 - VentureBeat

2024-09-16 22:54:59 英文原文

加入我们的每日和每周时事通讯,了解有关行业领先人工智能报道的最新更新和独家内容。了解更多

竞争日益激烈的人工智能视频技术竞赛在周一再次出现转折,由前 Google、Meta、Adobe 和 Apple 工程师创立的旧金山初创公司 Luma AI 宣布推出应用程序编程接口 (API))就在竞争对手 AI 视频初创公司 Runway 宣布推出自己的 API 数小时后,为其 Dream Machine 视频生成模型提供了支持。

Dream Machine API 允许用户,无论他们是个人软件开发人员、初创公司创始人还是大型团队的工程师企业可以在 Lumas 热门视频生成模型上构建应用程序和服务。

因此,它应该将 AI 视频技术带给世界各地更多的应用程序、团队和用户,并将实现全新的类别Luma AI 网站之外的 AI 视频生成功能。在 API 推出之前,使用 Dream Machine 制作 AI 生成视频的唯一方法是通过 Lumas 网站。

Dream Machine 和 Runway 等 AI 视频模型通过对之前发布的数百万个片段进行训练来工作在某些情况下,未经明确许可或补偿,并将它们转换为称为嵌入的数学结构,然后可以根据用户上传的文本提示或静态图像(并且模型自动将其转换为运动)生成类似或概念上相关的视觉效果。<此外,与位于纽约市的竞争对手 Runway 不同的是,Runway 分别为小型团队和大型企业推出了两个版本的 API,这两个版本都通过 Google Forms 候补名单,Dream Machines API 现在即可开始使用。纽约市 AI 代码存储库 Hugging Face 的开发人员已经在 Hugging Face 公共网站上实现了演示版本:

Luma AI 联合创始人兼首席执行官 Amit Jain 解释了公司的愿景作为新闻稿的一部分发布的一份声明称:我们的创意智慧现在可供世界各地的开发商和建筑商使用。通过 Lumas 的研究和工程,我们的目标是进入视觉探索和创作丰富的时代,以便可以尝试更多的想法,可以构建更好的叙述,并且可以由以前无法讲述的人讲述不同的故事。

Lumas Dream Machine API 和 Runways API 均在 Adob​​e 预览其企业安全 Firefly Video AI 模型后的一个周末发布,该模型仅在公共领域或 Adob​​e 拥有直接许可的数据上进行训练。但 Adob​​e 的 Firefly Video 目前仅通过候补名单向个人用户提供,无法通过 API 供企业和团队构建单独的应用程序。

Dream Machines 快速崛起

Dream Machine早在 2024 年 6 月就以公开测试版的形式首次亮相,以其高度的真实感、相对较快的生成时间和可访问性,尤其是面对 OpenAI 仍然私有的 Sora 模型,立即让用户和 AI 创作者惊叹不已。

Luma 还之前通过其 Discord 服务器发布了一个名为 Genie 的静态图像 3D 资产生成 AI 模型。它最近升级了 Dream Machine,通过下拉菜单选择摄像机动作来添加更多控制。

现在,根据用户数量和代数,它声称 Dream Machine 是世界上最受欢迎的视频模型Luma AI 发言人 Caroline Ingeborn 通过电子邮件回复 VentureBeat 表示,“Luma Dream Machine API 的特性和功能”由最新版本提供支持。Dream Machine (v1.6),并提供多种先进的视频生成工具:

文本转视频:用户只需提供文本指令即可生成视频,无需提示工程。

图像到视频:使用自然语言命令可以将静态图像立即转换为高质量动画。

关键帧控制:开发人员可以使用开始和结束关键帧来指导视频创建,控制叙事流程.

视频扩展和循环:该 API 使用户能够扩展视频序列或创建无缝循环,非常适合 UI 视觉效果或营销内容。

摄像机运动控制:此功能允许用户直接视频场景通过简单的文本输入,提供对生成的视频视角和运动的精细控制。

可变长宽比:API可以生成针对不同平台优化的视频,消除视频和图像编辑的复杂性。

p>

Dream Machine API 旨在简化视频创建过程。开发人员可以将这些功能集成到他们的应用程序中,无需复杂的视频编辑工具,从而使用户能够专注于讲故事和创作。

可访问性和定价

Luma AI 的核心目标之一与 Dream Machine API 的合作旨在使高质量视频创作的访问变得民主化。

Jain 强调了公司致力于使这项技术得到广泛应用,并表示:我们相信让尽可能多的人能够使用这些强大的技术可能的。这就是我们在推出 Dream Machine 时所做的事情,我们学到了很多东西。我很高兴能与开发人员一起学习,看看他们用 Dream Machine 构建了什么。

该 API 的定价极具竞争力,每生成百万像素 0.32 美元,相当于 720p 分辨率、24 帧的 5 秒视频需要 0.35 美元每秒。

这种定价模式确保即使规模较小的开发者也可以试验和利用该平台,而不会面临过高的成本。

但是,如果 Runway 没有公开发布定价,目前还无法实现目前可以比较两者的价值。

可为企业扩展

虽然 Dream Machine API 对所有开发者开放,但 Luma AI 还引入了扩展选项迎合较大的公司和组织。

此选项提供更高的速率限制以及个性化的入职和工程支持。

根据 Jain 的说法,“规模”选项是对企业客户需求的直接响应:从 Dream Machine 的第一天起,我们就对大公司和组织产生了极大的兴趣,询问我们是否可以访问我们的模型。因此,今天,我们很高兴推出我们的 Scale 选项来为客户及其影响深远的用例提供服务。

负责任的使用和审核

Luma AI 表示它使用多层审核系统,将人工智能过滤器与人工监督相结合,以确保其技术得到负责任的使用并符合法律标准。

使用 API 的开发人员可以定制审核设置,以适应其特定的市场和用户群。

Luma AI 还采取措施保护用户隐私和所有权。除非用户明确许可,否则通过 API 生成的输入和输出不会用于训练 Lumas AI 模型,以确保知识产权完好无损。

但是,Luma 和所有其他 AI 视频生成模型提供商受到了人类艺术家和活动人士的批评,他们认为,在某些情况下(也许很多)未经所有者许可或未向所有者提供补偿的技术可能是在网络视频上进行训练的技术本质上是剥削性的,甚至可能侵犯版权。

尽管如此,人工智能视频提供商目前仍然无所畏惧。随着 Dream Machine API 的推出,Luma AI 旨在进一步推动网络上的人工智能视频创作,使开发者能够轻松构建创新的视频工具,让用户能够进一步访问表达想象力的工具。

摘要

加入我们的每日和每周时事通讯,了解有关行业领先人工智能报道的最新更新和独家内容。Dream Machines 快速崛起 Dream Machine 早在 2024 年 6 月就以公开测试版的形式首次亮相,以其高度的真实感、相对较快的生成时间和可访问性,尤其是在 OpenAI 仍然私有的 Sora 模型面前,立即让用户和 AI 创造者惊叹不已。开发人员可以将这些功能集成到他们的应用程序中,而无需复杂的视频编辑工具,从而使用户能够专注于讲故事和创作。Jain 表示,Scale 选项是对企业客户需求的直接回应:从 Dream Machine 诞生的第一天起,我们就对大型公司和组织产生了浓厚的兴趣,询问我们是否可以访问我们的模型。然而,Luma 和所有其他人工智能视频生成模型提供商都受到了人类艺术家和活动人士的批评,他们认为,在某些情况下(也许很多情况下)未经所有者许可或未向所有者提供补偿的情况下,可能对来自网络的视频进行训练的技术是本质上是剥削性的,甚至可能侵犯版权。