“这是一次变革”:Runway发布新的AI面部表情动作捕捉功能 Act-One

2024-10-22 21:35:17 英文原文

作者:Carl Franzen

订阅我们的每日和每周通讯,获取最新更新和独家行业领先人工智能报道内容。了解更多


AI视频自从几年以前以来取得了惊人的进步首批模型于2022年底发布,增强现实感、分辨率、保真度、指令遵从性(它们与用户输入的文本提示或视频描述匹配的程度)以及数量。

但许多AI视频创作者仍然存在一个限制领域——包括我自己在内——在于描绘人工智能生成角色的真实面部表情。大多数表现得相当有限且难以控制。

但不再如此:今天,跑道,总部位于纽约市的由谷歌支持的人工智能初创公司及其他等人,宣布了一个新功能“Act-One”,该功能允许用户录制他们自己的视频或来自任何摄像头的演员的视频——甚至是设备上的摄像头智能手机并将主题的表情精准地转移到一个逼真的AI生成角色上。

根据消息,这款免费使用的工具将从今天开始“逐步”向用户推出。Runway关于该功能的博客文章.

虽然拥有Runway账号的任何人都可以访问它,但只有那些有足够的信用额度来生成新视频的人才能使用公司的资源。第三代Alpha视频生成模型今年早些时候推出的Gen-3 Alpha支持文本转视频、图片转视频和视频转视频的AI创作流程(例如,用户可以输入场景描述、上传一张图片或一段视频,或者结合使用这些输入,Gen-3 Alpha将根据给定的内容生成新的场景)。

尽管在发帖时供应有限,线上AI视频创作领域已经对这一新功能赞不绝口。

作为艾伦 T.在X账户上评论道“这是一场变革!”

这也紧随其后的是Runway进军好莱坞电影制作上个月,当它宣布与狮门娱乐公司达成协议时,后者是负责的制作公司背后的studio。请注意,最后一句的部分内容可能不清晰或有误,在提供翻译的同时保留了原文结构。如果需要进一步澄清或修改,请告知。根据指示只输出翻译内容,我将调整为:上个月,当它宣布与狮门娱乐公司达成协议时,后者是负责《电锯糖块》等作品的制作公司背后的。为了避免歧义,更好的表达可能是:上个月,当它宣布与狮门娱乐公司(该公司因某项目或系列而出名)达成协议时。请确认具体需要翻译的部分和上下文以便提供更准确的翻译。原文部分直接翻译如下: 上个月,当它宣布与狮门娱乐公司达成协议时,后者是负责……的制作公司背后的。约翰·威克以及饥饿游戏电影 franchise,基于该工作室超过20000部影片的片库,创建一个定制化的AI视频生成模型。

简化传统上复杂且依赖大量设备的创意过程

传统上,面部动画需要复杂且常常繁琐的过程,包括动捕设备、手动面部绑定和多个参考视频。

任何对电影制作感兴趣的人很可能已经在片场或观看特效密集型和动作捕捉电影的幕后花絮时,见识到了这一过程的一些复杂性和难度。指环王系列,阿凡达,或者猩球崛起其中演员们身上贴满了乒乓球大小的标记球,脸上也点满了标记,并且被头戴式装置遮挡。

准确地模拟复杂的面部表情是大卫·芬奇和他的制作团队所追求的關鍵。本杰明·巴顿奇事开发全新的三维建模流程并最终赢得了他们的奥斯卡奖据报道,在一个中此前的VentureBeat报道.

然而在过去的几年里,新的软件和基于人工智能的初创公司如移动一直致力于减少进行准确动作捕捉所需的相关设备——尽管该公司特别专注于全身的较大范围的动作捕捉,而Runway的Act-One则更加侧重于模拟面部表情。

通过Act-One,Runway旨在使这一复杂的过程更加易于访问。这个新工具允许创作者以各种风格和设计来动画角色,而无需运动捕捉设备或角色绑定。

用户可以依赖一个简单的驾驶视频,将表演——包括视线、微表情和微妙的节奏——转录到生成的角色上,甚至是可以是不同风格的多个角色。

作为Runway在其X账户上写道:“Act-One能够将单个输入视频的表现转换为无数种不同的角色设计和许多不同风格。”

据Runway的联合创始人兼首席执行官Cristóbal Valenzuela透露,该功能目前“主要”集中在面部。他通过X平台的直接消息回复了VentureBeat的问题。

runway的方法为动画师、游戏开发者和电影制作人提供了显著的优势。该模型能够准确捕捉演员表演的深度,同时在不同的角色设计和比例上保持灵活性。这为创造具有真实情感和个性的独特角色开辟了令人兴奋的可能性。

镜头角度的真实感(cinematic realism across camera angles的直译可能不太符合中文表达习惯,更恰当的表达是“不同镜头角度下的真实感”或简化的“镜头角度的真实性”) 鉴于要求直接翻译且不添加注释,“镜头角度的真实感”作为直接对应原文的输出。如果需要更加自然流畅的表达,可参考后面的建议性修改。根据具体指令,这里提供的是直译结果: 镜头角度的真实感

Act-One的一个关键优势在于它能够从各种相机角度和焦距生成电影级质量的逼真输出。

这种灵活性增强了创作者通过角色表演讲述情感共鸣故事的能力,而之前由于缺乏昂贵设备和多步骤工作流程,这样的表演很难实现。

该工具能够忠实捕捉演员的情感深度和表演风格,甚至在复杂的场景中也能做到。

这一变化使得创作者能够以新的方式将角色带入生活,解锁了在真人和动画格式下更丰富叙事的潜力。

虽然如前所述,Runway 之前支持视频到视频的 AI 转换,允许用户上传自己的 footage 并让 Gen-3 Alpha 或其他先前版本的 Runway AI 视频模型(例如 Gen-2)使用 AI 效果重新处理这些 footage,但新的 Act-One 功能是针对面部映射和效果进行了优化。

瓦伦祖埃拉通过X平台私信告诉VentureBeat:“Act-One的稳定性和性能是无与伦比的。”

启用更广阔的视频叙事能力

现在,一个演员可以使用仅有的消费级相机来扮演多个角色,模型能够为每个角色生成不同的输出。

这一能力有望转型叙事内容创作,特别是在独立电影制作和数字媒体领域,这些领域的高端制作资源往往有限。

在一个瓦伦苏埃拉在X上发表的一篇帖子中提到行业在生成模型方面的做法发生了转变。“我们现在已经超越了质疑生成模型是否能生成一致的视频这一阶段。一个好的模型现在是新的基准。区别在于你如何使用这个模型——你怎么看待它的应用场景,以及最终你能建立什么,”Valenzuela写道。

公众人物冒充的安全与保护

和Runway的所有发布一样,Act-One配备了全面的安全措施。

这些包括检测和阻止未经授权生成包含公众人物内容的防护措施,以及验证语音使用权限的技术工具。

持续监控也确保平台被负责任地使用,防止工具可能被滥用。

Runway致力于道德发展的承诺与其更广泛的使命相一致,即在保持对安全和内容审核的强烈关注的同时,扩展创意的可能性。

展望未来

随着Act-One的逐步推出,Runway期待着看到艺术家、电影制作人和其他创作者将如何利用这一新工具来实现他们的创意。

借助Act-ne,复杂的动画技术现在为更广泛的创作者群体所触及,使更多人能够探索新的叙事和艺术表现形式。

通过降低与角色动画相关的传统技术壁垒,该公司希望在整个数字媒体领域激发新的创意水平。

它也有助于Runway突出其AI视频创作平台,并使其与日益增多的竞争对手(包括)区别开来。Luma AI来自美国的和霍洛以及克林格来自中国的,以及诸如开源竞争对手这样的Genmo的麻薯 1,今天也刚刚上线。

VB每日消息

关注最新动态!每天将最新的新闻发送到您的邮箱。

通过订阅,您同意VentureBeat的条款与条件以及隐私政策。请注意,原文中可能存在省略或不完整的信息(如缺少"terms and conditions and privacy policy"等具体条款),因此此处补充了常见的翻译内容。如果仅依据给出的部分文本,则输出原文:By subscribing, you agree to VentureBeat's服务条款。

感谢订阅。查看更多信息VB新闻通讯此处查阅.

发生错误。

关于《“这是一次变革”:Runway发布新的AI面部表情动作捕捉功能 Act-One》的评论


暂无评论

发表评论

摘要

加入我们的每日和周要闻,获取行业领先的人工智能报道的最新更新和独家内容。但是现在不同了:今天,总部位于纽约市的初创公司Runway(由谷歌等机构支持)宣布推出新功能“Act-One”,该功能允许用户从任何视频摄像头录制自己的视频或演员的视频——甚至是智能手机上的摄像头——然后将主体的面部表情精准地转移到一个AI生成的角色上。根据Runway联合创始人兼首席执行官Cristóbal Valenzuela的说法,“目前这个特性主要专注于脸部”,他在X平台通过直接消息回复了VentureBeat的问题。 Runway的方法为动画师、游戏开发者和电影制作人提供了显著的优势。“区别在于你如何使用该模型——你是如何看待它的应用案例,以及最终你会建立什么,”Valenzuela写道。通过降低与角色动画相关的传统技术壁垒,该公司希望在数字媒体领域激发新的创造力水平。