英语轻松读发新版了,欢迎下载、更新

烟雾、反射和入口:Adobe 的 TransPixar 将 AI VFX 提升到新的水平

2025-01-08 19:40:29 英文原文

作者:Michael Nuñez

Credit: VentureBeat made with Midjourney

图片来源:VentureBeat 使用 Midjourney 制作

加入我们的每日和每周时事通讯,了解有关行业领先人工智能报道的最新更新和独家内容。了解更多


一支队伍来自土坯研究香港大学科学及科技(香港科技大学)开发了一种人工智能系统,可以改变电影、游戏和互动媒体视觉效果的制作方式。

该技术被称为跨皮克斯,为人工智能生成的视频添加了一个关键功能:能够创建透明元素,如烟雾、反射和飘逸效果,自然地融入场景中。目前的人工智能视频工具通常只能生成实体图像,这使得 TransPixar 成为一项重大的技术成就。

“Alpha 通道对于视觉效果至关重要,它可以让烟雾和反射等透明元素无缝地融入场景中,”Adobe Research 项目负责人、项目负责人之一李一君 (Yijun Li) 说道。 纸质作者。– 然而,由于数据集有限且难以适应现有模型,生成包含用于透明度的 Alpha 通道的 RGBA 视频仍然是一个挑战。 –

这一突破是在娱乐、广告和游戏行业对视觉效果的需求持续激增的关键时刻实现的。传统的视觉特效工作通常需要艺术家付出艰苦的手工努力才能创造出令人信服的透明效果。

TransPixar 的透明效果演示展示了一个具有复杂反射表面和无缝 Alpha 通道混合渲染的逼真机器人,使图像能够集成到任何背景中。(来源:Adobe 研究)

TransPixar:为 AI 视觉效果带来透明度

TransPixar 特别引人注目的是它能够在使用非常有限的训练数据的情况下保持高质量。研究人员通过开发一种新颖的方法来实现这一目标,该方法可以扩展现有的视频人工智能模型,而不是从头开始构建模型。

“我们引入了用于 alpha 通道生成的新标记,重新初始化其位置嵌入,并添加零初始化域嵌入以将其与 RGB 标记区分开来,”香港科技大学的主要作者兼研究员 Luozhou Wang 解释道。– 使用基于 LoRA 的微调方案,我们将 alpha 令牌投影到 qkv 空间,同时保持 RGB 质量。 –

在演示中,该系统展示了令人印象深刻的结果,从简单的文本提示生成各种效果,从旋转的风暴云和神奇的门户到破碎的玻璃和滚滚烟雾。该技术还可以使静态图像具有透明效果,为艺术家和设计师开辟新的创作可能性。

研究团队已经编写了他们的代码公开可用 在 GitHub 上并部署了一个演示开启 抱脸,允许开发人员和研究人员试验该技术。

TransPixar 生成的红色飞机展示了 AI 系统创建具有精确透明效果的对象的能力,此处显示的格子背景显示了无缝的 Alpha 通道集成,这是 AI 生成视觉内容的关键技术进步。(来源:Adobe)

为大大小小的创作者改变视觉特效工作流程

早期测试表明 TransPixar 可以使视觉效果制作变得更快、更简单,特别是对于无力承担昂贵效果工作的小型工作室而言。虽然该系统仍然需要强大的计算能力来处理较长的视频,但其对创意产业的潜在影响是显而易见的。

技术的重要性远远超出了技术改进。随着流媒体服务需要更多内容和虚拟制作的增长,人工智能生成的透明效果可能会改变工作室的运作方式。小团队可以创造出曾经需要大型工作室才能完成的效果,而大型制作可以更快地完成项目。

TransPixar 对于实时使用尤其有价值。视频游戏、AR 应用程序和现场制作可以立即创建透明效果,而这在今天需要数小时或数天的工作。

这一进展正值 Adob​​e 的关键时刻,因为像这样的公司稳定性人工智能跑道竞争开发专业效果工具。各大工作室已经开始寻求人工智能来降低成本,这使得 TransPixar 的时机非常理想。

娱乐业面临三个日益严峻的挑战: 观众想要更多内容,预算紧张,还有那里效果艺术家还不够。TransPixar 提供了一种解决方案,可以更快地创建效果、更便宜且质量更一致。

真正的问题不是人工智能是否会改变视觉效果,而是传统的视觉特效工作流程在五年内是否还会存在。

使用 VB Daily 每日洞察业务用例

如果您想给老板留下深刻印象,VB Daily 可以满足您的要求。我们为您提供有关公司在生成人工智能方面所做的事情的内幕消息,从监管转变到实际部署,以便您可以分享见解以实现最大投资回报率。

阅读我们的隐私政策

感谢您的订阅。查看更多VB 时事通讯在这里

发生错误。

关于《烟雾、反射和入口:Adobe 的 TransPixar 将 AI VFX 提升到新的水平》的评论


暂无评论

发表评论

摘要

Adobe Research 和香港科技大学的团队开发了 TransPixar,这是一种人工智能系统,可以生成带有烟雾和反射等透明元素的视频,增强电影、游戏和互动媒体的视觉效果。这一突破克服了创建具有 Alpha 通道透明度的 RGBA 视频内容的挑战,使用有限的训练数据和一种适应现有模型的新颖方法。TransPixar 在根据文本提示生成各种视觉效果和以透明方式制作静态图像动画方面取得了令人印象深刻的成果,从而可能通过使视觉特效工作流程变得更快、更简单而改变视觉特效工作流程,特别是对于小型工作室而言。