加入我们的每日和每周时事通讯,了解有关行业领先人工智能报道的最新更新和独家内容。了解更多
一支队伍来自土坯研究和香港大学科学及科技(香港科技大学)开发了一种人工智能系统,可以改变电影、游戏和互动媒体视觉效果的制作方式。
该技术被称为跨皮克斯,为人工智能生成的视频添加了一个关键功能:能够创建透明元素,如烟雾、反射和飘逸效果,自然地融入场景中。目前的人工智能视频工具通常只能生成实体图像,这使得 TransPixar 成为一项重大的技术成就。
“Alpha 通道对于视觉效果至关重要,它可以让烟雾和反射等透明元素无缝地融入场景中,”Adobe Research 项目负责人、项目负责人之一李一君 (Yijun Li) 说道。这 纸质作者。– 然而,由于数据集有限且难以适应现有模型,生成包含用于透明度的 Alpha 通道的 RGBA 视频仍然是一个挑战。 –
这一突破是在娱乐、广告和游戏行业对视觉效果的需求持续激增的关键时刻实现的。传统的视觉特效工作通常需要艺术家付出艰苦的手工努力才能创造出令人信服的透明效果。
TransPixar:为 AI 视觉效果带来透明度
TransPixar 特别引人注目的是它能够在使用非常有限的训练数据的情况下保持高质量。研究人员通过开发一种新颖的方法来实现这一目标,该方法可以扩展现有的视频人工智能模型,而不是从头开始构建模型。
“我们引入了用于 alpha 通道生成的新标记,重新初始化其位置嵌入,并添加零初始化域嵌入以将其与 RGB 标记区分开来,”香港科技大学的主要作者兼研究员 Luozhou Wang 解释道。– 使用基于 LoRA 的微调方案,我们将 alpha 令牌投影到 qkv 空间,同时保持 RGB 质量。 –
在演示中,该系统展示了令人印象深刻的结果,从简单的文本提示生成各种效果,从旋转的风暴云和神奇的门户到破碎的玻璃和滚滚烟雾。该技术还可以使静态图像具有透明效果,为艺术家和设计师开辟新的创作可能性。
研究团队已经编写了他们的代码公开可用 在 GitHub 上并部署了一个演示开启 抱脸,允许开发人员和研究人员试验该技术。
为大大小小的创作者改变视觉特效工作流程
早期测试表明 TransPixar 可以使视觉效果制作变得更快、更简单,特别是对于无力承担昂贵效果工作的小型工作室而言。虽然该系统仍然需要强大的计算能力来处理较长的视频,但其对创意产业的潜在影响是显而易见的。
技术的重要性远远超出了技术改进。随着流媒体服务需要更多内容和虚拟制作的增长,人工智能生成的透明效果可能会改变工作室的运作方式。小团队可以创造出曾经需要大型工作室才能完成的效果,而大型制作可以更快地完成项目。
TransPixar 对于实时使用尤其有价值。视频游戏、AR 应用程序和现场制作可以立即创建透明效果,而这在今天需要数小时或数天的工作。
这一进展正值 Adobe 的关键时刻,因为像这样的公司稳定性人工智能和跑道竞争开发专业效果工具。各大工作室已经开始寻求人工智能来降低成本,这使得 TransPixar 的时机非常理想。
娱乐业面临三个日益严峻的挑战: 观众想要更多内容,预算紧张,还有那里效果艺术家还不够。TransPixar 提供了一种解决方案,可以更快地创建效果、更便宜且质量更一致。
真正的问题不是人工智能是否会改变视觉效果,而是传统的视觉特效工作流程在五年内是否还会存在。
使用 VB Daily 每日洞察业务用例
如果您想给老板留下深刻印象,VB Daily 可以满足您的要求。我们为您提供有关公司在生成人工智能方面所做的事情的内幕消息,从监管转变到实际部署,以便您可以分享见解以实现最大投资回报率。
阅读我们的隐私政策
感谢您的订阅。查看更多VB 时事通讯在这里。
发生错误。