英语轻松读发新版了,欢迎下载、更新

AI并不是好莱坞来的。它已经到了

2025-08-20 10:00:00 英文原文

作者:Zoë Schiffer

Lady Gaga可能以为她的温室里的政变不会发生。再说一次,她与亿万富翁的创始人肖恩·帕克(Sean Parker)共同主持了一个聚会Napster和第一任总统Facebook

那是2024年2月,这位歌手邀请客人去马里布的2250万美元Oceanside Estate,以纪念一家非营利组织的发射。该组织的受托人之一是她的男友,他的日常工作正在经营帕克基金会。在烛光空间中,旁边望着太平洋的落地窗,帕克的人们与gaga s,nibling tocaccia和布兰奇诺·阿拉(Branzino Alla)的布拉斯(Branzino Alla)搭配到弦乐四重奏(当然是格莱美奖得主)的音乐。

Prem Akkaraju是Parker的亲密朋友和商业伙伴之一,穿着量身定制的西装,他的厚头发呈完美。自帕克(Parker)在Facebook上以来,这两个男人彼此认识,Akkaraju在音乐行业。多年来,他们尝试不成功平台在一起,更成功地接管了一家著名的视觉效果公司。最近他们一直在谈论开始AI冒险

那天晚上,在加加(Gaga)的Akkaraju发现自己坐在稳定AI的投资者旁边,该公司于2022年在2022年推出了广受欢迎的文本到图像发电机稳定的扩散。尽管早期成功,但稳定性仍在盘旋上 - 投资者回忆说。这是在没有选择的几天之内。好莱坞

似乎确实需要一个朋友。自2022年以来,美国制作的电影和电视节目数量下降了约40%,由于在家中的生产成本,海外竞争以及长期运行劳资纠纷到处。AI承诺通过加速生产和削减成本来恢复数字:让计算机自动化翻译对话框的咕unt声,通过艰苦的框架增加视觉效果框架,并从数十亿次拍摄中编辑繁荣的麦克风麦克风。也许有一天他们甚至可以编写脚本并采取行动!该行业的两个最大工会在某种程度上进行了罢工,以保证生成的AI不会在短期内取代工会工作。但是,每项主要的工作室和流媒体服务都在竞争,以找出其AI策略,许多创业公司Luma,Runway,Asteriaâ都在开发工具来推销它们。

Akkaraju看到了他面前的机会。稳定性AI具有技术。它只需要好莱坞完成。据他所知,只有一个问题。公司没有首席执行官吗?

当Emad Mostaque时,该公司的任务是一位前对冲基金经理,成立于2020年,是建立在解决社会最棘手的问题方面具有真正不同的系统。到2022年,Mostaque系统认为他需要构建的系统是一个足以运行生成AI模型的云超级计算机。Openai正在通过其封闭源型号获得吸引力,Mostaque想要做一个开源他说。他向一组开源系统的学术研究人员提供了超级计算机,您可以在其中输入单词来生成图像。研究人员不愿拒绝。当年8月,他们与莫斯特克(Mostaque)的公司合作推出了稳定的扩散。

文本到图像的发电机是一个突破性的打击,在两个月内吸引了1000万用户。斯坦福大学的计算机科学教授Maneesh Agrawala说,这很接近最先进。开放性是模型成功的核心。Agrawala说:“它允许研究人员实质上扩展模型,对其进行微调,并促使整个社区在创建增强和附加组件方面采取行动。”到2022年10月,稳定性AI只有77名员工,但是有数千次在更广泛的扩散社区中,它可以与更大的竞争对手竞争。Mostaque从风险投资公司和对冲基金(包括Coatue and Lightspeed)中筹集了1.01亿美元的种子回合(他告诉我,最后一百万是好运)。该公司是独角兽。

照片插图:马克·哈里斯(Mark Harris);盖蒂图像

这一时期的员工将大多数人描述为有远见的人。他雄辩地谈到需要民主化获得人工智能的必要性。莫斯特克(Mostaque)告诉员工,在不太遥远的未来,该公司将解决复杂的生物医学问题并产生第八季权力游戏。这是一家非常有趣且混乱的创业公司,在墙上扔了很多意大利面,其中一些非常困难。”一位前高级员工告诉我。(就像我与之交谈的其他人一样,员工要求匿名自由谈论Mostaque和公司。)

莫斯特克(Mostaque)对成功感到兴奋。但是他也在头上。他说,我是全新的。``与我的Aspergers and ADHD一起,我当时想,这是什么?''Mostaque的谈话很快,他的语气事项:在研究方面,我们真的做了好事。我不太擅长的另一面是管理方面。两名前员工告诉我,他们觉得Mostaque对建造可销售的产品没有深入思考。一个人说,他只是想建立模型。

该公司的成功带来了仔细的审查,尤其是围绕模型的建立方式。像许多文本对图像模型一样,稳定的扩散1.5也接受了训练Laion-5b,一个开源数据集链接到从网络上刮下来的58亿张图像,包括儿童性剥削材料和受版权保护的工作。2023年1月,Getty Images在伦敦高等法院起诉稳定性AI,据称是在1200万张专有照片上训练其模型。几周后,该公司在美国提起了类似的诉讼。在美国抱怨,盖蒂指责AI公司的盗窃和自由诉讼。

然后,在2023年6月,福布斯发表了一个轰动一时的故事,指称莫斯特克(Mostaque)夸大了他的资格,并将该业务歪曲给了他的投资者。文章还声称,莫斯特克(Mostaque)仅获得了牛津大学的学士学位,而不是硕士。(Mostaque他赢得了两者,但他的一项文书错误是负责混合的原因。)据报道,稳定性欠了数百万美元的亚马逊Web服务,这为其模型提供了计算能力。尽管Mostaque谈到了合作伙伴关系,但稳定的发言人向福布斯承认,实际上,这实际上是一项具有标准折扣的普通云服务协议。

Mostaque为所有这些都有答案,但是无论如何,投资者都失去了信心。文章发表四个月后,来自Coatue和Lightspeed的风险投资人离开了董事会,表明他们不再对业务充满信心。到今年年底,该公司的研究负责人,首席运营官,总法律顾问和人力资源负责人也离开了。许多稳定的研究人员都会遵循。在投资者的压力下,莫斯塔克(Mostaque)终于在2024年3月22日离开了该公司,距Lady Gaga的温室Soiree几周后。

Akkaraju和Parker毫不浪费时间来接管稳定,安装Akkaraju担任首席执行官,帕克担任董事会主席。他们从来没有与Mostaque交谈,尽管这位前首席执行官说他伸出援手提供支持。

两人开始尝试重制稳定性AI。他们接手不久后,比赛变得更加激烈。那9月,另一家创业公司跑道,签署了AI行业的第一个大事与电影制片厂一起。跑道将访问Lionsgate的电影专有目录,作为培训数据并为工作室开发工具。跑道首席执行官克里斯蒂·巴伦塞埃拉(Cristã³balValenzuela)说,从想法到执行所需的时间就像很多一样。您预测,您可以在几分钟内做一些过去的事情。

与Lionsgate的交易将好莱坞的AI-FITHIC推向了超速驾驶。``我可以告诉你,去年,当我来到洛杉矶与今天的白天和黑夜时,我可以告诉你,”另一位稳定竞争者Luma的首席执行官Amit Jain说。去年,这是让概念证明的原型 - 他们在推迟了不可避免的。今年是一种完全不同的语气。

Moonvalley是一家由Google DeepMind研究人员(Asteria的母公司)创立的AI公司,该公司是由演员Natasha Lyonne共同创建的AI电影工作室)告诉《时代》杂志十几个主要的好莱坞电影制片厂正在测试其对技术的最新模型信号开放性,即使还没有充分拥抱。

真的是关于我和肖恩(Sean)的发展,提供了这个方向,领导力,并真正利用了我们所谓的三个时间:时机,团队和技术。” Akkaraju说。

我不是坐在他的TED谈话中,而是在他在比佛利山庄附近的2000万美元豪宅中,在一个完美无瑕的白色沙发上,俯瞰着修剪整齐的花园。Akkaraju很合适,闪闪发光的白色笑容和纽扣,展示了他的二头肌。他的眼神交流和握手同样强大。

阿卡拉朱(Akkaraju)说,他任职的早期,他认为稳定性将不再与Openai和Openai竞争谷歌在构建边界模型上。相反,它将创建坐在这些模型之上的应用程序,从而使公司免于巨大的计算成本。Akkaraju与稳定性AI的云计算供应商进行了新协议,从而消除了公司的巨额债务。当被问到有关这是如何产生的详细信息时,阿卡拉朱(Akkaraju)是通过发言人表示反感的。但是,投资者涌向了。

在莫斯特(Mostaque)描绘了AI解决世界上最困难的问题的图片中,Akkaraju用残酷的性质来说,是为好莱坞的软件服务公司所建造的。他说,目的不是制作电影,而是要使用AI来增强电影制片人已经使用的工具。Akkaraju说:``我确实认为我们的差异化是在中心拥有创造者。”我看不到其他任何AI公司都有詹姆斯·卡梅伦(James Cameron)的董事会成员。

是的,具有讽刺意味终结者Skynet的创建者!不过,令人惊讶的是,卡梅伦是由帕克和阿卡拉朱经营的AI公司的董事会成员。十年前,卡梅伦(Cameron)帮助领导好莱坞的负责人。他不欣赏他们流媒体平台“放映室”的前提,这使人们在剧院上映的同一天以50美元的价格观看新的发行版。卡梅伦据说在Cinemacon的一群人告诉他,他致力于剧院的体验。在随后的几年中,没有一个主要的工作室公开宣布与放映室的交易,并在2020年在2020年将其更名为SR Labs。

照片插图:马克·哈里斯(Mark Harris);盖蒂图像

同年,Akkaraju和Parker接管了Weta Digital,这是大片背后的视觉效果工作室,例如指环王,,,,权力游戏和卡梅隆头像电影。Weta开发了虚拟摄像头,使卡梅伦通过取景器看到了人造环境的实时渲染,就好像他在虚构的潘多拉(Pandora)世界上拍摄一样。

一天晚上,卡梅隆,阿卡拉朱和帕克见面晚餐,讨论技术如何改变电影业。卡梅伦回忆说,龙舌兰酒在流动。形成了友谊。放映室中存在的任何紧张局势融化了。(Akkaraju说,我从未真正与他谈论过。他知道,我知道。这很有趣。)

因此,卡梅伦在董事会上,但是正如阿卡拉朱所说的那样,是中心的创造者吗?当我与帕克交谈时,他强调了使用开源模型并谈到了对创作者和对IP的尊重的重要性。但这是一个教训。

6月,当盖蒂(Getty)时,该公司获得了重大胜利放弃了其版权侵权主张由于审判接近英国的审判,因此从更广泛的诉讼开始。美国审判正在进行。Akkaraju说,该公司的来源数据来自可公开可用的数据集和获得培训和微调的许可数据,并且当我使用客户提供的数据集为客户创建解决方案时。

甚至那些对AI的看法承认,在大多数情况下,该技术还没有准备好大屏幕。文本到图像生成器可能会在营销机构中工作,但它们通常缺乏故事片所需的质量。一位要求保持匿名的电影制片人说,我为Netflix拍摄了一部电影,并试图使用一张镜头,不想公开讨论他们对AI的使用。这位电影制片人说,这是AI生成的镜头从质量控制中反弹,因为它不是4K分辨率。

然后是一致性的问题。电影制片人需要能够以微小的方式调整场景,但是对于市场上的大多数图像和视频发电机来说,这是不可能的。将同一提示输入聊天机器人10次,您可能会得到10个不同的响应。卡梅隆说,这在VFX工作流程中根本不起作用。我们需要更高的分辨率,需要更高的可重复性。我们需要在尚不完全存在的水平上的可控性。

这并没有阻止电影制片人进行实验。我与这个故事交谈的几乎每个人都说,AI已经是Previz过程的核心部分,在拍摄前将场景映射到了。该过程可以创建新的低效率。'旧系统的效率低下确实是我所看到的与我想向前迈进的信息之间的信息差距,'Toonstar的联合创始人Luisa Huang是一家技术前卫动画公司的联合创始人。使用AI,效率低下是一个版本,这是另一个版本,这是另一个版本。

好莱坞最早承认在最后帧中使用生成AI的人之一是亚马逊圣经史诗的导演和制片人乔恩·欧文(Jon Irwin)大卫之家。在拍摄希腊演出的第一季时,他对这项技术产生了兴趣。他说,我注意到我的生产设计师能够实时地想象思想。”我当时想,告诉我您如何做自己的事情。魔术师,您正在使用什么?

欧文(Irwin)开始使用工具。他说,我感到直接束缚了我的想象力。最终,他为亚马逊做了演讲,概述了他想在自己的作品中使用生成的AI。该公司支持。

欧文告诉我,我们为真实的一切拍摄了一切,仍然需要数百人。但是,我们能够以同一类型中一些较大节目的预算的三分之一进行,并且我们能够尽快完成两倍。大卫之家他说,实践效果会太昂贵了,因此AI创造了观众所看到的。

欧文说,他已经以稳定的方式与团队进行了交谈,但无法在大规模的演出中成功使用其工具。该评论反映了我在报告中发现的一个主题:我能够确定许多电影制片人承认,他们承认稳定的文本到文本生成器,但没有人在专业上使用专业的工具,但尚未专业地使用这些工具。

包含AI生成的图像。

由稳定性AI提供

工作室的禁忌承认他们对AI的拥抱似乎正在疲软。7月,Netflix联合首席执行官Ted Sarandos告诉投资者,该公司允许AG Gen Gen final录像首次出现在其原始系列之一中。他说,这一决定使生产加剧了十倍,并大幅削减了成本。他说,我们仍然坚信AI代表了一个令人难以置信的机会,可以帮助创作者制作电影和系列,而不仅仅是便宜。”

汉诺·巴斯(Hanno Basse),稳定性首席技术官向我展示了他在洛杉矶的后院的形象:一条草坪,被高高的树篱包围,玫瑰灌木丛拥挤着湾窗,以及左侧左角的一棵树。突然,2D图像分为3D。一种生成的AI模型填补了空白,估计了深度(远距离对冲玫瑰灌木丛,距离窗户的树多远)和其他缺失的元素,以使场景感到沉浸式。BASSE可以通过从下拉菜单中选择:放大或向外,向上或锅向下,螺旋形,将相机移动复制。

Basse说:“实际上,您可以只拍摄单个图像并产生概念,而不是花费小时,几天或几周来建立虚拟环境并进行排练,而是在这里进行镜头。”

包含AI生成的图像。

由稳定性AI提供

稳定的主要管道建筑师Rob Legato似乎很高兴。从事的资深视觉效果专家华尔街的狼头像,Legato于3月加入公司。拍摄电影前的晚上凌晨2点,他一直在这次会议上担任公司主管和Beta测试人员。

Legato说,唯一的问题是下拉菜单。他说,您可能想将它们结合起来并有一个滑块。

包含AI生成的图像。

由稳定性AI提供

稳定性AI的产品仍处于初期。甚至Legato也承认我们正在寻找的虚拟摄像头工具的版本还有一条路,然后才能使用专业人员。不幸的是,不幸的是,我的工作很重要。”他说。

对话漂移到旋转镜。Legato解释说,这个过程,艺术家用框架在场景上绘制素描,用于花费数百小时,并保留给入门级动画师。现在,AI可以自动隔离图像的一部分并添加视觉效果。他告诉我,您永远都不希望您的孩子在Roto上工作。

该评论旨在听起来乐观,但对AI将如何影响好莱坞产生了迫切的恐惧。也就是说,该技术将导致广泛的失业。

我听到VFX公司的艺术家说:“嘿,我不想被替换。当然,您不想被替换!”卡梅隆说。``如果你们要失业,您将因工作干燥而不是被这些AI代模型抛弃而失去工作。这一想法是由Akkaraju和Parker回应的,因为随着电影的制作更便宜,电影就会变得更便宜,更多的电影就会被制作,整体就业就会上升。

当在这一点上按下时,Akkaraju恢复了扩展的隐喻。他说:```当ATM在80年代推出时,所有出纳员都真正齐心协力。他们就像,这是我们的工作。我们进行提款,我们取存款,现在您可以让这台机器这样做。从那以后发生的事情是,柜员工作比以往任何时候都多,他们的平均工资更高,甚至对通货膨胀进行了调整。”

在Lady Gaga的温室中开始的政变是否最终挽救了稳定的AI,AI革命都在这里,已经改变了好莱坞。那座崩溃的建筑,那片燃烧的森林,播放表演或去电影院时看到的那群人?一个带有键盘的人可以使他们成为。关于那个银行销售商的轶事的事情是,技术优先主义者经常使用稳定性AI投资者埃里克·施密特(Eric Schmidt)。他们没有提到的是,银行出纳员的数量在2015年左右达到顶峰。从那时起,情况正在下降。


让我们知道您对本文的看法。向编辑提交一封信 mail@wired.com。.

关于《AI并不是好莱坞来的。它已经到了》的评论


暂无评论

发表评论

摘要

围绕稳定性AI的崛起及其对好莱坞的影响的叙述是复杂而多方面的,涉及技术进步,工作流离失所的恐惧以及围绕数据使用情况的道德问题。这是根据您的摘要的一些关键点:1。**技术进步**:稳定性AI开发了可以将2D图像转换为沉浸式3D环境的工具,从而通过减少时间和成本大大减少了胶片制作的前景化(Previz)阶段。但是,这些技术仍处于早期阶段。2。**工作流离失所的问题**:尽管詹姆斯·卡梅伦(James Cameron)这样的拥护者认为,由于电影生产效率的提高,人工智能会导致更多的工作创造,但行业工人对失去工作自动化的恐惧感到明显的恐惧。银行出纳员的例子通常被认为是技术转变最终可以创造新的角色和机会的证据。但是,这个示例掩盖了自2015年以来银行出纳员人数一直在下降的事实。3。**道德考虑**:关于侵犯数据权利的持续诉讼,尤其是Getty Images对稳定性AI的版权主张。该公司已转移到使用许可的数据集进行培训和微调,这表明在数据采购方面朝着更具道德的做法迈进。4。**行业接受**:尽管Netflix使用“ AI Gen Final录像”的使用证明了电影行业中AI的接受程度越来越高,但由于关注工作安全的创造者和工人的潜在反对,全部透明度仍然低调。5。**与行业领导者的合作**:稳定性AI与詹姆斯·卡梅隆(现为董事会成员)和老将视觉效果专家等有影响力的人物建立了合作伙伴关系,例如罗布·莱格托(Rob Legato),这使他们的技术具有信誉,并有助于使行业过渡到AI集成。6。**质量与一致性**:主要挑战之一是实现高质量的视觉效果和一致的结果。尽管实验正在进行,但大多数当前的生成模型都缺乏专业电影生产所需的可重复性。7。**监管和法律景观**:关于数据权利和版权侵权的法律斗争突出了媒体和娱乐中AI周围不断发展的监管格局。总之,尽管稳定性AI的工具有望通过降低成本和提高效率来改变电影制作,但仍需要解决有关工作流离失所,道德数据实践和技术准备就绪的关注,然后才能实现广泛采用。