Meta 推出即时人工智能添加声音的视频生成器 - 纽约时报中文网

2024-10-04 13:00:06 英文原文

支持者

Meta 推出即时人工智能添加声音的视频生成器

这家科技巨头是众多开发技术的公司之一,这些技术可以重塑好莱坞或帮助传播虚假信息。

凯德·梅斯和迈克·艾萨克

旧金山报道

二月份,人工智能初创公司 OpenAI 推出了名为 Sora 的技术,人们只需在电脑屏幕上的框中输入一个句子,就可以生成逼真的视频,例如长毛猛犸象在白雪皑皑的草地上小跑。

由于担心该技术可能被滥用,以及操作该技术的成本可能很高,OpenAI 尚未将 Sora 发布到一小部分测试人员之外。但其他公司正在竞相发布类似的技术。

周五,科技巨头 Meta 推出了一套 A.I.名为 Meta Movie Gen 的工具,用于自动生成视频、即时编辑视频并将其与人工智能生成的音效、环境噪音和背景音乐同步。

Metas 生成人工智能副总裁 Ahmad Al-Dahle 在接受采访时表示,如果没有音频,视频就毫无意义。

给定图像的简短文本描述,一种工具可以创建视频。然后,给出一些声音的另一种描述,第二个工具添加音频。

演示包括在几分钟内制作的短视频,其中包括一名身穿斗篷的男子站在瀑布上、一条蛇在森林中滑行以及一个人骑着全地形车穿越沙漠。每个都包含音乐和音效。

新系统还允许人们上传自己的照片,并立即将这些图像编织成移动视频。

它生成每秒 16 帧的视频,持续时间长达 16 秒。在某些情况下,这些视频存在缺陷。在《纽约时报》的一次演示中,当被要求生成公园里一只狗用手机说话的视频时,它错误地将一只人手移植到了手机上。

Facebook 和 Instagram 的所有者 Meta 将这项技术视为加速好莱坞电影制作人和在线创作者工作的一种方式。与 OpenAI 一样,它已经开始与一小群专业人士一起测试该技术。

(《泰晤士报》于 12 月起诉 OpenAI 及其合作伙伴微软,声称侵犯了与人工智能系统相关的新闻内容的版权。)

这两家公司是开发此类工具的众多公司之一;其他公司包括 Runway 和 Pika 等初创企业以及谷歌和微软等科技巨头。尽管许多人认为这项技术可以加快经验丰富的电影制作人的工作速度,但它也可以取代经验不足的数字艺术家。

其他专家担心该技术可能会成为一种快速且廉价的在线虚假信息制造方式,从而使辨别互联网上的真实信息变得更加困难。

虽然 OpenAI 和其他公司一直不愿意发布一些人工智能。由于担心虚假信息和其他潜在风险,Meta 更快地自由分享这些技术,并认为风险并不像看上去那么大。

先生。Al-Dahle 表示,Meta 会用水印标记系统生成的视频,以表明它们是由人工智能生成的。但这样的标签是可以删除的。(《纽约时报》在本文的视频中添加了“由 A.I. 生成”水印。)

他还表示,公司仍在测试该技术,以更好地了解可能存在的风险以及如何减轻风险。

Metas 演示不包括口语。但包括 OpenAI 在内的许多公司正在开发人工智能。可以立即重现人类声音的技术。

凯德·梅茨 (Cade Metz) 撰写有关人工智能、无人驾驶汽车、机器人、虚拟现实和其他新兴技术领域的文章。更多关于凯德·梅斯

Mike Isaac 是《泰晤士报》驻旧金山的技术记者。他定期报道 Facebook 和硅谷。更多关于迈克·艾萨克

广告

关于《Meta 推出即时人工智能添加声音的视频生成器 - 纽约时报中文网》
暂无评论

摘要

支持者Meta 推出即时人工智能添加声音的视频生成器这家科技巨头是众多开发技术的公司之一,这些技术可以重塑好莱坞或帮助传播虚假信息。凯德·梅斯和迈克·艾萨克来自旧金山的报道今年 2 月,人工智能初创公司 OpenAI 推出了名为 Sora 的技术,人们只需在电脑屏幕上的框中输入一个句子,就可以生成逼真的视频,就像长毛猛犸象在白雪皑皑的草地上小跑一样。Facebook 和 Instagram 的所有者 Meta 将这项技术视为加速好莱坞电影制作人和在线创作者工作的一种方式。虽然 OpenAI 和其他公司一直不愿意发布一些人工智能。由于担心虚假信息和其他潜在风险,Meta 更快地自由分享这些技术,并认为风险并不像看上去那么大。关于凯德·梅斯的更多信息迈克·艾萨克 (Mike Isaac) 是《泰晤士报》驻旧金山的科技记者。