AI 电影时代已然来临,但 OpenAI 仍在打造重磅炸弹 - 知乎

2024-09-22 13:47:17 英文原文

生成式人工智能热潮始于 ChatGPT 基于文本的响应,但现已发展到包括图像生成和现在的文本到视频。

亚马逊本周推出了四种此类工具,YouTube、阿里巴巴和狮门影业电影制片厂。他们根据书面描述创建视频(想想:“创建狗接球的视频”),但这项技术还有很长的路要走。

YouTube 的 Veo 工具只能创建绿屏- 风格背景的垂直剪辑,称为 Shorts。完整的视频剪辑(长度最多六秒)将在 2025 年推出。

没有监管,有巨大的利润激励,会出现什么问题?

亚马逊的工具可以帮助卖家制作非常简单的简单广告。一个示例剪辑使咖啡杯的静态图像栩栩如生,并制作了一段在人造背景下冒着热气的视频。据 CNBC 报道,有关阿里巴巴工具的细节很少,但该公告是在发布 100 个开源模型的同时发布的。

这些工具与 OpenAI 承诺的 Sora 视频生成器相比相形见绌,Sora 视频生成器可以生成长达 60 秒的无声剪辑。(谷歌在 5 月份的 I/O 大会上对 Veo 做出了类似的承诺。)当 Sora 在 2 月份首次亮相时,它的超现实视频震惊了互联网。玩具反斗城甚至用它来制作一个具有完整故事情节和完美动画的广告。

Sora 尚未向公众开放。OpenAI 首席技术官 Mira Murati 表示,它将在今年年底推出,“最终”将出现声音生成。

与此同时,OpenAI 重点发布了两个 AI 模型:GPT-4o 和 GPT-o1。后者被称为“草莓”,主要面向需要解决复杂推理问题的科学家和工程师。

通过视频,亚马逊和 YouTube 在实用工具方面击败了 OpenAI。公众。即使 Sora 在技术上“更好”地创建视频,这还有待观察,亚马逊和 YouTube 也可以从他们的视频中获得更多的使用,因为它们嵌入了数百万人每天使用的网站中。另外,考虑到极高的计算要求,我们不知道 Sora 的成本是多少,以及随之而来的用户限制。

眼见为实?

我们确定我们这样做吗?想要更多人工智能视频吗?它们加剧了人们对人工智能深度伪造的现有担忧,并可能破坏我们相信我们在网上看到的内容的能力。

从历史上看,视频一直是事实的最终来源。电子邮件、文本和照片都可以在 Photoshop 中修改,但视频呢?这很难反驳。对于那些试图通过制作某人的“视频”来贬低或歪曲某人的人来说,这是终极礼物。尽管独裁委内瑞拉的记者对人工智能视频至少有一个积极的用途,但坏人滥用这些系统的可能性可能超过其积极作用。

狮门影业与人工智能初创公司 Runway 的新合作伙伴关系可能会拯救副主席迈克尔·伯恩斯 (Michael Burns) 告诉《华尔街日报》,《饥饿游戏》的制作者“投入了数百万美元”。亚马逊同样宣称其人工智能视频生成器是为无法雇用昂贵的制作人员的小型企业节省成本的措施。

Burns 表示,Runway 的模型将增强创意工作,而不是取代它。其他人则认为这项技术威胁到故事板和视觉特效艺术家的工作。据 Artnet 报道,该公司还提供静态图像生成服务,并因侵犯版权而被艺术家起诉。

也许 OpenAI 在 Sora 的公开发布中进展缓慢,因为它给了公司时间来测试它并实施保障措施。今年 2 月,该公司承诺“在 OpenAI 产品中使用 Sora 之前,将采取一些重要的安全措施,例如与错误信息、仇恨内容和偏见等领域的红队专家合作,他们正在对抗性地测试该模型。”

在美国,我们只有零散的法律来解决此类技术。利润仍然是最终的激励因素。一些工具,如 Google Gemini 和 Midjourney,对总统候选人等公众人物施加了限制。然而,埃隆·马斯克 (Elon Musk) 的 Grok AI 可以生成名人的图像,无论请求多么奇怪。没有监管,有巨额利润激励,会出什么问题吗?

获取我们最好的故事!

注册“立即更新”,每天早上将我们的热门故事发送到您的收件箱。

获取我们的最佳故事!p>

本新闻通讯可能包含广告、优惠或附属链接。订阅时事通讯即表示您同意我们的使用条款和隐私政策。您可以随时取消订阅时事通讯。

阅读 Emily Dreibelbis 的最新消息

  • 挪威的电动汽车数量现已超过汽油汽车,但石油仍然是王道
  • 在亚马逊购物?你看到的几乎所有内容很快都会由 AI 生成
  • FTC:社交媒体网站是“大规模监视”操作
  • Google 的 Veo 文本到视频 AI 生成器即将登陆 YouTube Shorts
  • Discord 推出“Dave”端到端加密语音和视频聊天
  • Emily Dreibelbis 的更多内容
关于《AI 电影时代已然来临,但 OpenAI 仍在打造重磅炸弹 - 知乎》
暂无评论

摘要

生成式人工智能热潮始于 ChatGPT 基于文本的响应,但现已发展到包括图像生成和现在的文本到视频。与 OpenAI 所承诺的 Sora 视频生成器相比,这些工具相形见绌,Sora 视频生成器可以生成长达 60 秒的无声剪辑。(从历史上看,视频一直是真相的最终来源。今年 2 月,该公司承诺“在 OpenAI 产品中使用 Sora 之前,采取几个重要的安全措施,[例如]与红队成员在错误信息、仇恨内容、和偏见谁正在对抗性地测试模型。您可以随时取消订阅时事通讯。