评论:AI 视频正在迅速改进。以下是您自己制作视频的方法,以及随着生成视频成为主流需要注意的事项。
本月早些时候,一部新的电影预告片在 X(以前称为 Twitter 的平台)上发布,供一位法国人观看。该片由埃隆·马斯克、亚历山大·奥卡西奥-科尔特斯、总统乔·拜登和前总统唐纳德·特朗普主演。杰克·多尔西 (Jack Dorsey) 扮演一名拿着法棍面包的面包师,蒂姆·库克 (Tim Cook) 也客串了一名头晕的电车乘客。
当然,这部预告片是假的。人工智能生成的恶搞作品名为 La Baye Ara(湾区),由一位名为 @trbdrk 的用户创建,很快就疯传,许多用户评论说,他们最初被令人惊叹的人工智能效果愚弄了。
人工智能生成的广告和电影预告片一直是用户尝试文本到视频生成技术的热门提示。但与一年前相比,生产质量几乎在各个方面都得到了显着提高。该视频显然是一个模仿,但想象用户生成复制现实环境的视频并不牵强,这种能力激发了新的可能性,但也可能产生真正的后果。
作为一名全职创作者在过去的几年里,我一直在研究人工智能工具,我已经学会了如何在野外发现人工智能,以及可能使用哪些工具来生成内容。以下是如何创建像《La Baye Ara》这样的视频,以及浏览互联网时需要注意的事项。
像《La Baye Ara》这样的视频可以使用用户现在可以访问的三种生成人工智能工具来制作:
我想知道我个人会如何重新创作这样的视频。以下是我解构该过程的尝试:
这些步骤可能看起来很简单,但 La Baye Ara 可能更复杂。还值得注意的是,该视频没有任何对话,这会增加工作量。
现在我们已经讨论了工具用于创建视频和可能的制作过程,是时候训练我们的眼睛和耳朵来识别人工智能生成的视频了。
首先,寻找视觉线索,例如面部表情不一致、不自然的身体动作或前景、背景或过渡中的伪像和故障。当这些角色眨眼或移动嘴唇时,您可以轻松识别出故障。我所说的故障是指他们眨眼的方式或眨眼之间的转换以及他们移动身体的方式的不自然运动,有时看起来很机械且不一致。随着人工智能视频和音频随着时间的推移而改进,这些故障将更加微妙且难以检测。
有时,即使您无法用语言完全表达出来,您也能够发现故障 --这很常见。科学杂志《人类运动科学》上的一篇文章发现,人类的自然运动是由神经运动控制、生物力学和适应性的复杂相互作用产生的。用外行的话来说,人类的动作是微妙的,我们的眼睛通常能识别出比我们能够用语言表达的更多内容。
接下来,寻找音频线索,例如不匹配的口型同步、不一致的背景噪音或不自然的语调。语音模式或口音。我发现语调对我来说通常是最明显的提示。语调特指语音中音高的升降。这是一种传达意义的方式,就像区分问题和陈述一样,它存在于所有口语中,而不仅仅是英语。声音模式指的是更广泛的元素,其中可能包括语调,但也包括节奏、音调和呼吸停顿等内容。一旦您注意到这些明显的、有时是微妙的差异,您就会发现很容易发现人工智能生成的视频。
最后,您还有上下文线索,这些元素超越了音频和视觉不一致的范围。我们经常通过自己的经验、知识和逻辑来区分虚假内容。在《La Baye Ara》中,演员阵容很荒谬,而且明显是恶搞。但也要注意角色与现实生活中的年龄之间的差异。原因之一是人工智能通常是根据多年前的照片或视频进行训练的。
最终,人工智能视频会变得如此出色,以至于我们必须验证这些演员是否出现在某些电影和其他电影中。作品。IMDB 和 Google 搜索是我们许多人可用于验证的资源,从多个来源收集信息通常是个好主意。
但是,如果创作者、组织和政治实体选择不披露人工智能内容怎么办?这可能是一个真正的问题。正如我们近年来所看到的,未公开的人工智能和捏造的内容可能会导致公众信任的侵蚀、操纵性错误信息的传播以及严重的道德和法律问题。
我们可以更多地了解人工智能当前的含义。如果我们有能力,作为一个受过教育的思想家群体,我们就会过得更好。正如公司需要实践负责任的人工智能一样,我们也有责任了解其功能和局限性。
好消息是,有多种方法可以保持联系并了解情况。考虑学习一些日常生活中用到的人工智能工具。使用 ChatGPT、Perplexity、Claude 和 Google Gemini 等易于使用的免费工具提出问题并寻求答案。另外,如果您是像我一样的创作者,请了解创作者已经在使用哪些 AI 工具。
我希望这篇文章对您有所帮助,因为我们将继续探索不断发展的 AI 世界。如果您以后想了解有关这些工具和服务的更多信息,请访问我的 YouTube 频道。