人工智能生成的视频场景今年一直在跳跃(或疯狂地旋转,视情况而定)。仅过去一周,我们就看到了 OpenAI 的发布或公告索拉, 皮卡 AI 的鼠兔 2, 谷歌的维奥2,和极小极大视频-01-直播。坦率地说,要跟上步伐是很困难的,而测试所有这些则更困难。但最近,我们推出了一个新的开放权重AI视频合成模型,腾讯的混源视频,接受测试——令人惊讶的是,它能够成为一个“免费”模型。
与上述模型不同,HunyuanVideo的神经网络权重是公开分布的,这意味着它们可以在适当的情况下在本地运行(人们已经证明了它在消费类 24 GB VRAM GPU 上),它可以进行微调或与LoRA教它新概念。
值得注意的是,今年大部分时间里,一些中国公司一直处于人工智能视频领域的前沿,一些专家推测,原因是他们不太谨慎地使用受版权保护的材料进行培训,使用名人的图像和名字,并纳入一些未经审查的视频源。正如我们看到的稳定扩散3的损坏发布,包括训练数据中的裸体或色情内容,可能会让这些模型通过提供更多有关人体的信息来获得更好的结果。HunyuanVideo 特别允许未经审查的输出,因此与现有的商业视频模型不同,它可以生成解剖学上真实的裸体人体视频。
为了评估HunyuanVideo,我们向它提供了一系列我们使用过的提示Runway 的 Gen-3 Alpha和Minimax 的 video-01今年早些时候。这样,就可以轻松地重新访问那些早期的文章并比较结果。
我们使用以下代码生成了每个 5 秒长的 864 × 480 视频:商业云人工智能提供商。每个视频生成大约需要七到九分钟才能完成。由于这些世代不是免费的(每代的制作成本约为 0.70 美元),因此我们选择每个提示的第一个结果,因此下面没有挑选。您看到的所有内容都是上面列出的提示的第一代。