一种新的、未经审查的人工智能视频模型可能会引发一场新的人工智能爱好者运动

人工智能生成的视频场景今年一直在跳跃（或疯狂地旋转，视情况而定）。仅过去一周，我们就看到了 OpenAI 的发布或公告索拉, 皮卡 AI 的鼠兔 2, 谷歌的维奥2，和极小极大视频-01-直播。坦率地说，要跟上步伐是很困难的，而测试所有这些则更困难。但最近，我们推出了一个新的开放权重AI视频合成模型，腾讯的混源视频，接受测试——令人惊讶的是，它能够成为一个“免费”模型。

与上述模型不同，HunyuanVideo的神经网络权重是公开分布的，这意味着它们可以在适当的情况下在本地运行（人们已经证明了它在消费类 24 GB VRAM GPU 上），它可以进行微调或与LoRA教它新概念。

值得注意的是，今年大部分时间里，一些中国公司一直处于人工智能视频领域的前沿，一些专家推测，原因是他们不太谨慎地使用受版权保护的材料进行培训，使用名人的图像和名字，并纳入一些未经审查的视频源。正如我们看到的稳定扩散3的损坏发布，包括训练数据中的裸体或色情内容，可能会让这些模型通过提供更多有关人体的信息来获得更好的结果。HunyuanVideo 特别允许未经审查的输出，因此与现有的商业视频模型不同，它可以生成解剖学上真实的裸体人体视频。

对混源视频进行测试

为了评估HunyuanVideo，我们向它提供了一系列我们使用过的提示Runway 的 Gen-3 Alpha和Minimax 的 video-01今年早些时候。这样，就可以轻松地重新访问那些早期的文章并比较结果。

我们使用以下代码生成了每个 5 秒长的 864 × 480 视频：商业云人工智能提供商。每个视频生成大约需要七到九分钟才能完成。由于这些世代不是免费的（每代的制作成本约为 0.70 美元），因此我们选择每个提示的第一个结果，因此下面没有挑选。您看到的所有内容都是上面列出的提示的第一代。

OC

一种新的、未经审查的人工智能视频模型可能会引发一场新的人工智能爱好者运动

对混源视频进行测试

关于《一种新的、未经审查的人工智能视频模型可能会引发一场新的人工智能爱好者运动》的评论

发表评论

摘要

相关新闻

相关讨论