英语轻松读发新版了,欢迎下载、更新

克林2.0评论:艺术状态AI视频质量 - 解密

2025-04-20 18:08:48 英文原文

作者:Decrypt / Jose Antonio Lanz

Kling 2.0,对最先进的AI视频生成器进行了重大升级发行由中国科技公司Kuaishou上周投放市场,引起了创作者的大量令人垂涎的反应,他们迅速通过数百美元测试其能力。

AI电影制片人PJ Ace发推文说:“ AI视频质量仅在一夜之间。我无语了。我从来没有看到过这种流体或提示这种准确的运动。该帖子获得了757,000多个观看次数,突出了该版本周围的嗡嗡声。

AI视频质量仅10倍。我无言以对。

克林2.0刚刚下降,我已经通过$ 1,250的学分来测试其限制。

我从未见过运动这种流体或提示这种准确的动作。
这正是我如何制作此视频,分步ð§µpic.twitter.com/f54efvlczj

PJ Ace(@pjaccetturo)2025年4月15日

新版本标志着从克林1.6,提供增强的及时理解,更多流动性的角色运动以及改进的视觉美学,​​用户描述的是“拍摄而不是生成”。最值得注意的是,Kling 2.0可以生成视频最多2分钟,在扩展叙事的可能性方面,将像Openai的Sora这样的竞争者留在尘土中。

“总的来说,克林确实在排行榜上保持了排名第一,” YouTuber Tim Simmon专门审查了生成AI模型,他在他的审查他认为,这是图像到视频一代的明显赢家,在直接的文本到视频一代方面,比赛更加接近。

这个新版本到达越来越拥挤的AI视频生成市场。竞争对手包括以高保真输出而闻名的跑道,该跑道最近发布了其V4模型,该模型的重点是电影结果和Google的VEO2,其文本到视频功能强大,并且在美学上令人愉悦。

到目前为止,该模型尚未在人工分析中列出。视频生成器排行榜它排名所有最佳的生成视频模型,但是它的前身Kling 1.6已经是图像到视频的领导者,并且基于盲目的测试在文本到视频中排名第二。

Kling 2.0具有多元素编辑器,允许用户使用文本或图像输入添加,交换或删除视频内容。

该平台还介绍了两个专业组件:Kling 2.0视频发电和Kolors 2.0 for Image Creation不可与另一个发行的开源中国AI Image Generator混淆在同一个Kolor名称下给创造者更多地控制自己的产出。

该工具对电影质量的关注使其对电影制片人,营销人员和内容创作者特别有吸引力。该模型在资源方面非常强大,几代人在免费计划中需要数小时,在在线平台上最多可容纳16分钟的视频。

标准计划的定价为每月29美元,其中包括专业模式,8秒的视频以及每天30个视频的津贴。免费计划提供6世代,具有4秒的限制和水印。该专业计划每月$ 89提供高分辨率,高级运动控制和优先处理。

测试模型

我们尝试了五类动力学,插图,文本对视频,结构相干性和多主体相干性的新模型。这是我们发现的。

活力

所有视频发电机仍然可以很好地处理场景,但通常在快速移动,错综复杂的场景和动态设置方面挣扎。这反映了现实生活中的视频或动画 - 在“ Tom&Jerry”追逐或动画战争场景中暂停您的电视,到处都会发现怪异的框架。

我们用一个男人飞越城市并要求它产生场景的静态图像测试了模型。

克林2.0对较小的迅速更改非常敏感。我们使用的第一次尝试:“动态跟踪镜头:一个男人在一条熙熙city的城市街道上以极高的速度飞行。相机紧随其后,捕捉了建筑物和交通繁忙的冲动,从而增强了他的速度和振奋感。”

不幸的是,提示引起了一个主题的幻想,这些主题是在街上向后吸尘的。这很可能是由于我们在提示中选择单词。

因此,我们只删除了一个词:“后面”。这改变了结果,制作了一个更好的视频,显示对象向前飞行,面对相机。

克林(Kling)捕获了关键场景元素动态和快​​节奏的运动,尽管在改变方向时,受试者的身体怪异地变形,而某些元素缺乏统一的结构。其他模型,例如Google的VEO2贸易动力,以实现现实主义,创造出更慢,更静态但更连贯的场景。

插图

提示:“ 360度水平锅:一个熙熙with的城市错综复杂的城市围绕着一棵巨大的树木,里面装满了房屋和桥梁。摄像机从树的前面到树的后部顺利移动,捕捉孩子们玩耍,人们从事日常活动,并飞行汽车在树枝上降落并在温暖的气氛下散发出树枝,并在树枝上起飞。”

该模型具有漫画和插图等想象中的风格,但在较小的细节中挣扎。它优先考虑连贯性,而不是细节,尊重光滑的相机运动和流体场景的主要提示元素。

物体结构保持坚固,而没有其他发电机中看到的摇摆,尽管有些孩子(这是整个构图的原始结构,而周围的繁忙的原始结构)失去了连贯性,而飞行的汽车偶尔会消失。

尽管如此,该测试还是从任何视频生成器中看到的最佳结果。

文本到视频

提示:“一个穿着红色连衣裙的金发女郎,一个穿着黑色西装的亚洲男人在星巴克聊天。中等射击。”

文本对视频对AI发电机提出了独特的挑战。该模型必须创建一个初始帧(本质上是文本对象任务),并将其用作所有后续帧的参考。理想情况下,如果您想要最好的连贯性,则需要为第一个框架进行专门的图像生成器,并且理想情况下也是最后一帧。

克林2.0在这里并不特别闪耀,但还不错。场景具有许多图像发生器常见的典型喷枪风格,但是身体保持正确的结构,手指看起来准确,并且没有明显的伪像破坏场景。

这是对Kling 1.6的改进,但不是该模型设计的目的。

结构相干

提示:“鸟瞰图:复杂的,抽象的建筑结构旋转的镜头。”

尽管克林在拥挤的场景中可能会在小细节上挣扎,但它在保持单个受试者的镜头中保持连贯性和细节很出色。

我们分享了一个错综复杂的图像,并要求该模型使其旋转。Kling 2.0几乎完美地处理了这一光线保持一致,运动是统一的,没有伪像,并且该结构保持了完整性。

这种功能使其可能对3D建模,从不同角度启用对象和场景预览具有价值。

多主体相干

提示:“五只灰狼幼犬在偏远的碎石路上嬉戏,互相追逐,被草包围着。幼崽奔跑,跳跃,互相追逐,互相咬,玩耍。”

这仍然是所有录像带的阿喀琉斯高跟鞋,包括克林2.0。自从Openai显示Sora无法生成一包小动物一起玩耍以来,所有视频发电机都尝试了这一挑战,结果混合了。没有模型始终取得完美的结果。

克林(Kling)2.0产生了一个生动,现实的场景,但狼彼此合并,在框架之间出现并消失。如果分析的唯一一件事是连贯性,那么Kling 2.0和Kling 1.6之间就没有太大的差异。

一个值得注意的改进:不规则性大多发生在背景中,前景动物在大多数情况下保持更好的连贯性。

可以通过克林·艾伊,freepik,Pollo AI和其他提供商。

通常聪明的新闻通讯

Gen叙述的每周AI旅程,Gen是一种生成的AI模型。

关于《克林2.0评论:艺术状态AI视频质量 - 解密》的评论


暂无评论

发表评论

摘要

来自中国科技公司Kuaishou的高级AI视频生成器Kling 2.0已获奖。与前身Kling 1.6相比,该更新提供了增强的及时理解,更光滑的角色运动以及提高的视觉质量。用户注意到,视频质量和创造力的急剧提高,花费数百美元来测试其功能。Kling 2.0可以生成长达两分钟的视频,并具有用于创建灵活内容的多元素编辑器。尽管它面临着其他AI模型(例如跑道V4和Google的VEO2)的竞争,但AI模型审稿人Tim Simmon由于其在图像到视频生成中的电影质量和多功能性而排名Kling 2.0作为顶级视频生成器。基本功能的定价为每月29美元,并提供免费计划。

相关讨论