加入我们的每日和每周时事通讯,了解有关行业领先人工智能报道的最新更新和独家内容。了解更多
莱特里克斯是一款热门照片编辑应用程序背后的以色列公司面调,正在发起一项雄心勃勃的努力,以撼动生成式人工智能的格局。该公司今天宣布发布LTX 视频 (LTXV),一个开源人工智能模型,能够在短短四秒内生成五秒的高质量视频。通过免费提供其视频模型,Lightricks 直接瞄准了来自科技巨头的专有人工智能系统日益增长的主导地位。开放人工智能,土坯, 和谷歌。
Lightricks 联合创始人兼首席执行官 Zeev Farbman 在接受 VentureBeat 独家采访时表示:“我们相信基础模型将成为一种商品,你无法围绕基础模型建立实际业务。”“如果初创公司想要有很大的竞争机会,技术就需要开放,并且您希望确保世界各地顶尖大学的人员能够访问您的模型并在其基础上添加功能。”¤
凭借实时处理、长视频的可扩展性以及即使在消费级硬件上也能高效运行的紧凑架构,LTXV 已准备好让更广泛的受众能够使用专业级生成视频技术——这种方法可能会颠覆行业现状。
Lightricks 如何利用开源来挑战人工智能巨头
Lightricks 决定将 LTXV 发布为开源这是一场精心策划的赌博,旨在让公司在日益拥挤的生成人工智能市场中脱颖而出。这模型拥有 20 亿个参数,旨在在广泛使用的 GPU 上高效运行,例如 NVIDIARTX 4090,同时保持高视觉保真度和运动一致性。
这一举措出台之际,许多领先的人工智能模型(来自 OpenAI)达尔-E到 Google 的图像– 被锁定在 API 后面,要求开发人员付费才能访问。相比之下,Lightricks 认为开放性将促进创新和采用。
Farbman 将 LTXV 的发布与 Meta 的开源版本进行了比较Llama 语言模型,它很快在人工智能社区中获得了关注,并帮助 Meta 在 OpenAI 主导的领域中站稳了脚跟聊天GPT。“商业理由是,如果社区采用它,如果学术界的人们采用它,我们作为一家公司将从中受益匪浅,”法布曼说。
与 Meta 不同,Meta 控制其模型运行的基础设施,Lightricks 只专注于模型本身,与诸如抱脸使其易于访问。“目前我们不会从这种模式中赚到任何钱,”法布曼强调道。– 有些人会将其部署在本地硬件上,例如游戏 PC。这一切都与采用有关。”
快如闪电的人工智能视频:打破消费类硬件的速度记录
LTXV 的突出特点是速度。该模型可以生成 5 秒的视频(分辨率为 768 × 512 的 121 帧),在 NVIDIA 上只需 4 秒H100 GPU。即使在消费级硬件上,例如RTX 4090,LTXV 提供近乎实时的性能,使其成为同类中最快的模型之一。
这种速度是在不影响质量的情况下实现的。模型的扩散变压器架构确保帧之间的平滑运动和结构一致性,解决早期视频生成模型的关键限制。对于小型工作室、独立创作者和研究人员来说,在经济实惠的硬件上快速迭代并生成高质量结果的能力将改变游戏规则。
“当您等待几分钟才能得到结果时,这是一种糟糕的用户体验,”法布曼说。– 但是一旦您快速获得反馈,您就可以更快地进行实验和迭代。您开发了系统功能的思维模型,从而释放了创造力。”
Lightricks 还设计了 LTXV 以支持较长格式的视频制作,为创作者提供更大的灵活性和控制力。这种可扩展性与其快速处理时间相结合,为从游戏到电子商务等行业开辟了新的可能性。
例如,在游戏中,LTXV 可用于升级旧游戏中的图形,将其转变为视觉上令人惊叹的体验。在电子商务中,该模型的速度和效率可以帮助企业创建数千种广告变体以进行有针对性的 A/B 测试。
“想象一下,选一个演员(无论是真实的还是虚拟的),并实时调整视觉效果,为特定观众找到最佳的创意,”法布曼说。
从照片应用程序到人工智能巨头:Lightricks 大胆的市场布局
通过 LTXV,Lightricks 将自己定位为日益由少数科技巨头主导的行业的颠覆者。对于一家以移动应用程序制造商起家、因 Facetune(一款风靡全球的消费者照片编辑应用程序)而闻名的公司来说,这是一个大胆的举措。
此后,Lightricks 扩大了其产品范围,收购了总部位于芝加哥的影响者营销平台热门支付并启动LTX工作室,一个面向专业创作者的人工智能驱动的讲故事平台。LTXV 与 LTX Studio 的集成预计将增强该平台的功能,使用户能够以更高的速度和精度生成更长、更动态的视频。
但 Lightricks 面临着重大挑战。与行业重量级人物竞争土坯和欧特克拥有雄厚的财力和成熟的用户基础,这并不容易。例如,Adobe 已经将生成式人工智能集成到其产品中。创意云套件,使其在专业用户中具有天然的优势。
法布曼承认存在风险,但相信开源创新是小型企业唯一可行的前进道路。“如果你想作为一家初创公司获得与巨头竞争的机会,你需要确保技术是开放的并被学术界和更广泛的社区采用,”他说。
为什么开源能够赢得人工智能视频生成竞赛
LTXV 的发布也凸显了人工智能行业中开源和专有方法之间日益紧张的关系。虽然封闭模型为公司提供了更严格的控制和货币化机会,但它们可能会疏远无法使用尖端工具的开发人员和研究人员。
“目前正在发生的部分情况是,扩散模型正在成为计算机图形学中经典处理方式的替代范式,”法布曼解释道。– 但如果您确实想要构建替代方案,API 绝对不够。您需要为人们(学术界、工业界、爱好者)提供模型,供他们修改并创造令人惊叹的新想法。
Lightricks 计划在两者上发布 LTXVGitHub和抱脸,具有初始“社区预览”阶段,以便进行测试和反馈。该模型最终将在OpenRAIL 许可证,确保衍生品对学术和商业用途保持开放。
对于 Lightricks 来说,赌注很高。该公司不仅押注于 LTXV 的成功,还押注于开放式人工智能模型在日益由封闭生态系统主导的领域得到更广泛的采用。
“开放模式的未来是光明的,”法布曼自信地说。
这一愿景能否实现还有待观察。但通过免费提供最先进的技术,Lightricks 发出了一个明确的信息:在定义人工智能视频未来的竞赛中,开放性和协作可能是最终的竞争优势。