作者:Anna Heim
人工智能可以让任何人创建视频,但许多人工智能视频创作工具缺乏对音频的支持。米雷洛正在构建人工智能,添加配乐以匹配视频的动作。
今年早些时候,这家位于柏林的初创公司发布了 Mirelo SFX v1.5,这是一种人工智能模型,可以解释视频以添加同步音效 (SFX)。
这引起了准备投资的风险投资公司的关注游戏中的生成式人工智能革命。据 TechCrunch 独家获悉,这家成立两年的德国初创公司已筹集了由 Index Ventures 和 Andreessen Horowitz 领投的 4100 万美元种子轮融资。
这笔新资金将帮助 Mirelo 在其新兴类别中更有效地竞争。当它仍处于隐身模式且资源有限时,索尼和腾讯等大公司发布了视频到 SFX 的模式。快手旗下的 Kling AI 也是如此,它来自中国,十一实验室,这也得到了 a16z 的支持。
虽然 Mirelo 的关注范围较窄,但从长远来看,要击败这些模式需要初创公司增加员工。Mirelo 首席执行官兼联合创始人 CJ Simon-Gabriel 告诉 TechCrunch,总的来说,这家初创公司预计到明年年底,其 10 人团队的员工人数将“增加一倍,甚至三倍”。
这些新员工将支持 Mirelo 的研发、产品和上市战略。该初创公司发布了其模型法尔艾和复制Simon-Gabriel 表示,预计 API 的使用将在短期内推动其大部分收入。但该公司还投资为创作者打造工作空间 Mirelo Studio,最终可以支持全面的专业用途。
随着 Mirelo 准备扩大规模,这家初创公司及其投资者也预计到对训练数据的担忧,这种担忧一直困扰着其他生成型人工智能公司。据领导 Index 投资的乔治亚·史蒂文森 (Georgia Stevenson) 介绍,Mirelo 的模型基于公共和购买的声音库,并且正在签署尊重艺术家权利的收入共享合作伙伴关系。
这是生成式人工智能工具固有的张力,但 Mirelo 并没有取代音乐家和声音设计师——至少目前还没有。该初创公司采用免费增值模式,包括针对创作者的推荐计划,价格为每月 20 欧元(约合 23.50 美元),主要针对希望取消人工智能生成视频静音的业余爱好者和专业消费者。
Simon-Gabriel 表示,如果没有音频,创作者就无法充分受益于这一新潜力。
— 乔治·卢卡斯说过,声音占观影体验的 50%。这并不夸张,”他说。——如果有什么不同的话,那就是这是一种轻描淡写的说法。您可以拍摄完全相同的图像,而声音会塑造出完全不同的氛围,具体取决于您放入的声音和音乐。
他和他的联合创始人 Florian Wenzel 本身都是人工智能研究人员和音乐家,这家初创公司将人工智能音乐生成列入了其路线图。但西蒙-加布里埃尔表示,米雷洛看到了音效的吸引力更大,部分原因是与其他人工智能领域相比,相关研究较少。
“在这里建造一条真正的护城河,然后利用它会更容易,”他指出。
这可能会给米雷洛带来回报。Simon-Gabriel 拒绝透露其新估值,但表示与之前未披露的种子轮前相比,其估值已“非常显着”增长。前一轮融资由总部位于柏林的 Atlantic 公司领投,该公司也参与了新一轮融资,使 Mirelo 的融资总额达到 4400 万美元,并帮助缩小了资源缺口。
该初创公司还得到了天使投资人的支持,他们为其技术提供了可信度,并可能打开新的大门,包括 Mistral 首席执行官 Arthur Mensch、Hugging Face 首席科学官 Thomas Wolf、Fal.ai 联合创始人 Burkay Gur 等。
尽管如此,该团队意识到人工智能生成的视频可能不会持续太久。
例如,Gemini 的视频生成器现在包含由 DeepMind 的 Veo 3.1 视频到音频模型提供支持的配乐。但如果说有什么不同的话,西蒙-加布里埃尔听起来是正确的。– 现在,人们突然意识到,“哦,也许我们应该添加声音。”但是,当然,您应该添加一些声音。这有点像无声电影与有声电影,对吧?它确实有很大的不同! –