作者:by Maria Deutscher
Meta Platforms Inc.发布了两种人工智能模型,可用于生成运动动画和视频水印。
Motivo 和 Video Seal 算法于周四推出。Facebook 母公司还推出了两种内部开发的神经网络架构。其中一项名为 LCM 的技术被誉为构建大型语言模型的新方法。
Motivo 是 Meta 发布的第一个人工智能模型,可用于为虚拟现实应用中常见的三维化身制作动画。该模型根据用户提供的描述呈现化身运动。它还可以改变头像的姿势:例如,用户可以指示 Motivo 让头像站立起来,反之亦然。
该模型会自动使动画适应配置更改。例如,如果用户向安装化身的虚拟环境添加风,它可以修改化身的移动方式。
通常,以渲染为重点的人工智能模型必须针对它们用来生成的每种特定类型的运动进行优化。这种微调需要大量资源。Meta 表示,Motivo 不需要此类微调,但可以提供与优化渲染特定运动的算法类似的输出质量。
该模型的主要创新在于它摄取数据的方式。Motivo 将有关动作和化身当前状态的信息编码到单个潜在空间中,这是人工智能模型用来存储其知识的数学结构。潜在空间还包含用于指导人工智能训练过程的奖励和数据点。
Meta 是虚拟现实耳机市场的主要参与者之一。该公司相信 Motivo 可以帮助提高 VR 头像和其他沉浸式内容的质量。“我们相信这项研究可以为元宇宙中完全体现的代理铺平道路,从而带来更逼真的 NPC、角色动画的民主化以及新型的沉浸式体验,”该公司的研究人员在一份报告中写道。博客文章。
Motivo 与 Video Seal 一起发布了 Motivo,Video Seal 是一种机器学习工具,用于为人工智能生成的视频添加水印。该软件创建的水印是人眼看不见的。根据 Meta 的说法,它们无法使用模糊和裁剪等常见编辑技术或压缩剪辑来删除。
该公司此前释放类似的音频文件水印工具。此前,Alphabet Inc. 的 Google DeepMind 实验室介绍一种名为 SynthID 的技术,用于识别人工智能生成的图像。与 Video Seal 一样,SynthID 会生成难以去除的隐形水印。
Meta 发布了两个新的人工智能模型以及两篇研究论文。他们描述了两种内部开发的用于创建神经网络的架构。
第一项技术是流量匹配,旨在为生成视频等多媒体内容的人工智能模型提供支持。它被定位为支持大多数视频生成算法的扩散架构的替代方案。Meta 已经在其多个面向消费者的生成人工智能工具中实现了流量匹配。
“Flow Matching 是一种最先进的生成范式,适用于多种模式,包括生成图像、视频、音频、音乐、蛋白质等 3D 结构等等,”该公司的研究人员详细介绍道。
Meta 的另一个新 AI 架构称为 LCP,是大型概念模型的缩写。它旨在为大型语言模型提供支持。
法学硕士通常一次生成一个单词片段或标记的句子。由 Meta 的 LCP 架构支持的模型采用了不同的方法。– LCM 不是预测下一个标记,而是被训练来预测下一个概念或高级想法,由完整的句子表示 – 元详细。– 总体而言,LCM 在纯粹的生成性总结任务中优于或匹配最近的法学硕士。 –
谢谢