Meta 在 Meta Connect 2024 上采取了一些重大的人工智能举措 - ZDNet

2024-09-26 08:56:00 英文原文

Meta 在 Meta Connect 2024 上采取了一些重大的人工智能举措

马克·扎克伯格 (Mark Zuckerberg) 在 Meta Connect 2024 上登台,并在 VR/AR 和人工智能类别中表现强劲。这些技术有很多混合,特别是在 ZDNET 其他地方讨论的 Meta 眼镜系列中。

此外:Meta Connect 2024 上宣布的所有产品:299 美元的 Quest 3S、Orion AR 眼镜等等

不过,在本文中,我们将深入探讨与该公司的人工智能工作相关的几项强大且令人印象深刻的公告。

多模态大型语言模型

扎克伯格宣布推出 Llama3.2,增加了多式联运功能。特别是,该模型可以理解图像。

他将 Meta 的 Llama 3.2 大语言模型与其他大语言模型进行了比较,表示 Meta“在这一类别中脱颖而出,不仅提供最先进的模型,还提供对这些模型是免费的,并且可以轻松集成到我们不同的产品和应用程序中。”

此外:Meta 正在向开源 AI 迈进

Meta AI 是 Meta 的 AI 助手,现在基于 Llama3.2.扎克伯格表示,Meta 有望成为全球使用最广泛的人工智能助手,每月拥有近 5 亿活跃用户。

为了展示该模型对图像的理解,扎克伯格使用该公司的图像在移动设备上打开了一张图像- 编辑能力。Meta AI 能够更改图像、将衬衫改为扎染或添加头盔,所有这些都可以响应简单的文本提示。

Meta AI 带语音

Meta 的 AI 助手现在可以在 Meta 的应用程序中与您进行语音对话。我一直在 ChatGPT 中使用类似的功能,发现当两个或更多人需要听到问题的答案时它很有用。

扎克伯格声称人工智能语音交互将比文本聊天机器人更强大,我同意——但有一点需要注意。进行语音交互必须很容易。例如,要问 Alexa 问题,您只需对着房间说话即可。但要在 iPhone 上向 ChatGPT 提问,您必须解锁手机,进入 ChatGPT 应用程序,然后启用该功能。

此外:人工智能语音生成器:它们可以做什么以及如何工作

在 Meta 拥有能够自然聆听语音的设备之前,我担心即使是最强大的语音助手也会受到不便的限制。

您还可以为您的 AI 助手提供名人的声音。从约翰·塞纳、朱迪·丹奇、克里斯汀·贝尔、科甘-迈克尔·凯和奥卡菲娜中选择。自然语音对话将在 Instagram、WhatsApp 和 Messenger Facebook 中提供,并于今天推出。<​​/p>

Meta AI Studio

接下来是 Meta 为其 AI Studio 聊天机器人添加的一些功能创作工具。AI Studio 可让您创建角色(基于您兴趣的 AI 或“您的延伸”的 AI)。从本质上讲,您可以创建一个反映您对话风格的聊天机器人。

但现在 Meta 正在深入研究恐怖谷 Deepfakes 领域。

AI Studio 在此公告之前包含一段文本基于接口。但 Meta 正在发布一个“更自然、更具体、更互动”的版本。当谈到“体现”时,他们不是在开玩笑。

在演示中,扎克伯格与以创建者唐·艾伦·史蒂文森三世为模型的聊天机器人进行了交互。这种互动似乎是史蒂文森的“现场”视频,完整且完全跟踪头部运动和嘴唇动画。基本上,他可以向机器人唐提出一个问题,而看起来就像是真人在回答。

另外:苹果、谷歌和微软如何帮助我们免受人工智能深度造假的影响

功能强大,怪异的,令人不安的。另外,利用其他人的面部创建恶意聊天机器人的可能性似乎是明显的。

人工智能翻译

Meta 似乎将人工口型同步和面部动作捆绑在一起。他们已经达到了可以让真人的脸部移动并说出生成的单词的程度。

Meta 已将这种功能扩展到翻译领域。他们现在在 Reels 上提供英语和西班牙语的自动视频配音。该功能意味着您可以用西班牙语录制 Reel,社交媒体将以英语播放它 - 而且看起来就像您在说英语。或者,您可以用英语录制,然后以西班牙语播放,就像您在说西班牙语一样。

在上面的示例中,创作者 Ivan Acua 用西班牙语说话,但配音却以英语返回。与前面的示例一样,该视频近乎完美,看起来 Acua 最初是用英语录制的。

Llama 3.2

扎克伯格再次深入了解 Llama 3.2 模型。他表示,该模型的多模态性质大大增加了参数数量。

该公告的另一个有趣部分是针对在设备上工作而优化的更小的 1B 和 3B 模型。这项工作将使开发人员能够为自定义应用程序创建更安全、更专业的模型,这些模型就存在于应用程序中。

此外:自 ChatGPT 令人惊叹的首次亮相以来,我已经测试了数十个人工智能聊天机器人。这是我的首选

这两个模型都是开源的,扎克伯格宣扬 Llama 正在成为“人工智能行业的 Linux”。

最后,还有更多Meta 的 AI 眼镜宣布了 AI 功能。我们还有另一篇文章详细介绍了这些功能。

您可以在社交媒体上关注我的日常项目更新。请务必订阅我的每周更新时事通讯,并在 Twitter/X 上关注我:@DavidGewirtz、Facebook 上:Facebook.com/DavidGewirtz、Instagram 上:Instagram.com/DavidGewirtz 和 YouTube 上:YouTube.com/DavidGewirtzTV。

关于《Meta 在 Meta Connect 2024 上采取了一些重大的人工智能举措 - ZDNet》
暂无评论

摘要

Meta 在 Meta Connect 2024 上人工智能大放异彩马克·扎克伯格在 Meta Connect 2024 上登台,并在 VR/AR 和人工智能类别中表现强劲。这些技术有很多混合,特别是在 ZDNET 上其他地方讨论的 Meta 眼镜系列中。另外:Meta Connect 2024 上宣布的所有产品:299 美元的 Quest 3S、Orion AR 眼镜等。不过,在本文中,我们将深入探讨几个与公司人工智能工作相关的强有力且令人印象深刻的公告。扎克伯格声称人工智能语音交互将比文本聊天机器人更强大,我同意这一点——但有一点需要注意。本质上,您可以创建一个反映您对话风格的聊天机器人。该功能意味着您可以用西班牙语录制 Reel,社交媒体将以英语播放它 - 而且看起来就像您在说英语。