英语轻松读发新版了,欢迎下载、更新

Meta释放Llama 4,这是一种新的旗舰AI模型|TechCrunch

2025-04-05 20:01:30 英文原文

作者:Kyle Wiggers

发布了新的AI模型集合,美洲驼4,在星期六的骆驼家族中,同样如此。总共有四个新车型:Llama 4 Scout,Llama 4 Maverick和Llama 4 Behemoth。

梅塔说,所有这些都接受了大量未标记的文本,图像和视频数据的培训,以提供广泛的视觉理解。”

中国人工智能实验室的开放模型的成功DeepSeek据报道,它的表现比Meta以前的Llama模型更好,据报道将Llama Development踢到了超速驾驶中。据说Meta有炒室,以破译DeepSeek如何降低跑步和部署模型的成本R1V3

侦察兵和小牛公开可用llama.com从Meta的合作伙伴(包括AI Dev平台拥抱面孔),庞然大物仍在训练中。梅塔(Meta)表示,梅塔(Meta AI)是WhatsApp,Messenger和Instagram在内的AI驱动助手Meta AI已被更新,以使用40个国家 /地区的Llama 4。目前,多模式功能仅限于美国的英语。

一些开发人员可能会对Llama 4许可证质疑。

用户和公司居住或在欧盟的主要营业地点是禁止使用或分发模型,可能是该地区AI和数据隐私法规定的治理要求的结果。(过去,元有谴责这些法律此外,与以前的Llama发行一样,拥有超过7亿个活跃用户的公司必须向Meta申请特殊许可,Meta可以自行决定授予或拒绝该许可。

这些Llama 4模型标志着Llama生态系统的新时代的开始,写在博客文章中。这只是Llama 4系列的开始。

Meta Llama 4
图片来源:

梅塔(Meta)说,美洲驼4是其第一个使用专家(MOE)体系结构混合使用的模型,这对于培训和回答查询更有效。MOE架构基本上将数据处理任务分解为子任务,然后将它们委派给较小的专业模型。 

例如,小牛的总参数为4000亿,但只有170亿积极的跨128个专家的参数。(参数大致对应于模型解决问题的技能。)Scout具有170亿个活动参数,16个专家和10090亿个总参数。

根据Meta的内部测试,该公司表示,Maverick最适合普通助理和聊天案例,例如创意写作,超过了Openai的模型GPT-4O和Google双子座2.0在某些编码,推理,多语言,长篇文章和图像基准上。但是,Maverick并没有达到较强的近期模型,例如Google的模型双子座2.5 Pro,人类克劳德3.7十四行诗和OpenaiGPT-4.5。Scout的优势在于文件摘要和大型代码库中的推理等任务。

独特的是,它具有很大的上下文窗口:1000万个令牌。(tokens代表原始文本的一部分。

根据Meta的计算,侦察兵可以在单个NVIDIA H100 GPU上运行,而Maverick则需要NVIDIA H100 DGX系统或同等系统。

元未发行的庞然大物甚至需要更加强大的硬件。据该公司称,庞然大物拥有2880亿个活跃参数,16个专家和近2万亿个参数。Meta的内部基准测试的表现优于GPT-4.5,Claude 3.7十四行诗和Gemini 2.0 Pro(但不是2.5 Pro),这些评估衡量了诸如数学问题解决的STEM技能。

值得一提O1O3米尼。推理模型事实检查他们的答案,并通常更可靠地对问题的回答,但因此,提供答案的模型要比传统的非争议模型更长。

Meta Llama 4
图片来源:

有趣的是,梅塔(Meta)表示,它调整了所有骆驼4型模型,以拒绝回答“争议性问题”的频率。据该公司称,美洲驼4对辩论的政治和社会话题做出了回应,即以前的拉玛模型不会。此外,该公司表示,Llama 4的平衡更加平衡,这促使其不合时宜。

一位元发言人告诉TechCrunch,[y] ou可以指望[lllama 4]提供有益的,事实的回应。[w]继续使骆驼更加响应,以便回答更多的问题,可以回答各种不同的观点[â€],并且不支持其他观点。

这些调整是在一些白宫盟友指责AI聊天机器人太政治上醒来的。”

唐纳德·特朗普总统的许多亲密知己,包括亿万富翁埃隆·马斯克,加密货币和艾萨·戴维·萨克斯,都声称流行的AI Chatbots。 审查保守派观点。麻袋历史上有 挑出来openai的chatgpt被编程为对政治主题的唤醒和不真实。

实际上,AI的偏见是一个棘手的技术问题。马斯克自己的AI公司Xai拥有 挣扎``创建一个聊天机器人,它不认可其他政治观点。

这没有阻止包括Openai在内的公司调整他们的AI模型回答比以前更多的问题,特别是与有争议的主题有关的问题。

Kyle Wiggers是TechCrunch的AI编辑。他的写作出现在VentureBeat和数字趋势中,以及一系列小工具博客,包括Android警察,Android Authority,Droid-Life和XDA-Developers。他与他的伴侣,音乐治疗师一起住在曼哈顿。

关于《Meta释放Llama 4,这是一种新的旗舰AI模型|TechCrunch》的评论


暂无评论

发表评论

摘要

Meta发布了Llama 4,这是其AI模型家族的最新成员,其中包括三种型号:Llama 4 Scout,Maverick和Mememoth。这些经过大量未标记的数据培训,以进行广泛的视觉理解。该新闻稿是在中国实验室DeepSeek开放模型的竞争之后。虽然侦察兵和小牛公开可用,但庞然大物仍在接受培训。现在,Meta的AI助理跨应用程序使用了40个国家 /地区的Llama 4,但是在新许可规则下,目前在美国欧盟用户和公司的多模式功能有限。根据内部测试,Maverick在特定基准上胜过一些诸如GPT-4O之类的型号,但却差不多,却没有Claude 3.7十四行诗和GPT-4.5等其他模型。Scout在文档摘要中擅长并使用大量上下文窗口处理大型文档。META声称与前任相比,Llama 4对有争议的问题提供了更平衡的回答。元有