本杰明·富兰克林曾经写道,除了死亡和税收之外,没有什么是确定的。让我修改一下这句话,以反映当前的人工智能淘金热:除了死亡、税收和新的人工智能模型,没有什么是确定的,而这三者中的最后一个的到来速度不断加快。
本周早些时候,谷歌发布了升级版的 Gemini 模型,本月早些时候,OpenAI 发布了其 o1 模型。但周三,轮到 Metas 在门洛帕克举行的公司年度 Meta Connect 2024 开发者大会上推出了最新产品。
Metas 多语言 Llama 系列模型已达到版本 3.2,与 3.1 相比有所提升,这意味着一些 Llama 模型现在是多模式的。Llama 3.2 11B 是一个紧凑模型,而 90B 是一个更大、功能更强大的模型,可以解释图表和图形、为图像添加标题,并在给出简单描述的情况下精确定位图片中的对象。
给定一张公园地图,例如,Llama 3.2 11B 和 90B 可能能够回答这样的问题:地形什么时候会变得更陡?这条路径的距离是多少?或者,提供显示公司一年内收入的图表,这些模型可以快速突出表现最好的月份。
对于希望将模型严格用于文本应用程序的开发人员,Meta 表示 Llama 3.2 11B 和 90B 被设计为 3.1 的直接替代品。11B 和 90B 可以在使用或不使用新的安全工具 Llama Guard Vision 的情况下进行部署,该工具旨在检测输入到模型或由模型生成的潜在有害(即有偏见或有毒)的文本和图像。
在大多数情况下在世界范围内,多模式 Llama 模型可以在多种云平台上下载和使用,包括 Hugging Face、Microsoft Azure、Google Cloud 和 AWS。Metas 还在 Llama 官方网站 Llama.com 上托管它们,并使用它们在 WhatsApp、Instagram 和 Facebook 上为其 AI 助手 Meta AI 提供支持。
但无法访问 Llama 3.2 11B 和 90B在欧洲。因此,欧洲用户无法使用其他地方可用的一些 Meta AI 功能,例如图像分析。Meta 再次指责集团监管环境的不可预测性。
了解如何从 AWS 优化生成式 AI 部署