2024 年 9 月 25 日:本文已更新,以反映 Llama 3.2 的普遍可用性,该 Llama 3.2 来自 Metathe 公司最新、最先进的多语言大语言模型 (LLM) 集合,在 Amazon Bedrock 和 Amazon SageMaker 中以及通过 Amazon Elastic使用 AWS Trainium 和 Inferentia 的计算云 (Amazon EC2)。
技术公司 Meta 的下一代 Llama 模型(包括其首款多模式模型)现已在 Amazon Web Services (AWS) 的 Amazon Bedrock 和 Amazon SageMaker 上提供。还可以通过使用 AWS Trainium 和 Inferentia 的 Amazon Elastic Compute Cloud (Amazon EC2) 获取它们。
Llama 3.2 系列建立在先前 Llama 模型成功的基础上,提供新的、更新的和高度差异化的模型,包括支持图像推理的中小型视觉 LLM 以及针对设备上优化的轻量级纯文本模型用例。新车型的设计更加便捷和高效,重点关注负责任的创新和安全。Llama Guard 3 Vision 针对内容安全分类进行了微调,现已在 Amazon SageMaker JumpStart 中提供。以下是亮点:
Metas 首款多模态视觉模型,Llama 3.2 11B Vision 和 Llama 3.2 90B Vision
Llama 3.2 1B 和 Llama 3.2 3B,针对边缘和移动设备进行了优化
Llama Guard 3 11B Vision:针对内容安全分类进行微调
据 Meta 称,Llama 3.2 模型已在 150 多个基准数据集上进行了评估,展示了与领先基础模型的竞争性能。与 Llama 3.1 类似,所有模型都支持 128K 上下文长度和跨八种语言的多语言对话用例,涵盖英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语。
访问 AWS 新闻博客,了解有关 Llama 3.2 的更多信息,并详细了解 Llama 模型 Metas 集合的现有功能(Llama 3.2 构建于该模型之上),以及 AWS 客户如何使用 Llama 模型。
2024 年 7 月 23 日
Llama 3.1 模型是经过预训练和指令微调的大型语言模型 (LLM) 的集合,大小为 8B、70B 和 405B,支持广泛的用例。它们特别适合开发人员、研究人员和企业用于文本摘要和分类、情感分析、语言翻译和代码生成。
根据 Meta 的说法,Llama 3.1 405B 是最好、最大的公开基础模型 (FM) 之一,为生成式 AI 功能设定了新标准。它特别适合合成数据生成和模型蒸馏,从而在训练后改进较小的 Llama 模型。这些模型还提供常识、数学、工具使用和多语言翻译方面最先进的功能。
由于训练数据和规模的大幅增加,所有新的 Llama 3.1 模型都比以前的版本有了显着改进。这些模型支持 128K 上下文长度,比 Llama 3 增加了 120K 个令牌。这意味着 Llama 3 模型的容量是 Llama 3 模型的 16 倍,并改进了八种语言的多语言对话用例的推理:英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语。
其他改进包括增强对语言细微差别的掌握,这意味着 Llama 3.1 显示出改进的上下文理解,并且可以更有效地处理复杂性。这些模型还可以从冗长的文本段落中获取更多信息,以做出更明智的决策,并利用更丰富的上下文数据来生成更微妙和精致的响应。
“我们与 Meta 有着长期的合作关系,很高兴今天能够向 AWS 客户提供他们最先进的模型,”AWS 首席执行官马特·加曼 (Matt Garman) 说道。“客户喜欢针对其个人用例定制和优化 Llama 模型的能力,现在 AWS 上提供了 Llama 3.1,客户可以使用最新的最先进的模型来负责任地构建 AI 应用程序。
在过去的十年中,Meta 一直致力于将工具交到开发人员手中,并促进开发人员、研究人员和组织之间的协作和进步。Llama 模型提供多种参数大小,使开发人员能够选择最适合其需求和推理预算的模型。AWS 上的 Llama 模型开辟了一个充满可能性的世界,因为开发人员无需担心可扩展性或管理基础设施。AWS 提供了一种简单的统包方式来开始使用 Llama。
Meta 创始人兼首席执行官马克·扎克伯格 (Mark Zuckerberg) 表示,开源是将人工智能的好处带给每个人的关键。我们一直在与 AWS 合作,将整个 Llama 3.1 模型集合集成到 Amazon SageMaker JumpStart 和 Amazon Bedrock 中,以便开发人员可以使用 AWS 的全面功能来构建出色的东西,例如可以处理复杂任务的复杂代理。