Meta Llama:关于开放生成式 AI 模型您需要了解的一切 - TechCrunch

2024-09-08 15:00:00 英文原文

像当今每家大型科技公司一样,Meta 拥有自己的旗舰生成式人工智能模型,称为 Llama。Llama 在主要模型中有些独特,因为它是开放的,这意味着开发人员可以随心所欲地下载和使用它(有一定的限制)。这与 Anthropics Claude、OpenAIs GPT-4o(为 ChatGPT 提供支持)和 Google Gemini 等模型形成鲜明对比,这些模型只能通过 API 访问。

不过,为了给开发者提供选择,Meta 还与 AWS、Google Cloud 和 Microsoft Azure 等供应商合作,推出 Llama 的云托管版本。此外,该公司还发布了旨在更轻松地微调和自定义模型的工具。

以下是您需要了解的有关 Llama 的所有信息,从其功能和版本到使用地点。随着 Meta 发布升级并引入新的开发工具来支持模型的使用,我们将继续更新这篇文章。

什么是 Llama?

Llama 是一系列模型,而不仅仅是一个模型:

Llama 是一系列模型,而不仅仅是一个模型:

什么是 Llama?p>
  • Llama 8B
  • Llama 70B
  • Llama 405B

最新版本为Llama 3.1 8B、Llama 3.1 70B以及 2024 年 7 月发布的 Llama 3.1 405B。它们接受了各种语言的网页、网络上的公共代码和文件以及合成数据(即其他人工智能模型生成的数据)的训练。

所有 Llama 模型都有 128,000 个令牌上下文窗口。(在数据科学中,标记是原始数据的细分位,例如“fantastic”一词中的音节 fan、tas 和 tic。)模型上下文或上下文窗口是指模型在生成之前考虑的输入数据(例如文本)输出(例如附加文本)。长上下文可以防止模型忘记最近文档和数据的内容,以及偏离主题和错误推断。

加入 10,000 家初创公司

摘要

与当今所有大型科技公司一样,Meta 拥有自己的旗舰生成式人工智能模型,称为 Llama。它们在各种语言的网页、网络上的公共代码和文件以及合成数据(即其他 AI 模型生成的数据)上进行训练。Llama 3.1 8B 和 Llama 3.1 70B 是小型紧凑模型,旨在在设备上运行从笔记本电脑到服务器。其中一些合作伙伴在 Llama 之上构建了额外的工具和服务,包括让模型引用专有数据并使其能够以较低延迟运行的工具。Meta 为 Llama 提供哪些工具? 除了 Llama 之外,Meta 还提供了旨在使模型更安全地使用的工具:Llama Guard,一种审核框架Prompt Guard,一种防止即时注入攻击的工具 Cyber​​SecEval,一种网络安全风险评估套件 Llama Guard 试图检测潜在的潜在威胁Llama 模型输入或生成的有问题的内容,包括与犯罪活动、剥削儿童、侵犯版权、仇恨、自残和性虐待有关的内容。那是因为 Llama 可能喜欢它的生成式人工智能同行产生有缺陷或不安全的代码。