像当今每家大型科技公司一样,Meta 拥有自己的旗舰生成式人工智能模型,称为 Llama。Llama 在主要模型中有些独特,因为它是开放的,这意味着开发人员可以随心所欲地下载和使用它(有一定的限制)。这与 Anthropics Claude、OpenAIs GPT-4o(为 ChatGPT 提供支持)和 Google Gemini 等模型形成鲜明对比,这些模型只能通过 API 访问。
不过,为了给开发者提供选择,Meta 还与 AWS、Google Cloud 和 Microsoft Azure 等供应商合作,推出 Llama 的云托管版本。此外,该公司还发布了旨在更轻松地微调和自定义模型的工具。
以下是您需要了解的有关 Llama 的所有信息,从其功能和版本到使用地点。随着 Meta 发布升级并引入新的开发工具来支持模型的使用,我们将继续更新这篇文章。
Llama 是一系列模型,而不仅仅是一个模型:
最新版本为Llama 3.1 8B、Llama 3.1 70B以及 2024 年 7 月发布的 Llama 3.1 405B。它们接受了各种语言的网页、网络上的公共代码和文件以及合成数据(即其他人工智能模型生成的数据)的训练。
所有 Llama 模型都有 128,000 个令牌上下文窗口。(在数据科学中,标记是原始数据的细分位,例如“fantastic”一词中的音节 fan、tas 和 tic。)模型上下文或上下文窗口是指模型在生成之前考虑的输入数据(例如文本)输出(例如附加文本)。长上下文可以防止模型忘记最近文档和数据的内容,以及偏离主题和错误推断。
加入 10,000 家初创公司