小型初创公司 Arcee AI 从零开始构建了 400B 参数的开源 LLM 到最好的 Meta's Llama |TechCrunch
作者:Julie Bort
许多业内人士思考人工智能模型市场的赢家已经决定:大型科技公司将拥有它(谷歌、Meta、微软、亚马逊的一部分)以及他们选择的模型制造商,主要是 OpenAI 和 Anthropic。
但只有 30 人的小型初创公司阿尔西人工智能不同意。该公司刚刚发布了一个真正永久开放(Apache 许可)的通用基础模型,名为 Trinity,Arcee 声称,在 400B 参数下,它是美国公司有史以来训练和发布的最大的开源基础模型之一。
Arcee 表示,根据使用基础模型(很少经过后期训练)进行的基准测试,Trinity 与 Meta 的 Llama 4 Maverick 400B 和 Z.ai 的 GLM-4.5(中国清华大学的高性能开源模型)进行了比较。

与其他最先进的 (SOTA) 模型一样,Trinity 适合编码和代理等多步骤过程。尽管如此,尽管它的规模很大,但它还不是真正的 SOTA 竞争对手,因为它目前仅支持文本。
更多模式正在开发中,首席技术官卢卡斯·阿特金斯 (Lucas Atkins) 告诉 TechCrunch(如上图左侧),目前正在开发视觉模型,并且正在制定路线图上的语音到文本版本。相比之下,Meta 的 Llama 4 Maverick 已经是多模式的,支持文本和图像。
但 Arcee 表示,在将更多人工智能模式添加到其名单中之前,它需要一个基础法学硕士,能够给主要目标客户(开发人员和学者)留下深刻印象。该团队特别希望吸引各种规模的美国公司不要选择中国的开放模式。
“最终,这场游戏的赢家,以及真正赢得使用的唯一方法,就是拥有最好的开放重量模型,”阿特金斯说。– 要赢得开发人员的青睐,您必须为他们提供最好的服务。 –
Techcrunch 活动
马萨诸塞州波士顿 | 2026 年 6 月 23 日
基准测试显示,Trinity 基础模型目前处于预览阶段,同时进行了更多的后期训练,该模型在很大程度上保持了自己的状态,并且在某些情况下,在编码和数学、常识、知识和推理测试方面略微优于 Llama。
Arcee 迄今为止在成为具有竞争力的人工智能实验室方面取得的进展令人印象深刻。大三位一体模型如下之前的两个小模型12 月发布:26B 参数 Trinity Mini,一个完全经过训练的推理模型,适用于从网络应用程序到代理等任务,以及 6B 参数 Trinity Nano,一个实验模型,旨在突破微小而健谈的模型的界限。
更精彩的是,Arcee 使用 2,048 个 Nvidia Blackwell B300 GPU 在六个月内花费了 2,000 万美元对他们进行了培训。创始人兼首席执行官马克·麦克奎德(上图右)表示,这是该公司迄今为止筹集的约 5000 万美元中的一部分。
负责模型构建工作的阿特金斯说,这种现金“对我们来说很多”。不过,他承认,与目前大型实验室的支出相比,这显得相形见绌。
阿特金斯说,六个月的时间表是经过精心计算的。他在获得法学硕士学位之前的职业生涯涉及开发汽车语音代理。– 我们是一家年轻的初创公司 – 非常渴望。我们拥有大量的人才和聪明的年轻研究人员,当他们有机会花这么多钱并训练如此规模的模型时,我们相信他们能够应对这种情况。他们确实做到了,经历了许多不眠之夜,许多漫长的时间。”
McQuade 曾是开源模型市场 Hugging Face 的早期员工,他表示 Arcee 一开始并不想成为一个新的美国人工智能实验室:该公司最初是为 SK Telecom 等大型企业客户进行模型定制。
– 我们只是进行后期培训。所以我们会借鉴其他人的伟大成果:我们会采用 Llama 模型,我们会采用 Mistral 模型,我们会采用开源的 Qwen 模型,我们会对它进行后期训练以使其更好——适合公司的预期用途,他说,包括进行强化学习。
但阿特金斯说,随着他们的客户名单不断增加,对自己的模式的需求正在变得必要,而麦奎德担心依赖其他公司。与此同时,许多最好的开放模式都来自中国,美国企业对此持怀疑态度,或被禁止使用。
这是一个令人伤脑筋的决定。“我认为世界上只有不到 20 家公司曾经预训练并发布过自己的模型,达到了 Arcee 所追求的规模和水平,”McQuade 说。
该公司一开始规模很小,尝试与培训公司 DatologyAI 合作创建一个微型 4.5B 模型。该项目的成功随后鼓励了更大的努力。
但如果美国已经有了 Llama,为什么还需要另一个开放重量模型呢?阿特金斯表示,通过选择开源 Apache 许可证,该初创公司致力于始终保持其模型的开放性。继去年 Meta 首席执行官马克·扎克伯格之后表示他的公司可能并不总是使其所有最先进的模型开源。
“Llama 可以被视为不是真正的开源,因为它使用带有商业和使用警告的 Meta 控制许可证,”他说。这造成了一些开源组织声称Llama 根本不符合开源标准。
“Arcee 的存在是因为美国需要一个永久开放、获得 Apache 许可的前沿级替代方案,能够真正在当今的前沿领域进行竞争,”McQuade 说。
所有 Trinity 模型,无论大小,都可以免费下载。最大的版本将推出三种版本。Trinity Large Preview 是一个经过轻微训练的指令模型,这意味着它经过训练可以遵循人类指令,而不仅仅是预测下一个单词,这使其适合一般聊天用途。Trinity Large Base 是未经后期训练的基础模型。
然后我们有 TrueBase,一个包含任何指导数据或后期培训的模型,因此想要定制它的企业或研究人员无需展开任何数据、规则或假设。
Arcee AI 最终将提供其通用发布模型的托管版本,据称其 API 定价具有竞争力。随着这家初创公司继续改进模型的推理训练,该发布还有六周的时间。
Trinity Mini 的 API 定价为 0.045 美元/0.15 美元,并且还提供有速率限制的免费套餐。同时,该公司仍然销售培训后和定制选项。