2024-10-01 22:58:23 · 英文原文

Nvidia 刚刚投下重磅炸弹：其新的 AI 模型是开放的、大规模的，并准备好与 GPT-4 竞争 - VentureBeat

加入我们的每日和每周时事通讯，了解有关行业领先人工智能报道的最新更新和独家内容。了解更多

Nvidia 发布了强大的开源人工智能模型，可与 OpenAI 和 Google 等行业领导者的专有系统竞争。

该公司全新的 NVLM 1.0 系列大型多模态语言以 720 亿参数 NVLM-D-72B 为主导的模型在视觉和语言任务中展现了卓越的性能，同时还增强了纯文本功能。

我们推出 NVLM 1.0，这是一系列前沿级多模态大型模型研究人员在论文中解释说，这些语言模型在视觉语言任务上取得了最先进的结果，可与领先的专有模型（例如 GPT-4o）和开放访问模型相媲美。

通过公开模型权重并承诺发布训练代码，Nvidia 打破了先进人工智能系统封闭的趋势。这一决定使研究人员和开发人员能够前所未有地接触尖端技术。

NVLM-D-72B：视觉和文本任务的多才多艺的执行者

NVLM-D-72B 模型显示在处理复杂的视觉和文本输入方面具有令人印象深刻的适应性。研究人员提供的示例强调了模型逐步解释模因、分析图像和解决数学问题的能力。

值得注意的是，NVLM-D-72B 在多模式训练后提高了其在纯文本任务上的性能。虽然许多类似模型的文本性能有所下降，但 NVLM-D-72B 在关键文本基准测试中的准确度平均提高了 4.3 个点。

我们的 NVLM-D-1.0-72B 与其相比有了显着改进研究人员指出，他们的方法的一个关键优势是纯文本数学和编码基准上的文本主干。

人工智能研究人员对 Nvidia 的开源计划做出了回应

人工智能社区已经对此次发布反应积极。一位人工智能研究人员在社交媒体上评论时观察到，哇！Nvidia 刚刚发布了一个 72B 模型，在数学和编码评估方面与 llama 3.1 405B 相当，而且还具有远见？

Nvidia 决定公开提供如此强大的模型，可以加速整个人工智能领域的研究和开发场地。通过提供与资金雄厚的科技公司的专有系统相媲美的模型，Nvidia 可以使较小的组织和独立研究人员为人工智能的进步做出更大的贡献。

NVLM 项目还引入了创新的架构设计，包括结合了不同多模态处理技术的混合方法。这一发展可能会影响该领域未来的研究方向。

NVLM 1.0：开源人工智能开发的新篇章

Nvidia 发布的 NVLM 1.0 标志着人工智能的关键时刻发展。通过开源与专有巨头竞争的模型，Nvidia 不仅仅是共享代码，而且挑战了人工智能行业的结构。

此举可能会引发连锁反应。其他科技领导者可能会感受到开放研究的压力，这可能会全面加速人工智能的进步。它还提供了公平的竞争环境，允许较小的团队和研究人员使用曾经为科技巨头保留的工具进行创新。

但是，NVLM 1.0 的发布并非没有风险。随着强大的人工智能变得越来越容易获得，对滥用和道德影响的担忧可能会增加。人工智能社区现在面临着促进创新的复杂任务，同时建立负责任使用的护栏。

Nvidia 的决定也引发了人们对人工智能商业模式未来的质疑。如果最先进的模型可以免费获得，公司可能需要重新思考如何在人工智能领域创造价值并保持竞争优势。

NVLM 1.0 的真正影响将在未来几个月和几年内显现出来。它可能会迎来人工智能领域前所未有的协作和创新时代。或者，它可能会迫使人们对广泛使用的先进人工智能所带来的意想不到的后果进行清算。

有一件事是肯定的：Nvidia 已经向人工智能行业开了一枪。现在的问题不是格局是否会发生变化，而是变化的剧烈程度以及谁能够足够快地适应，以便在这个开放人工智能的新世界中蓬勃发展。

关于《Nvidia 刚刚投下重磅炸弹：其新的 AI 模型是开放的、大规模的，并准备好与 GPT-4 竞争 - VentureBeat》的评论

暂无评论

发表评论

摘要

加入我们的每日和每周时事通讯，了解有关行业领先人工智能报道的最新更新和独家内容。该公司新的 NVLM 1.0 系列大型多模态语言模型以 720 亿个参数 NVLM-D-72B 为主导，在视觉和语言任务中展示了卓越的性能，同时还增强了纯文本功能。通过公开模型权重并承诺发布训练代码，Nvidia 打破了先进人工智能系统封闭的趋势。如果最先进的模型可以免费获得，公司可能需要重新思考如何在人工智能领域创造价值并保持竞争优势。NVLM 1.0 的真正影响将在未来几个月和几年内显现。它可能会迎来人工智能领域前所未有的协作和创新时代。

OC