英伟达刚刚发布了一种新的AI模型,该模型在性能上超越了OpenAI的GPT-4——没有大规模发布会,只有出色的成果。

2024-10-17 01:45:00 英文原文

作者:Michael Nuñez

Credit: VentureBeat made with Midjourney

credits: 由VentureBeat 使用Midjourney 制作

订阅我们的每日和每周通讯,获取最新更新和独家行业领先人工智能内容。了解更多


Nvidia周二低调发布了一种新的人工智能模型,其性能超过了行业领导者的同类产品。开放人工智能(OpenAI)以及Anthropic标志着该公司人工智能战略的一个重要转变,并有可能重塑该领域的竞争格局。

模型命名为Llama-3.1-涅摩tron-70B-指令版在流行的AI平台Hugging Face上低调出现,很快就因其在多个基准测试中的出色表现吸引了人们的注意。

Nvidia报告称,他们的新产品在关键评估中取得了最高分数,包括在某项评测中获得了85.0分。Arena硬基准测试,57.6 上阿尔帕卡评估 2 LC,和8.98在当天的GPT-4-Turbo MT-Bench.

这些分数超过了像OpenAI的模型这样的高质量模型的成绩GPT-4o和Anthropic的克劳德 3.5 十四行诗将英伟达推到了人工智能语言理解和生成的前沿。

NVIDIA的AI布局:从GPU巨头到语言模型先锋

此次发布标志着英伟达的一个关键时刻。该公司主要以生产图形处理单元(GPU)而闻名。请注意,原文似乎没有完整提供,这里补充了“Known primarily as the”后面可能缺少的描述部分,即“该公司主要以生产图形处理单元(GPU)而闻名”。如果需要更准确翻译,请提供完整的英文文本。图形处理单元(GPU)的主要力量该公司现在展示了其开发复杂人工智能软件的能力。这一举动标志着战略扩张,可能会改变人工智能行业的格局,对专注于大型语言模型开发的传统软件公司的主导地位构成挑战。

Nvidia创建Llama-3.1-Nemotron-70B-Instruct的方法涉及完善Meta开源的版本Llama 3.1模型使用先进的训练技术,包括基于人类反馈的强化学习(RLHF)这种方法允许人工智能从人类偏好中学习,有可能导致更加自然和符合情境的回应。

凭借其优越的性能,该模型有能力为企业提供一种比市场上一些最先进模型更强大且成本效益更高的替代方案。

该模型能够处理复杂查询,无需额外提示或专用令牌,这是它的独特之处。在一次演示中,它正确回答了“strawberry中有多少个r?”的问题,并给出了详细而准确的答案,展示了其对语言的细腻理解以及提供清晰解释的能力。

这些结果特别重要的原因是强调了“对齐”,这是人工智能研究中的一个术语,指的是模型的输出与用户的需求和偏好的匹配程度。对企业来说,这意味着更少的错误、更有帮助的响应,最终实现更好的客户满意度。

NVIDIA的新模型如何可能重塑商业和研究

对于探索人工智能解决方案的企业和组织而言,Nvidia的模型提供了一个颇具吸引力的新选择。该公司通过其平台提供了免费的托管推理服务。nvidia build官网平台,配备与OpenAI兼容的API接口。

这种易用性使得先进的AI技术更加易于获取,允许更广泛的公司试验和实施高级语言模型。

此次发布还强调了人工智能领域正在向不仅强大而且可定制的模型转变的趋势。如今,企业需要能够根据其特定需求进行调整的人工智能,无论是处理客户服务查询还是生成复杂的报告。Nvidia 的模型提供了这种灵活性,并且具有顶级性能,使其成为各行各业企业的有吸引力的选择。

然而,这种能力伴随着责任。像任何人工智能系统一样,Llama-3.1-Nemotron-70B-Instruct 并不免疫于风险。Nvidia 警告说,该模型并未针对数学或法律推理等需要高精度的专门领域进行调优。企业需要确保他们适当使用该模型,并实施防护措施以防止错误或误用。

人工智能军备竞赛升温:英伟达的大胆举措挑战科技巨头

英伟达最新模型的发布表明人工智能领域的变化速度有多快。虽然Llama-3.1-Nemotron-70B-Instruct的长期影响尚不确定,但其发布标志着在构建最先进的人工智能系统竞赛中的一个明确转折点。

通过从硬件转向高性能AI软件,英伟达迫使其他玩家重新考虑其策略并加速自身的研发。这紧随该公司推出后的举措:NVLM 1.0 家族关于多模态模型的,包括具有720亿参数的NVLM-D-72B.

这些最近的发布,特别是开源的NVLM项目,表明英伟达的人工智能野心不仅仅是竞争——它们还希望超越。挑战像GPT-4这样的专有系统的主导地位从图像解读到解决复杂问题等领域。

这些发布的快速接连推出突显了英伟达在人工智能软件开发方面的雄心壮志。通过提供与行业领导者竞争的多模态和纯文本模型,英伟达正在定位自己为一个全面的人工智能解决方案提供商,并利用其硬件专业知识创建强大且易于访问的软件工具。

Nvidia的战略似乎非常明确:它正在定位自己为全面的AI服务提供商,结合其硬件专业知识与易用且高性能的软件。这一举措可能会重塑行业格局,迫使竞争对手加快创新步伐,并可能在全行业中激发更多的开源合作。

随着开发人员测试Llama-3.1-Nemotron-70B-Instruct,我们可能会在医疗、金融、教育等各个领域看到新的应用涌现。它的成功最终将取决于是否能够将令人印象深刻的基准分数转化为实际的解决方案。

在未来几个月里,AI社区将密切关注Llama-3.1-Nemotron-70B-Instruct在基准测试之外的实际应用表现。它能否将高分转化为实际且有价值的解决方案,最终将决定其对行业和社会的长期影响。

英伟达在人工智能模型开发方面的深入研究加剧了竞争。如果这是一个新的人工智能时代的开始,那么全面集成的解决方案可能会引领未来突破的方向。

VB每日摘要

掌握最新资讯!每日将最新新闻发送至您的邮箱。

通过订阅,您同意VentureBeat的条款和条件。服务条款。

感谢订阅。了解更多请点击此处VB新闻通讯此处查看.

发生错误。

关于《英伟达刚刚发布了一种新的AI模型,该模型在性能上超越了OpenAI的GPT-4——没有大规模发布会,只有出色的成果。》的评论


暂无评论

发表评论

摘要

2024年10月16日 18:45 版权:VentureBeat 使用 Midjourney 制作 订阅我们的每日和每周通讯,获取行业领先的AI报道的最新更新和独家内容。了解更多 英伟达周二低调发布了一种新的人工智能模型,该模型在性能上超过了业内领军企业OpenAI和Anthropic的产品,标志着该公司的人工智能战略发生了重大转变,并有可能重塑行业的竞争格局。这种方法使AI能够从人类偏好中学习,从而可能产生更自然、更具上下文相关性的响应。通过提供与行业领导者相抗衡的多模态模型和纯文本模型,英伟达正在定位自己为全面的人工智能解决方案提供商,利用其硬件专业知识创造强大且易于访问的软件工具。在未来几个月里,AI社区将密切关注Llama-3.1-Nemotron-70B-Instruct在真实应用场景中的表现,而不仅仅是基准测试的结果。