Nvidia AI Blueprint 让任何开发人员都能轻松构建分析视频的自动化代理

2024-11-04 17:00:00 英文原文

作者:Dean Takahashi

加入我们的每日和每周时事通讯,了解有关行业领先人工智能报道的最新更新和独家内容。了解更多


英伟达宣布其 Nvidia AI Blueprint 将使任何行业的开发人员都能轻松构建 AI 代理来分析视频和图像内容。

有了这项技术,恩维迪a 说任何行业现在都可以搜索和总结大量的视觉数据
数据。

埃森哲、戴尔和联想等公司利用新的 Nvidia AI 蓝图来开发视觉 AI 代理,以提高生产力、优化流程并创造更安全的空间。


世界各地的企业和公共部门组织正在开发人工智能代理,以提高依赖来自越来越多设备(包括摄像头、物联网传感器和车辆)的视觉信息的员工的能力。

为了支持他们的工作,用于视频搜索和摘要的新 Nvidia AI 蓝图将使几乎所有行业的开发人员能够构建分析视频和图像内容的视觉 AI 代理。这些代理可以回答用户问题、生成摘要并针对特定场景启用警报。

该蓝图是 Nvidia Metropolis(一套用于构建视觉 AI 应用程序的开发人员工具)的一部分,是一个可定制的工作流程,结合了 Nvidia 计算机视觉和生成式 AI 技术。

包括埃森哲、戴尔和联想在内的全球系统集成商和技术解决方案提供商正在为全球企业和城市带来用于视觉搜索和摘要的 Nvidia AI 蓝图,推动下一波 AI 应用程序的部署,以提高工厂的生产力和安全性、仓库、商店、机场、交通路口等。

Nvidia AI 蓝图在智能城市博览会世界大会之前发布,为视觉计算开发人员提供了一整套优化软件,用于构建和部署生成式 AI 驱动的代理,这些代理可以摄取和理解大量实时视频流或数据档案。

用户可以使用自然语言提示而不是严格的软件代码来定制这些视觉人工智能代理,从而降低跨行业和智慧城市应用部署虚拟助手的障碍。

Nvidia AI Blueprint 利用视觉语言模型

视觉 AI 代理由视觉语言模型 (VLM) 提供支持,这是一类生成式 AI 模型,它将计算机视觉和语言理解相结合来解释物理世界并执行推理任务。

用于视频搜索和摘要的 Nvidia AI 蓝图可以配置 Nvidia NIM 微服务,用于 VLM(如 Nvidia VILA)、LLM(如 Meta’s Llama 3.1 405B)以及用于 GPU 加速问答和上下文感知检索增强生成的 AI 模型。

开发人员可以轻松交换其他 VLM、LLM 和图形数据库,并使用 Nvidia NeMo 平台针对其独特的环境和用例对其进行微调。

采用 Nvidia AI 蓝图可以节省开发人员数月的时间来研究和优化智能城市应用的生成式 AI 模型。

它部署在边缘、本地或云端的 Nvidia GPU 上,可以极大地加快梳理视频档案以识别关键时刻的过程。

在仓库环境中,如果违反安全协议,使用此工作流程构建的人工智能代理可以向工人发出警报。在繁忙的十字路口,人工智能代理可以识别交通碰撞并生成报告以帮助应急响应工作。在公共基础设施领域,维护人员可以要求人工智能代理审查航拍镜头并识别退化的道路、火车轨道或桥梁,以支持主动维护。

除了智能空间之外,视觉人工智能代理还可以用于为视力受损的人总结视频,自动生成体育赛事的回顾,并帮助标记大量视觉数据集以训练其他人工智能模型。

视频搜索和摘要工作流程加入了一系列 Nvidia AI 蓝图,可以轻松创建 AI 驱动的数字化身、构建用于个性化客户服务的虚拟助理以及从 PDF 数据中提取企业洞察。

Nvidia AI 蓝图可供开发人员免费体验和下载,并且可以通过 Nvidia AI Enterprise 跨加速数据中心和云部署在生产中,Nvidia AI Enterprise 是一个端到端软件平台,可加速数据科学管道并简化生成式 AI 开发和部署。

人工智能代理将洞察从仓库传递到世界各国首都

企业和公共部门客户还可以在 Nvidia 合作伙伴生态系统的帮助下利用完整的 Nvidia AI 蓝图集合。

全球专业服务公司 Accenture 已将 Nvidia AI Blueprints 集成到其 Accenture AI Refinery 中,该 Refinery 基于 Nvidia AI Foundry 构建,使客户能够开发基于企业数据训练的自定义 AI 模型。

东南亚的全球系统集成商(包括马来西亚的 ITMAX 和越南的 FPT)正在基于视频搜索和总结 Nvidia AI 蓝图构建 AI 代理,用于智慧城市和智能交通应用。

开发人员还可以利用全球服务器制造商提供的计算、网络和软件在 Nvidia AI 平台上构建和部署 Nvidia AI 蓝图。Nvidia AI 蓝图与 Nvidia 和联想混合 AI 解决方案并入戴尔 AI Factory。

Nvidia Metropolis 生态系统中的智慧城市应用程序提供商 K2K 等公司将使用新的 Nvidia AI Blueprint 来构建实时分析实时交通摄像头的 AI 代理。这将使城市官员能够询问有关街道活动的问题并获得有关改善运营的建议。该公司还与意大利巴勒莫的城市交通管理者合作,使用 NIM 微服务和 Nvidia AI 蓝图部署视觉 AI 代理。

Nvidia 将在 11 月 7 日在巴塞罗那举行的世界智能城市博览会上详细讨论这一问题。

VB日报

保持了解!每天在收件箱中获取最新消息

订阅即表示您同意 VentureBeat 的服务条款。

感谢您的订阅。查看更多VB 时事通讯在这里

发生错误。

关于《Nvidia AI Blueprint 让任何开发人员都能轻松构建分析视频的自动化代理》的评论


暂无评论

发表评论

摘要

Nvidia 推出 AI 蓝图,以简化行业视觉 AI 代理的开发,从而轻松分析和总结视频和图像内容。埃森哲、戴尔和联想等公司正在整合这项技术,以提高工厂、仓库和智慧城市等各个领域的生产力和安全性。该蓝图支持使用自然语言提示进行定制,并集成视觉语言模型以实现高效的数据处理。它是 Nvidia Metropolis 的一部分,免费向开发者开放,旨在加速人工智能应用在全球的部署。