看看人工智能:任何行业现在都可以搜索和总结大量视觉数据

2024-11-04 16:03:43 英文原文

作者:Adam Scraba

世界各地的企业和公共部门组织正在开发人工智能代理,以提高依赖来自越来越多设备(包括摄像头、物联网传感器和车辆)的视觉信息的员工的能力。

为了支持他们的工作,一个新的用于视频搜索和摘要的 NVIDIA AI 蓝图将使几乎所有行业的开发人员能够构建分析视频和图像内容的视觉人工智能代理。这些代理可以回答用户问题、生成摘要并针对特定场景启用警报。

一部分NVIDIA大都会是一套用于构建视觉 AI 应用程序的开发人员工具,该蓝图是一个可定制的工作流程,结合了 NVIDIA 计算机视觉和生成式 AI 技术。

埃森哲 (Accenture)、戴尔科技 (Dell Technologies) 和联想 (Lenovo) 等全球系统集成商和技术解决方案提供商正在为全球企业和城市带来用于视觉搜索和摘要的 NVIDIA AI 蓝图,推动下一波 AI 应用浪潮,部署这些应用可提高生产力和安全性工厂、仓库、商店、机场、交通路口等。

提前宣布智慧城市博览会世界大会NVIDIA AI 蓝图为视觉计算开发人员提供了一整套优化软件,用于构建和部署生成式 AI 驱动的代理,这些代理可以摄取和理解大量实时视频流或数据档案。

用户可以使用自然语言提示而不是严格的软件代码来定制这些视觉人工智能代理,从而降低跨行业和智慧城市应用部署虚拟助手的障碍。

NVIDIA AI 蓝图利用视觉语言模型

视觉人工智能代理由视觉语言模型 (VLM),一类生成式人工智能模型,结合计算机视觉和语言理解来解释物理世界并执行推理任务。

用于视频搜索和摘要的 NVIDIA AI 蓝图可以配置为英伟达NIMVLM 的微服务,例如英伟达VILA, 法学硕士喜欢梅塔的骆驼 3.1 405B用于 GPU 加速问答和上下文感知的 AI 模型检索增强生成。开发人员可以轻松交换其他 VLM、LLM 和图形数据库,并使用NVIDIA NeMo平台适合其独特的环境和用例。

采用 NVIDIA AI 蓝图可以帮助开发人员节省数月的时间来研究和优化智能城市应用的生成式 AI 模型。它部署在边缘、本地或云端的 NVIDIA GPU 上,可以极大地加快梳理视频档案以识别关键时刻的过程。

在仓库环境中,如果违反安全协议,使用此工作流程构建的人工智能代理可以向工人发出警报。在繁忙的十字路口,人工智能代理可以识别交通碰撞并生成报告以帮助应急响应工作。在公共基础设施领域,维护人员可以要求人工智能代理审查航拍镜头并识别退化的道路、火车轨道或桥梁,以支持主动维护。

除了智能空间之外,视觉人工智能代理还可以用于为视力受损的人总结视频,自动生成体育赛事的回顾,并帮助标记大量视觉数据集以训练其他人工智能模型。

视频搜索和摘要工作流程结合了NVIDIA AI 蓝图合集这使得很容易创建人工智能驱动的数字化身,构建虚拟助手个性化的客户服务和提取企业洞察来自 PDF 数据。

NVIDIA AI 蓝图可供开发人员免费体验和下载,并且可以通过加速数据中心和云部署在生产中NVIDIA 人工智能企业,一个端到端软件平台,可加速数据科学管道并简化生成式人工智能开发和部署。

人工智能代理将洞察从仓库传递到世界各国首都

企业和公共部门客户还可以在 NVIDIA 合作伙伴生态系统的帮助下利用全套 NVIDIA AI 蓝图。

全球专业服务公司 Accenture 已将 NVIDIA AI Blueprints 集成到其 Accenture AI Refinery 中,该 Refinery 构建于NVIDIA 人工智能代工厂并使客户能够开发基于企业数据训练的自定义人工智能模型。

东南亚的全球系统集成商(包括马来西亚的 ITMAX 和越南的 FPT)正在基于视频搜索和总结 NVIDIA AI 蓝图构建 AI 代理,用于智慧城市和智能交通应用。

开发人员还可以利用全球服务器制造商提供的计算、网络和软件在 NVIDIA AI 平台上构建和部署 NVIDIA AI 蓝图。

戴尔将使用VLM和代理方法与戴尔的NativeEdge平台来增强现有的边缘人工智能应用程序并创建新的边缘人工智能功能。戴尔人工智能工厂与 NVIDIA 的戴尔参考设计以及用于视频搜索和摘要的 NVIDIA AI 蓝图将支持数据中心、边缘和本地多模式企业用例的专用 AI 工作流程中的 VLM 功能。

NVIDIA AI 蓝图也被纳入由 NVIDIA 提供支持的联想混合 AI 解决方案中。

NVIDIA Metropolis 生态系统中的智慧城市应用程序提供商 K2K 等公司将使用新的 NVIDIA AI 蓝图来构建能够实时分析实时交通摄像头的 AI 代理。这将使城市官员能够询问有关街道活动的问题并获得有关改善运营的建议。该公司还与意大利巴勒莫的城市交通管理者合作,使用 NIM 微服务和 NVIDIA AI 蓝图部署视觉 AI 代理。

参观 11 月 7 日在巴塞罗那举行的世界智慧城市博览会上的 NVIDIA 展台,了解有关视频搜索和摘要的 NVIDIA AI 蓝图的更多信息。

学习如何构建视觉 AI 代理 开始绘制蓝图

关于《看看人工智能:任何行业现在都可以搜索和总结大量视觉数据》的评论


暂无评论

发表评论

摘要

NVIDIA 发布了用于视频搜索和摘要的 AI 蓝图,作为 NVIDIA Metropolis 平台的一部分,使开发人员能够创建可以分析各个行业的视频和图像的视觉 AI 代理。这些代理由视觉语言模型 (VLM) 和大型语言模型 (LLM) 提供支持,使它们能够有效地理解和解释视觉数据。该蓝图支持通过自然语言提示而不是严格的编码进行定制,使世界各地的企业和城市更容易部署这些人工智能代理,以提高工厂、仓库、机场等不同环境中的生产力和安全性。埃森哲、戴尔科技、联想等合作伙伴正在将这项技术集成到他们的全球解决方案中。