视频分析的时代AI代理在这里。
视频是现代数字景观的定义特征之一,占全球数据流量的50%以上。它在媒体中占主导地位,对于整个行业的企业越来越重要,它是世界上最大,最普遍的数据来源之一。然而,不到1%的人进行了见解。
全球GDP的近一半来自物理行业,跨越了汽车和电子产品。由于劳动力短缺,制造业的努力以及对自动化需求的增加,视频分析AI代理将比以往任何时候都发挥更关键的作用,帮助弥合物理和数字世界。
为了加速这些代理商的发展,今天的Nvidia正在使AI蓝图用于视频搜索和摘要(VSS),由Nvidia Metropolis平台,通常可用的 - 为开发人员提供创建和部署功能强大的AI代理的工具,以分析大量的实时和存档视频。
一波AI代理和生产力助手视觉语言模型(VLM)即将上网。将强大的计算机视觉模型与超级智能的技能相结合大语言模型(LLM),这些视频分析AI代理使企业可以轻松查看,搜索和总结大量视频。通过实时分析视频或审查录制视频的Terabytes,视频分析AI代理正在解锁一系列重要行业的前所未有的价值和机会。
制造商和仓库正在使用AI代理来帮助提高工人的安全性和生产率。例如,代理可以帮助分发叉车和位置工人以达到最佳效率。智能城市正在部署视频分析AI代理,以减少交通拥堵并提高安全性,并且使用不断。
创建视频分析的不同舰队AI代理商的蓝图
VSS蓝图建立在Nvidia Metropolis平台并由VLM和LLMS(例如Nvidia Vila和Nvidia Llama nemotron,,,,NVIDIA NEMO猎犬微服务和检索型发电(抹布) - 将LLMS连接到公司的企业数据的技术。
VSS蓝图包含NVIDIA AI Enterprise软件平台,包括NVIDIA NIMVLM,LLMS和ADAVER AI框架的微服务。使用VSS蓝图,用户可以比实时观看更快地汇总视频100倍。例如,一个小时的视频可以在不到一分钟的时间内总结在文本中。
VSS蓝图提供了许多强大的功能,旨在提供强大的视频理解,性能和可扩展性。
此版本介绍扩展的硬件支持,包括在单个部署的能力NVIDIA A100或者H100 GPU对于较小的工作负载,提供了更大的资源分配灵活性。蓝图也可以在NVIDIA RTX 6000 PRO和NVIDIA DGX火花计算平台。
VSS蓝图可以同时处理数百个实时视频流或爆破剪辑。除了视觉理解外,它还提供音频转录。将语音转换为文本会在音频至关重要的情况下增加上下文深度,例如培训视频,主题演讲或团队会议。
行业领导者部署视频分析AI代理商来推动业务价值
从世界领先的制造商到智能城市和体育联盟的每个人都使用VSS蓝图来开发AI代理以优化运营。
pegatron,领先的电子制造公司,使用VSS蓝图研究操作程序并培训员工的最佳实践。该公司还将蓝图集成到其PEGAAI平台中,以便组织可以构建AI代理来改变制造流程。
这些代理可以摄入和分析大量视频,从而实现高级功能,例如自动监测,异常检测,视频搜索和事件报告。Pegatron的视觉分析代理可用于了解打印电路板组件的操作程序,并确定何时正确或不正确的操作。迄今为止,代理商已将Pegatron的劳动力成本降低了7%,缺陷率降低了67%。
其他领先的台湾半导体和电子产品制造商正在建造AI代理和数字双胞胎优化其计划和操作应用程序。
台湾的高苏城,正在使用其合作伙伴开发的统一智能城市愿景AI应用程序接头视觉,以改善事件响应时间。以前,由于缺乏获得关键信息的访问,孤立的基础设施隔离了废物管理,运输和紧急响应等城市部门。
在VSS蓝图的支持下,Linker Vision的AI驱动应用程序具有将实时视频分析与生成AI相结合的代理,不仅可以检测视觉元素,还可以理解和叙述复杂的城市事件,例如洪水或交通事故。接头视觉
使用了广阔的InsightEngine具有VSS蓝图,以简化和加速Vision AI工作流程。它管理着大量的游戏录像。
凭借巨大的见解,NHL可以在次秒内搜索视频的镜头,从而可以近乎亮点的亮点和游戏中的时刻。AI驱动的代理工作流程通过自动剪辑,标记和组装视频内容,以易于访问和使用,从而进一步增强了内容创建。
将来,联盟可能有可能利用实时的AI推理来实现量身定制的见解,例如玩家统计,策略分析或幻想建议,在现场游戏中动态生成。这种端到端的自动化可能会改变媒体的创建,策划和交付方式,为AI驱动的体育内容生产树立新标准。
西门子正在使用其工业副驾驶进行操作,以协助工厂地板工人执行设备维护任务,错误处理和性能优化。这种生成的AI驱动助手使用有关操作和文档数据的信息为设备错误提供了实时答案。
Copilot构建了VSS组件(例如VLM,LLMS和NVIDIA NEMO微服务)的融合。工业副驾驶导致了快速的决策和减少机器停机时间。西门子报告的生产率提高了30%,可能达到50%。
得到扩展的合作伙伴生态系统的支持
NVIDIA合作伙伴正在使用VSS蓝图来加快创建代理AI视频分析功能的工作流程,将开发时间从几个月减少到几周。
极好的AI智能视频分析的领导者,在仁川机场建立了一个复杂的机场运营项目,以减少几周内的乘客等待时间。在马来西亚,解决方案提供商ITMAX正在使用吉隆坡市的VSS蓝图建造先进的视觉AI代理,以改善整体城市管理并减少事件响应时间。
在广告领域,Pyler在短短几周内将VSS蓝图集成到了其品牌安全(AID)和广告定位(AIM)解决方案中。使用援助和目标,三星电子通过品牌和产品一致的高价值广告位置提高了广告有效性。Byd通过瞄准上下文相关和积极的内容,而Hana Financial Group超过了多个品牌广告系列目标,从而通过瞄准上下文相关和积极的内容来看到其广告单击的速度增加了4倍。
手指是Eyecue的应用程序提供商,这是一个由快速服务餐厅使用的实时计算机视觉平台。Fingermark将VSS蓝图添加到眼神中,以将视频素材变成有关直通车等待时间,服务瓶颈和与员工相关的事件的清晰,可行的见解。
尝试build.nvidia.com上的VSS蓝图并阅读此技术博客有关更多详细信息。
观看 Computex Keynote来自NVIDIA创始人兼首席执行官Jensen Huang以及NvidiaGTC台北2025会议。