作者:by University of Virginia
如果一个安全摄像头不仅能够捕捉视频,还能理解正在发生的事情——区分日常活动和潜在危险行为呢?这就是弗吉尼亚大学工程与应用科学学院的研究人员们通过他们的最新突破所塑造的未来:一种由人工智能驱动的智能视频分析器,能够在视频中以前所未有的精确度和智能水平检测人类动作。
研究论文是发表在期刊中 IEEE模式分析与机器智能 transactions.
该系统称为语义和运动感知时空变换网络(SMAST),承诺带来广泛的社会效益,从增强 surveillance系统监视系统并改进公共安全实现更先进的医疗保健中的运动跟踪以及改进自主车辆在复杂环境中的导航方式。
“这项人工智能技术为在一些最苛刻的环境中实现实时动作检测打开了大门,”电气与计算机工程系教授兼主席斯科特·T·阿克顿如是说,他也是该项目的主要研究员。“这是一种能够帮助预防事故、改进诊断甚至拯救生命的进步。”
那么,它是如何工作的呢?在核心部分,SMAST 依赖于人工智能技术。系统依靠两个关键组件来检测和理解复杂的 human 行为。第一个是多特征选择性注意力模型,它帮助 AI 将注意力集中在场景中最重要的部分——比如一个人或一个物体——同时忽略不必要的细节。这使得系统在识别正在发生的事情时更加准确,例如识别某人投掷球而不是仅仅挥动手臂。
第二个关键特性是一种运动感知的二维位置编码算法,这有助于AI跟踪事物随时间的变化。想象一下观看一段视频中人们不断变换位置的情景——这个工具帮助AI记住这些动作并理解它们之间的关系。通过集成这些功能,SMAST可以准确地实时识别复杂动作,在像监控这样的高风险场景中更加有效。医疗卫生诊断,或自动驾驶。
SMAST重新定义了机器检测和解读人类动作的方式。当前系统在处理混乱、未经编辑的连续动作时存在困难。视频 footage(此处保留原词,因在某些专业场合中直接使用英文“footage”更为常见),常常忽略了事件的上下文。但SMAST创新的设计允许它以惊人的准确性捕捉人与物之间的动态关系,这是由使它能够从数据中学习和适应的AI组件驱动的。
这一技术飞跃意味着AI系统能够识别诸如跑步者过马路、医生进行精密操作或甚至在拥挤空间中出现的安全威胁等行为。SMAST已经在包括AVA、UCF101-24和EPIC-Kitchens在内的关键学术基准上超越了顶级解决方案,设立了新的准确性和效率标准。
"The"社会影响“这可能会有很大的影响,”Acton实验室的博士后研究员马修·科尔班在从事该项目时说。“我们很兴奋地看到这项AI技术如何可能改变各个行业,使基于视频的系统更加智能,并具备实时理解的能力。”
更多信息:马修·科尔班等人,一种语义和运动感知的时空变换网络用于动作检测 IEEE模式分析与机器智能 transactions (2024). DOI: 10.1109/TPAMI.2024.3377192
引用基于人工智能的视频分析器在人体动作检测方面设立了新的标准(2024年10月16日) 检索于2024年10月17日 从 https://techxplore.com/news/2024-10-ai-driven-video-standards-human.html
本文件受版权保护。除个人学习或研究目的的合理使用外,未经书面许可,不得以任何形式复制任何部分。内容仅用于提供信息之目的。