作者:ByAndrei IonescuEarth.com staff writer
斯克里普斯研究中心的科学家最近设计了 MovieNet,这是一种变革性的人工智能 (AI) 模型,能够利用人脑的微妙能力来理解移动图像。
与传统不同人工智能模型MovieNet 擅长分析静态图像,旨在识别和解释复杂的、随时间变化的场景。
这项创新在发表于《美国国家科学院院刊,为从医疗诊断到自动驾驶汽车等应用领域带来了巨大的前景。
– 大脑不仅仅看到静止的画面;还看到静止的画面。它创造了一种持续的视觉叙事,”资深作者、多里斯神经科学中心主任霍利斯克莱恩说。斯克里普斯研究公司。一个
— 静态图像识别已经取得了长足的进步,但大脑处理流动场景(如看电影)的能力需要更复杂的模式识别形式。通过研究神经元如何捕获这些序列,我们已经能够将类似的原理应用于人工智能。
克莱恩和第一作者、斯克里普斯研究所的科学家平本正树 (Masaki Hiramoto) 的工作基于大脑如何处理现实世界的视觉序列。研究重点是蝌蚪其视顶盖(大脑的视觉处理区域)可以有效地检测移动刺激并做出反应。
这些神经元将视觉信息片段组装成连贯的序列,模仿人类如何感知现实生活中的流动场景。
“蝌蚪有非常好的视觉系统,而且我们知道它们可以有效地检测和响应移动刺激,”Hiramoto 解释道。
研究人员发现蝌蚪大脑中的神经元可以检测亮度变化和物体旋转变化等特征。这些神经元在 100 到 600 毫秒的片段中处理视觉数据,结合光影模式来创建连续的叙述。
Cline 和 Hiramoto 训练 MovieNet 来模拟这种神经过程,将动态视频剪辑编码为一系列可识别的线索。
为了评估 MovieNet,研究人员向模型展示了蝌蚪在各种条件下游泳的视频片段。
该模型在区分正常游泳行为和异常游泳行为方面的准确率达到 82.3%,比人类观察者高出 18%,并且超过了 Google GoogLeNet 等领先人工智能模型的性能,后者的准确率仅为 72%。
“这就是我们看到真正潜力的地方,”克莱恩指出,并强调了 MovieNet 处理动态数据能力的重要性。
与传统的人工智能模型不同,MovieNet 可以有效地处理和压缩信息,使其能够在减少数据和计算需求的情况下提供高精度。
MovieNet 的突出特点之一是它的能源效率。传统的人工智能模型需要大量的计算资源,这对环境足迹。相比之下,MovieNet 通过将数据简化为基本序列来减少能源需求,而不会牺牲性能。
“通过模仿大脑,我们成功地降低了对人工智能的要求,为不仅强大而且可持续的模型铺平了道路,”克莱恩说。
这种效率使 MovieNet 成为一种环保的替代方案,为在高成本一直是障碍的行业中扩展人工智能铺平了道路。
MovieNet 能够解释随时间的微妙变化,这对医学具有深远的影响。该模型可以帮助及早发现健康状况,例如神经退行性疾病和不规则的心律。
例如,与帕金森病相关的微小运动变化(通常人眼无法察觉)可以被人工智能标记出来,从而使临床医生能够更早进行干预。
在药物发现中,MovieNet 的动态分析可以带来更精确的筛选技术。传统方法依赖于静态快照,随着时间的推移,这可能会错过关键的更改。
通过跟踪细胞对化学暴露的反应,MovieNet 可以更深入地了解药物如何与生物系统相互作用。
“当前的方法错过了关键的变化,因为它们只能分析间隔捕获的图像,”Hiramoto 评论道。– 随着时间的推移观察细胞意味着 MovieNet 可以跟踪药物测试期间最细微的变化。 –
MovieNet 的创新不仅仅在于准确性;它通过对动态场景进行细致入微的分析来弥补现有人工智能技术的差距。
它识别和解释视觉数据实时变化的能力为人工智能树立了新标准,使其成为需要持续监控和精确识别的应用程序的重要工具。
例如,在自动驾驶汽车中,人工智能可以通过检测和响应路况或行人行为的变化来增强安全性。同样,在医学成像中,它可以改善对可能预示疾病早期阶段的细微异常的检测。
Cline 和 Hiramoto 计划增强 MovieNet 的适应性,扩展其在各种环境和应用程序中的功能。
这包括完善模型以处理更复杂的场景,并探索其在其他领域的使用,例如环境监测和野生动物观察。
“从生物学中汲取灵感将继续成为推动人工智能发展的沃土,”克莱恩说。“通过设计像生物体一样思考的模型,我们可以达到传统方法根本无法实现的效率水平。”
研究团队设想了一个未来,像 MovieNet 这样受生物启发的人工智能将彻底改变各个领域的技术。
通过复制大脑复杂的处理能力,MovieNet 不仅增进了我们对人工智能的理解,还为重新定义行业和改善生活的创新打开了大门。
~~
喜欢你读到的内容吗?订阅我们的时事通讯吸引人的文章、独家内容和最新更新。
查看我们地球快照,一款免费应用程序,由埃里克·拉尔斯和 Earth.com。
~~