一个新的人工智能借助从量子力学定律中借鉴的原理,(AI)系统可以首次模仿人们如何解释复杂的视错觉。
视错觉,例如内克尔立方体和鲁宾的花瓶,在研究图像时,欺骗大脑先看到一种解释,然后再看到另一种解释。尽管图像保持静态,但人脑会有效地在两个或多个不同的可能版本之间切换。
然而,计算机视觉无法模拟人类视觉的心理和神经方面,并且难以模仿我们自然进化的模式识别能力。因此,当今最先进的人工智能代理很难像人类那样看到视错觉。
但 8 月 22 日发表在该杂志上的一项新研究APL 机器学习展示了一种技术,通过利用“量子隧道”的物理现象,让人工智能模仿人脑解释视错觉的方式。
该人工智能系统被称为“量子隧道深度神经网络”,将神经网络与量子隧道相结合。深度神经网络是受大脑结构和功能启发的机器学习算法的集合,在输入和输出之间具有多层节点。它可以对复杂的非线性关系进行建模,并且与传统神经网络(输入和输出之间包含单层)不同,深度神经网络包含许多隐藏层。
与此同时,当电子或光子(光粒子)等亚原子粒子有效地穿过不可穿透的屏障时,就会发生量子隧道效应。因为像光这样的亚原子粒子也可以表现为波——当它不被直接观察时,它并不位于任何固定位置——它位于势垒另一侧的概率虽小但有限。当存在足够多的亚原子粒子时,一些粒子会“隧道”穿过势垒。
代表视错觉的数据通过量子隧道阶段后,稍微改变的图像将由深度神经网络进行处理。
新的人工智能模型反复接受视错觉(内克尔立方体和鲁宾花瓶)的训练,以解释它所看到的东西。每次图像通过量子隧道阶段时都会稍微扰乱图像,从而引入微小的差异。然后深度神经网络就如何解释图像做出决定。
深度神经网络处理视错觉的多种变化,选择与之匹配的视角。这使得它能够模仿人类大脑在观看视错觉时如何在不同视角之间切换。
“当我们看到具有两种可能解释的视错觉(例如模糊的立方体或花瓶和面孔)时,研究人员认为我们暂时同时持有两种解释,直到我们的大脑决定应该看到哪张图片。这种情况类似于量子-机械思想实验薛定谔的猫,”该研究的作者写道伊万·马克西莫夫澳大利亚查尔斯特大学人工智能首席研究员发表在 TechXplore 上。
“我训练了我的量子隧道神经网络来识别内克立方体和鲁宾花瓶错觉。当将错觉作为输入时,它会产生两种解释中的一种或另一种的输出,”马克西莫夫说。
马克西莫夫表示,这些发现可以帮助航空公司飞行员意识到迷失方向和误解飞行仪表的危险,并帮助宇航员在长时间的太空飞行中解释航天器的仪表。
分析模糊图像还有助于诊断患有轻度认知障碍和痴呆症的人。使用该算法训练的人工智能也可能用于检测这些精神衰弱疾病。