OC

Knowledge OS
鹦鹉螺口语
人工智能现在可以“看到”视错觉。它告诉我们关于我们自己的大脑的什么信息?
2026-01-12 10:00:00 · 英文原文

人工智能现在可以“看到”视错觉。它告诉我们关于我们自己的大脑的什么信息?

Estudio Santa Rita/ BBC An illustration of an optical illusion involving vases and faces (Credit: Estudio Santa Rita/ BBC)圣丽塔工作室/ BBC

(来源:圣丽塔工作室/BBC)

我们的眼睛经常会欺骗我们,但科学家发现,一些人工智能也会陷入同样的错觉。它正在改变我们对大脑的了解。

当我们抬头仰望月亮时, 与在天空更高处相比,靠近地平线时看起来更大尽管它的大小以及地球和月球之间的距离在一夜之间基本保持不变。

诸如此类的视错觉表明,我们并不总是以应有的方式感知现实。它们通常被认为是我们的视觉系统所犯的错误。但幻象也揭示了 聪明的捷径 我们的大脑过去常常 提取最重要的 我们周围环境的细节。

事实上,我们的大脑只接受我们周围世界的一小部分——处理我们繁忙的视觉环境中的每一个细节都太过分了,所以它们只挑选出我们需要的细节。 

但是,当你给合成思维(由人工智能驱动的机器视觉系统)带来视错觉时,会发生什么?这些系统在细节方面表现出色。它们旨在发现图案和 我们没有的瑕疵。这就是为什么他们如此有效 发现疾病的早期迹象例如,在医学扫描中。

然而,一些深度神经网络 (DNN)(支撑当今许多先进人工智能算法的技术)很容易受到一些与人类相同的视觉技巧的影响。它为我们大脑的工作方式提供了新的见解。

日本国家基础生物学研究所神经生理学副教授 Eiji Watanabe 表示:“在错觉研究中使用 DNN 可以让我们模拟和分析大脑如何处理信息并产生错觉。”“对人脑进行实验操作引起了严重的伦理问题,但此类限制不适用于人工模型。”

到目前为止,还没有深度神经网络能够体验人类所做的所有错觉

尽管关于为什么我们会感知到不同的视错觉有很多理论,但在大多数情况下仍然没有决定性的解释。

对没有经历过视错觉的人的研究提供了一些线索。在一个案例中,一个人在很小的时候就失明了,在 40 多岁的时候就恢复了视力 不是 被涉及形状的幻觉所欺骗,例如著名的 卡尼萨广场,其中四个精心定位的圆形碎片创造了让人想起正方形的虚幻轮廓。然而,他可以感知运动的错觉,例如 理发店的柱子,即使杆只是在垂直轴上转动,条纹似乎向上移动。

对此类案例的研究似乎表明,与理解形状相比,我们感知运动的能力对于感觉剥夺更加强大。这可能是因为我们在婴儿时期就很早就学会了处理运动。或者,我们处理形状的方式可以更加可塑,并准备好识别我们最常接触的形状。

使用功能性磁共振成像 (fMRI) 的脑成像研究也提供了对以下问题的深入了解: 当我们看到不同的幻觉时,大脑的哪些部分会活跃以及它们如何相互作用。然而,我们对视错觉的感知是主观的,并且因人而异,如下所示 2015年网上疯传的一张条纹连衣裙照片,观众无法就它是蓝色和黑色还是白色和金色达成一致。这个 使得很难客观地研究它们因为研究人员通常依赖参与者描述他们所看到的内容。

现在,人工智能提供了一种新的方式来理解我们在观察视错觉时大脑中正在发生的事情。

如今使用的许多人工智能算法(包括 ChatGPT 等聊天机器人)均由深度神经网络提供支持,这些神经网络是由人工神经元组成的模型,试图模仿我们的大脑处理信息的方式。

在 最近的工作渡边和他的同事们想看看,当我们观察涉及运动的错觉(例如旋转的蛇错觉)时,深层神经网络是否可以复制我们大脑中发生的情况。这使用 彩色圆圈的迷幻图案 在静态图像中,但当我们盯着它看时,它似乎在旋转。 

Watanabe 和他的团队使用了一种名为 PredNet 的深度神经网络,该网络是基于关于我们的大脑如何处理视觉信息(称为预测编码)的领先理论而设计的。这表明,当我们环顾四周时,我们的视觉系统不仅仅是被动地处理周围环境的特征。相反,它首先根据过去的经验来预测它期望看到的内容,然后再处理我们眼睛输入的差异。这让我们看得更快。 

同样,PredNet 根据从之前看到的帧中获取的知识来预测视频中的未来帧。在他的实验中,渡边使用头戴式摄像机拍摄的自然景观视频来训练人工智能,这些视频与人类环顾四周时可能看到的类似。该系统从未暴露于任何视错觉。通过向其显示某些它没有见过的帧,它的设计目的是使其预测尽可能与该帧匹配。 

Estudio Santa Rita/ BBC Images that play with perspective are a common form of optical illusion and they can fool AI too (Credit: Estudio Santa Rita/ BBC)圣丽塔工作室/ BBC

玩弄透视的图像是一种常见的视错觉形式,它们也可以愚弄人工智能(图片来源:Estudio Santa Rita/BBC)

“在处理大约一百万帧后,PredNet 学习了视觉世界的某些规则,”渡边说。“它提取并记住基本规则,其中,它可能还学习了移动物体的特征。”

然后,渡边向人工智能模型展示了旋转蛇错觉的一些变体,以及人类大脑不会被愚弄并因此感知为静态的改变版本。他发现人工智能也被与人类相同的图像所欺骗。渡边认为它支持了我们的大脑使用预测编码的理论。在这种情况下,图像的某些方面表明移动的物体会触发我们大脑的预测系统假设五彩蛇正在运动。

“我认为 PredNet 的感知与人类的感知相似,”他说。

然而,渡边和他的团队还发现人工智能和人类感知幻觉的方式存在差异。例如,当我们注视其中一个旋转的圆盘时,它似乎停止了旋转,而我们余光中的其他圆盘则继续旋转。然而,PredNet 总是感知到所有圆圈同时移动。 

“这可能是因为 PredNet 缺乏注意力机制,”渡边说。这意味着它无法聚焦于图像上的特定点,而是对其整体进行处理。

尽管人工智能系统和机器人可能能够模仿我们视觉系统的某些方面,但它们距离像我们一样看世界还很遥远。渡边说,到目前为止,还没有深度神经网络能够体验人类所做的所有错觉。

从某些方面来说,这不应该让我们感到惊讶。 

受这项工作的启发,澳大利亚巴瑟斯特查尔斯特大学人工智能和网络未来研究所的研究员 Ivan Maksymov 开发了一个模型,该模型结合了 量子物理与人工智能看看它是否可以模拟我们感知内克立方体和称为鲁宾花瓶的类似错觉的方式,在鲁宾花瓶中我们看到一个花瓶或两张脸的侧面。他设计了一个深度神经网络,利用一种称为量子隧道效应的现象来处理信息。然后系统被训练来识别这两种错觉。 

当其中一种幻象输入系统时,就会产生两种解释之一。马克西莫夫发现,随着时间的推移,人工智能会定期在它们之间切换——就像人类一样。这些开关的时间间隔也相似。

“这与人们在测试中看到的非常接近,”他说。

这是一个狭窄的研究领域,但它非常重要,因为人类想要进入太空 – Ivan Maksymov

马克西莫夫并不认为这表明我们的大脑具有量子特性,尽管这是一个活跃的研究领域。相反,他认为这表明人类思维的某些方面,例如我们如何做出决策,可以通过使用量子理论(量子认知领域的基础)更好地建模。例如,对于幻觉,我们的大脑正在选择一个版本或另一个版本。

这样的系统还可以用来模拟我们的视觉感知在不同重力条件下在空间中如何变化。研究人员此前曾研究过在国际空间站(ISS)呆过一段时间的宇航员如何经历他们看到视错觉的方式的变化。

他们发现,宇航员在地球上时会更频繁地从两个视角之一看到内克尔立方体等幻象。但在轨道上运行三个月后,他们 同等频繁地看到每个人的观点。科学家认为,这种情况可能会发生,因为我们判断深度的一些方式依赖于重力。当在轨道上自由漂浮时,宇航员无法根据坐或直立时眼睛距地面的高度来估计距离。 

“虽然这是一个狭窄的研究领域,但它非常重要,因为人类想要进入太空,”马克西莫夫说。

宇宙中蕴藏着如此多的奇迹,那些太空旅行者肯定想知道他们能相信自己的眼睛。

--

欲了解更多技术新闻和见解,请注册我们的 科技解码时事通讯同时 必备清单每周两次向您的收件箱发送精心挑选的功能和见解。

有关 BBC 的更多科学、技术、环境和健康故事,请关注我们 脸书和 Instagram


关于《人工智能现在可以“看到”视错觉。它告诉我们关于我们自己的大脑的什么信息?》的评论

暂无评论

发表评论

摘要

科学家发现,人工智能可能会像人类一样陷入视错觉,这为我们的大脑如何处理视觉信息提供了新的见解。视错觉揭示了人类大脑从复杂环境中提取基本细节的捷径。当给予视错觉时,深度神经网络(DNN)——许多人工智能系统的支柱——表现出类似于人类观察到的行为,这表明这些错觉可以为理解大脑功能提供一个窗口。Eiji Watanabe 和 Ivan Maksymov 等研究人员正在使用人工智能来模拟人类视觉感知,揭示我们的大脑如何使用预测编码,并提出用量子理论模拟人类思维过程的新方法。然而,当前的人工智能仍然无法像人类一样体验所有的视错觉。

相关新闻

相关讨论