解锁 pareidolia:为何AI和人类在物体上看到人脸 - 神经科学新闻

2024-10-07 14:44:39 英文原文

作者:Neuroscience News

摘要:最近的一项研究深入探讨了错觉脸的认知现象,即人类倾向于在无生命物体中看到人脸,揭示了人类和人工智能如何检测虚幻的脸。研究人员发现,在经过识别动物面孔的训练后,AI模型在检测错觉面孔方面表现出显著的优势,这暗示了一种进化上的联系。

他们还发现了一个“适中区域”,在这个区域内图形的复杂度最有可能引发错觉脸。研究团队建立了一个包含5000张图片的数据集来研究这些效应,为改进面部识别系统提供了见解。

关键事实:

  • 经过动物面部训练的AI模型能更好地检测似颜现象中的面孔。
  • “金发姑娘区”的图像复杂度会增加虚幻形象错觉的可能性。
  • 这项研究有助于改进面部检测系统,具有广泛的应用。

来源:麻省理工学院

1994年,佛罗里达州的珠宝设计师黛安娜·杜伊泽尔在一块烤芝士三明治上发现了一张她认为是圣母玛利亚的形象,并且保存下来并在后来以28,000美元的价格拍卖了它。但我们真的了解错觉性面部识别(即pareidolia,人们在实际上并不存在人脸或图案的物体中看到面孔和模式的现象)吗?

麻省理工学院计算机科学与人工智能实验室(CSAIL)的一项新研究探讨了这一现象,引入了一个包含5000张由人工标记的拟像图片的大型数据集,远远超过了之前的收集。

This shows a face.
这个预测的“适居区”随后通过真实人类受试者和人工智能面部检测系统的测试得到了验证。信用:神经科学新闻

利用这个数据集,研究团队发现了关于人类与机器感知差异的几个令人惊讶的结果,并且探讨了在一片吐司中看到人脸的能力可能如何拯救了你远祖的生命。

“面部错觉长期以来吸引了心理学家的兴趣,但在计算机视觉社区中却很少被探索,”麻省理工学院电气工程与计算机科学专业博士生、CSAIL附属成员兼该研究的主要研究员马克·汉密尔顿说。

“我们希望创建一个资源,帮助我们理解人类和人工智能系统是如何处理这些错觉脸孔的。”

所有这些假面孔都揭示了什么呢?其中一个发现是,AI模型似乎并不像我们一样能够识别出似颜现象(pareidolia)中的面孔。令人惊讶的是,研究团队发现,直到他们训练算法识别动物面孔之后,这些算法才在检测似颜现象中的面孔方面有了显著的提升。

这个意外的联系暗示了我们识别动物面孔的能力——这对生存至关重要——与我们在无生命物体上看到人脸的趋势之间可能存在某种进化联系。

“这样的结果似乎表明,错觉性面容识别可能并非源于人类的社会行为,而是源自更深层次的东西:比如迅速发现潜伏的老虎,或者判断鹿的目光方向以便我们的远古祖先进行狩猎。”汉密尔顿说。

另一个令人感兴趣的发现是研究人员所说的“人脸错觉的黄金比例区域”,在这个区域内,人脸错觉最容易发生。“有一个特定的视觉复杂度范围,在这个范围内,人类和机器都最有可能在非人脸对象中看到人脸。”麻省理工学院电气工程与计算机科学教授、该项目的主要调查员William T. Freeman说。

“太简单了,细节不足无法构成一张脸。太复杂了,又会成为视觉噪音。”

为了揭开这一现象,研究团队开发了一个方程,用于模拟人们和算法如何识别虚假面孔。在分析这个方程时,他们发现了一个明显的“错觉峰值”,在这个峰值处看到人脸的可能性最高,对应的是具有“恰到好处”的复杂程度的图像。

这个预测的“适居区”随后通过真实人类受试者和人工智能面部检测系统的真实测试得到了验证。

这个新的数据集,“事物中的脸孔这样的样本规模远远超过了之前的研究中通常仅使用20到30个刺激的研究。

这一尺度使研究人员能够探索最先进的面部检测算法在对具诱导性面孔进行微调后的表现,表明这些算法不仅可以被编辑以识别这类面孔,而且还可以作为我们自己大脑的硅基替代品,从而使团队能够提出并回答关于具诱导性面孔检测起源的问题,这些问题在人类身上是不可能提出的。

为了建立这个数据集,团队从LAION-5B数据集中精选了大约20,000张候选图片,然后由人工标注员仔细进行了标记和评判。

这个过程包括在感知到的脸部周围绘制边界框,并回答关于每张脸的详细问题,例如感知到的情绪、年龄以及这张脸是否是偶然出现或有意露出。

“收集和标注数千张图片是一项巨大的任务,”汉密尔顿说。“数据集的大部分存在要归功于我的妈妈,一位退休银行家,她花费了无数个小时细心地为我们的分析标记图像。”

该研究还有潜在的应用价值,可以通过减少假阳性来改进面部检测系统,这可能对自动驾驶汽车、人机交互和机器人技术等领域产生影响。该数据集和模型还可以帮助产品设计等领域,在这些领域中,理解和控制错觉现象(pareidolia)可以创造出更好的产品。

汉密尔顿说:“想象一下能够自动调整汽车或儿童玩具的设计,使它们看起来更友好,或者确保医疗设备不会无意间显得令人恐惧。”

人类本能地将无生命物体赋予人性化的特质,这种能力真是令人着迷。例如,当你瞥见一个插座时,你可能会立刻想象它在唱歌,并且甚至可以想象它是如何“动嘴唇”的。”汉密尔顿说,“然而,算法并不能像我们一样自然地识别出这些卡通脸。”

这引发了一些引人深思的问题:是什么造成了人类感知与算法解读之间的差异?错觉图像是有益的还是有害的?为什么算法不会像我们一样经历这种效果?

这些问题引发了我们的调查,因为这一经典的心理学现象在算法中尚未得到充分探索。

随着研究人员准备将他们的数据集与科学界共享,他们已经开始展望未来。未来的研究工作可能包括训练视觉-语言模型来理解和描述拟像脸孔,这可能会导致能够以更接近人类方式处理视觉刺激的AI系统。

这是一篇令人愉悦的论文!读起来很有趣,它让我思考。Hamilton等人提出了一个引人入胜的问题:我们为什么会在事物中看到人脸?”加州理工学院电气工程艾伦·Puckett教授皮耶托·佩罗纳如是说,他并未参与这项工作。

“正如他们指出的,从示例(包括动物面孔)中学习只能部分解释这一现象。我认为思考这个问题会让我们了解到关于我们视觉系统如何在生命经历的训练之外进行泛化的重要信息。”

汉密顿和弗里曼的合著者包括丰田研究院的资深研究科学家西蒙·斯滕特;麻省理工学院脑与认知科学系首席研究科学家、NVIDIA 研究科学家及前CSAIL成员鲁思·罗森霍尔茨;以及CSAIL附属机构博士后瓦莎·杜泰尔、MEng ’23 安妮·哈里根和研究科学家詹妮弗·科伯特。

资金:他们的工作部分得到了国家科学基金会和CSAIL MEnTorEd Opportunities in Research (METEOR) Fellowship的支持,同时获得了美国空军研究实验室和美国空军人工智能加速器的赞助。麻省理工学院SuperCloud和林肯实验室超级计算中心为研究人员提供了高性能计算资源。

关于这一面孔臆视症和人工智能研究新闻

作者:瑞秋·戈登
来源:麻省理工学院
联系人: Rachel Gordon – 麻省理工学院
图片:图片来自 Neuroscience News

原创研究:研究结果在欧洲计算机视觉会议上进行了展示。

关于《解锁 pareidolia:为何AI和人类在物体上看到人脸 - 神经科学新闻》的评论


暂无评论

发表评论

摘要

摘要:最近的一项研究深入探讨了错觉面孔识别(pareidolia),即人类倾向于在无生命的物体上看到人脸的现象,揭示了人类和人工智能如何检测虚幻的面孔。信用:神经科学新闻利用这一数据集,该团队发现了关于人与机器感知之间差异的一些令人惊讶的结果,以及看到面包片上的脸可能拯救了你远祖的生命的能力。“错觉面孔识别长期以来一直吸引着心理学家的兴趣,但在计算机视觉社区中却鲜有探讨。”麻省理工学院电气工程和计算机科学博士生、CSAIL附属研究员兼该研究的主要研究人员马克·汉密尔顿说。“像这样的结果似乎表明,错觉面孔可能不是源于人类的社会行为,而是源自某种更深层次的东西:比如迅速发现潜伏的老虎,或者识别鹿朝哪个方向看,以使我们的原始祖先能够狩猎。”汉密尔顿说,“然而,算法并不自然地像我们一样识别这些卡通般的面孔。”