女性在网上被描绘成比男性年轻,人工智能放大了这种偏见 - 哈斯新闻 |伯克利哈斯

2025-10-08 15:09:09 英文原文

作者:Laura Counts

在今天发表的一项全面研究中自然加州大学伯克利分校哈斯分校、斯坦福大学和牛津/自治大学的研究人员记录了在线媒体中广泛存在的年龄和性别扭曲现象,并发现常见算法正在放大这种偏见。

图片:Adobe Stock/Prostock-studio

美国人口普查数据显示,过去十年,劳动力中的男性和女性之间没有系统性的年龄差异。和平均女性比男人活得更久。但如果您搜索 Google 或 YouTube 或查询 ChatGPT 等人工智能,您会看到的并不是这样。一个

今天发表的研究在日记中自然分析了 140 万张在线图像和视频以及经过数十亿单词训练的 9 个大型语言模型,发现女性被系统地表现为比男性年轻。研究人员查看了 Google、维基百科、IMDb、Flickr 和 YouTube 以及包括 GPT2 在内的主要大型语言模型的内容,得出的结论是,在 3,495 个职业和社会类别中,女性始终比男性显得年轻。

“这种与年龄相关的性别偏见在其他特定行业的研究中也出现过,甚至在有关女性被称为女孩的报告中也出现过,”伯克利哈斯大学助理教授 Solne Delecourt 说道,他与斯坦福大学商学院的 Douglas Guilbeault 和斯坦福大学的 Bhargav Srinivasa Desikan 共同撰写了这项研究。牛津/自治研究所。“但之前没有人能够以如此大规模的方式对此进行研究。”

“这种与年龄相关的性别偏见在针对特定行业的其他研究中也曾出现过,例如在有关被称为“女孩”的女性的报告中。但之前没有人能够以如此规模进行研究。”

– 加州大学伯克利分校哈斯分校助理教授 Solne Delecourt

对于地位高、收入高的职业来说,这种扭曲最为明显。更重要的是,研究人员发现主流算法进一步放大了与年龄相关的性别偏见:在生成和评估近 40,000 份简历时,ChatGPT 假设女性更年轻且经验不足,而将年长的男性申请人评为更合格。

– 网络图像显示与现实相反的情况。尽管互联网是错误的,但当它告诉我们这个关于世界的“事实”时,我们开始相信它是真的,”吉尔博说。– 它让我们更深地陷入偏见和错误。 –– 网络图像显示与现实相反的情况。

尽管互联网是错误的,但当它告诉我们这个关于世界的“事实”时,我们开始相信它是真的。

— 斯坦福大学商学院助理教授 Douglas Guilbeault

“在整个文化范围内,对现实的统计扭曲”

研究团队使用多种方法来评估从各种平台收集的图像和视频中的性别和年龄(为了进行视频分析,他们捕获了静态图像)。在一个案例中,他们雇佣了数千名在线工作人员来对性别(男性、女性、非二元性别)进行分类,并在一组范围内估计年龄。在其他情况下,数据集允许他们将图像时间戳与对象的出生日期交叉引用,以计算出客观精确的年龄。

在所有方法和数据集中,女性与年轻人和男性的年龄都有很强的相关性,无论是根据她们的外表年龄还是根据她们的真实年龄。这种关系是否成立,研究人员是否通过以下指标进行衡量:

  • 人类的判断
  • 机器学习
  • 客观信息

这种扭曲不仅随着工作声望的提高(例如首席执行官或宇航员)而变得更加严重,而且对于男女工资差距较大的工作也同样如此。

当研究人员将分析从图像转向文本时,发现了同样的关系。他们使用来自互联网(包括 Reddit、Google 新闻、维基百科和 Twitter)的数十亿单词来研究性别和年龄之间的关系。与青春有关的词语与女性的联系更为紧密。

“人们可能担心的一个问题是,图像和视频是独一无二的,因为人们可以化妆或应用滤镜,使用特定于图像的策略让自己看起来更年轻,”Delecourt 说。“这就是为什么我们也查看了文本,并且发现了完全相同的模式。”

– 我们的研究表明,与年龄相关的性别偏见是一种文化范围内的、对现实的统计扭曲,通过图像、搜索引擎、视频、文本和生成人工智能渗透到在线媒体中。 –

– 加州大学伯克利分校哈斯分校助理教授 Solne Delecourt

扭曲认知对现实世界的影响

根据这些发现,研究人员进行了两项实验,以了解在线算法如何放大这种偏见。首先,大约 500 名参与者被分成两组。一半的人在谷歌图片中搜索特定职业,标记图片中人物的性别,然后估计这些职位的平均年龄和招聘偏好。对照组搜索不相关的图像,例如苹果或吉他,然后估计这些相同职业的年龄和性别关联,但不接触它们的图像。

在职业相关图片中看到女性的参与者估计从事该工作的平均年龄明显低于对照组,而看到男性从事相同工作的参与者则认为平均年龄明显更高。对于被认为以女性为主的职业,参与者建议较年轻的理想雇用年龄;对于男性主导的职业,他们建议采用较高的雇用年龄。

在第二个实验中,研究人员促使 ChatGPT (gpt-4o-mini) 生成了 54 个职业的近 40,000 份简历,使用与受欢迎程度、种族和其他因素相匹配的独特的男性和女性名字。在为女性生成简历时,ChatGPT 假设与男性姓名的简历相比,她们更年轻(年轻 1.6 岁)、毕业日期更近、工作经验更少。

在评估简历时,ChatGPT 对相同职位的年长男性的评价高于女性。无论研究人员提供姓名还是 ChatGPT 生成自己的申请人,这一结果都会出现,表明偏见深深植根于系统中。

有问题的反馈循环

研究遵循发表在自然去年作者:Delecourt 和 Guilbeault(当时是加州大学伯克利分校哈斯分校的教授)发现 Google 图片中的女性和男性性别关联比 Google 新闻的文本中更为极端。虽然文本中的男性比女性稍微多一些,但这种偏见在图像中要强烈四倍多。他们还发现,视觉形式的偏见在心理上更有效。

吉尔博指出,这项新研究的主要结论之一是,这种对在线信息的前所未有的规模评估揭示了我们所生活的世界的极其不准确的图景。“鉴于互联网越来越成为我们了解社交世界的方式,这一点尤其值得关注,”他说。– 人们在网上花费的时间越来越多,我们依赖算法来管理信息。那么,如果这些有偏见的信念正在传播并成为一种自我实现的预言怎么办?我们的研究表明,它们正在强化人们对世界应该是什么样子的刻板期望。”

鉴于对人工智能工具的巨额投资,这些问题变得更加紧迫,这些工具是在越来越大的在线图像和文本数据集上进行训练的。当这些工具应用于现实世界时,他们很可能会重塑世界,使其更加符合其训练中固有的刻板印象。在简历筛选方面——人工智能已经被广泛使用——人工智能的偏见直接扭曲了它对谁适合或不适合某项工作的看法。

德勒古还指出了年轻人通过在线体验主动和潜意识吸收的信息量。例如,考虑到一般男性或女性医生的形象,孩子们可能会对这个职业留下偏见的印象。

“最终,最让我震惊的是,这个在线演示所产生的影响比我在讨论这个问题时想象的要广泛得多,”她说。“这些歪曲事实直接影响到现实世界,可能会扩大劳动力市场的差距,并扭曲我们将性别与权威和权力联系起来的方式。”

要点

“总的来说,我们的研究表明,与年龄相关的性别偏见是一种文化范围内的、对现实的统计扭曲,通过图像、搜索引擎、视频、文本、搜索引擎和生成人工智能渗透到在线媒体中,”Delecourt 说。 

  • 在网络平台上,女性被系统地描绘成比男性年轻。对 140 万张图像和视频以及 9 个大型语言模型的分析发现,在 3,495 个职业和社会类别中,女性始终显得比男性年轻,其中在高地位、高收入职业中扭曲最为严重。
  • 算法放大了这种年龄性别偏见。当 ChatGPT 生成近 40,000 份简历时,它假设女性更年轻(年轻 1.6 岁),工作经验也更少,并认为年长的男性申请者更有资格——尽管现实世界的数据显示,劳动力中男性和女性之间没有系统性的年龄差异。
  • 这会产生一个有问题的反馈循环,扭曲现实。研究人员发现,在网上查看与职业相关的图片的人采用了他们所看到的有偏见的年龄假设,这可能会产生一种自我实现的预言,从而强化刻板印象并扩大劳动力市场的现实差距。

“为了对抗普遍存在的文化不平等,”德莱库尔说,“第一步是认识到刻板印象是如何融入我们的文化、算法和思维中的。”

– 要对抗普遍存在的文化不平等,第一步是认识到刻板印象是如何融入我们的文化、算法和思维中的。 –

—Solène Delecourt,加州大学伯克利分校哈斯分校

阅读全文:

在线媒体和大型语言模型中的年龄和性别扭曲
自然,2025 年 10 月 8 日

作者:

该项目的资金来自:

关于《女性在网上被描绘成比男性年轻,人工智能放大了这种偏见 - 哈斯新闻 |伯克利哈斯》的评论


暂无评论

发表评论

摘要

加州大学伯克利分校哈斯分校、斯坦福大学和牛津/自治大学的研究人员记录了在线媒体中广泛的年龄和性别扭曲现象。《自然》杂志上发表的一项研究发现,在 140 万张图像和视频以及 9 个大型语言模型中,女性始终被描绘成比男性年轻。这种偏见在地位高、收入高的职业中尤其明显,并且被 ChatGPT 等算法放大,该算法假设女性更年轻、经验更少,而对年长的男性申请人给予更有利的评价。该研究揭示了一个有问题的反馈循环,其中网络偏见强化了刻板印象,并扩大了劳动力市场的现实差距。