AI 分析了 790 万条演讲,发现了人类意想不到的事情

2025-10-08 19:49:36 英文原文

作者:ByJordan JosephEarth.com staff writer

AI analyzed 7.9 million speeches and discovered something unexpected about humans

10-08-2025

一项新的研究着眼于词义如何变化,并询问当这种变化发生时谁真正改变了他们的语言。研究发现,所有年龄段的成年人都倾向于一起移动,年轻说话者和年长说话者之间只有很小的延迟。

工作重点是语义变化,这是一个词的含义在日常使用中上升或下降的方式。

EarthSnap

标题结果很简单,但有点令人惊讶:老年人通常会在年轻人的几年内接受新的含义。

人类语言和词义

主要作者高拉夫·卡马斯麦吉尔大学 ()和他的团队想要测试语言学中的一个经典主张。

年长的说话者是否会继续按照他们年轻时学到的方式说话,或者他们会随着周围语言的变化而更新他们的用法吗?

该团队专注于意义,而不是声音或语法。他们询问一个词的主导意义的变化是否实时传播到所有年龄段。

他们还检查了某一时刻的年龄差异是否真正反映了深刻的代际鸿沟。或者,随着不同年龄段的人对同一文化时刻的反应,这些差异是否会消失。

他们的问题很重要,因为许多研究都使用横截面快照。如果成年人在一生中不断发生变化,那么这些快照可能会误导研究人员关于变化发生的速度。

测试理论

研究人员分析了 1873 年至 2010 年间发表的 790 万篇美国国会演讲。他们从公开场合提取了文本。数据集国会辩论持续了一个多世纪。

他们使用开放式模型将每次演讲与演讲者发表时的年龄进行匹配数据库。这种连接让他们能够跟踪使用模式在不同年份和年龄之间的变化。

该团队确定了大约 100 个可能在 20 世纪改变含义的单词。然后他们询问使用每种感觉的概率如何随着时间的推移而上升或下降。

这个设置提供了异常强烈的测试。它保持场地不变,追踪了数千名指定的发言者,并涵盖了近 140 年的公共语言。

模型做了什么

为了检测单词在上下文中的含义,该团队使用了一个蒙版语言模型(MLM)来预测适合上下文的替代品。他们将这些预测聚类为每个单词的可解释含义。

他们模拟了每种感觉在历年中如何上升或下降,同时也考虑了说话者的年龄。核心问题是,年龄是否会在接受新的意义方面造成持续的滞后。

他们使用广义加性混合模型(GAMM)来估计一段时间内的平滑趋势,同时吸收个人水平的变化。然后,他们对所有单词进行贝叶斯荟萃分析,以总结平均年龄效应。

这种方法让他们将两件事分开。一是时代整体潮流。另一个是与说话者年龄相关的任何额外延迟。

结果显示什么

主要模式是多年来的共同转变,而不是从一代人到另一代人的硬交接。老年人往往比年轻人平均落后大约两到三年。

在某些情况下,年长的演讲者甚至引领了这一变革。例如,卫星的地缘政治意识在冷战期间上升,而年长的成员往往是早期采用者。

作者还追踪了使用相同方法的多产个体单词在他们的职业生涯中多次出现。这些说话者在他们的一生中改变了他们的用法,这与人口模式相匹配。

“简而言之,老年人确实会学到单词的新含义,”卡马斯说。

为什么词义很重要

结果挑战了一种被称为“表观时间”的长期工具,该工具通过比较年轻和年长的说话者在某一时刻的变化来推断变化。

如果较老的扬声器不断更新其用法,表观时间可能会低估已经发生的变化。

研究结果符合时代精神看法,所有年龄段的演讲者都会对社交时刻做出反应,而不仅仅是他们的出生群体。

弗鲁瓦尔德详细讨论的这种对比有助于确定何时预期代际更替以及何时预期跨年龄段的共同流动。

他们还为研究人员指出了一个实际的收获。如果可能,请使用历史数据来测试当前的年龄差异是否稳定或已经缩小。

对于教育者和传播者来说,还有另一个角度。成年人一生都在不断学习意义,因此公共生活中的术语可以快速而广泛地变化。

限制和后续步骤

该数据集涵盖正式环境中的成年专业人士。这就排除了青少年和非常年轻的成年人,他们经常开始改变随意的言语。

国会也不是国家的社会镜子,尤其是在前几十年。长期以来,女性和少数族裔的代表性都不足。

该方法依赖于根据上下文猜测单词含义的模型,这种模型在极少数或模棱两可的情况下可能会出错。这种噪音不会消除主要趋势,但会模糊细节。

“主要结果是,年长的说话者能够高度适应新词义,这本身就令人惊讶,”卡马斯说。

该团队指出,下一步的明确目标是扩展到北美英语之外并添加青少年语音。

该研究发表于美国国家科学院院刊

~~

喜欢你读到的内容吗?订阅我们的时事通讯吸引人的文章、独家内容和最新更新。 

查看我们地球快照,一款免费应用程序,由埃里克·拉尔斯和 Earth.com。

~~

新闻正在向您袭来

每天为您提供有关我们星球的最大新闻

Subscribe

关于《AI 分析了 790 万条演讲,发现了人类意想不到的事情》的评论


暂无评论

发表评论

摘要

《美国国家科学院院刊》上发表的一项新研究表明,老年人在几年内就会像年轻人一样采用新的单词含义,这挑战了之前的假设。麦吉尔大学的研究人员分析了 1873 年至 2010 年间超过 790 万篇美国国会演讲,发现年龄在采用新词义方面只会稍微延迟一些,有些案例显示年长的演讲者引领了这一变化。该研究强调了老年人对语言变化的适应性,并表明横断面研究可能低估了正在进行的语言演变。