基本事实和公然错误:人工智能对总统选举的评价

2024-11-03 15:10:23 英文原文

人工智能可以承担许多功能,包括编码、研究、改进业务运营和寻找晚餐食谱。但它对于引导这次总统选举也同样有用吗?

美联社、NORC 公共事务研究中心和 USAFacts 9 月份的一项民意调查发现,约三分之二的美国成年人对人工智能产生可靠信息缺乏信心。为了测试这一点,首都新闻服务向ChatGPT-4(当前免费版本的聊天机器人)询问了有关即将举行的总统选举的简单问题,并咨询了两位专家来衡量答案的准确性。

实验结果好坏参半。虽然 ChatGPT 提供的基线概述可能具有教育意义,但在快速变化的政治气候中盲目信任该技术的缺陷是显而易见的。特别是,ChatGPT 错误地声称没有举行总统辩论,并且截至本月前总统唐纳德·特朗普尚未被判犯有任何罪行。该聊天机器人还提供了过时的信息和一些无法验证的来源。

– 我的一个学生说这是一台现状机器。它真的很擅长发现流行的内容并重复它,”乔治华盛顿大学媒体与公共事务学院政治传播伦理项目的创始主任彼得·洛格(Peter Loge)说。“不幸的是,流行的内容往往不准确,并且无法解释新信息。”

向 ChatGPT 提出的问题涵盖以下内容: 可能决定选举结果的问题;每个候选人的优点和缺点;9 月 10 日民主党副总统卡马拉·哈里斯 (Kamala Harris) 与共和党总统候选人特朗普 (Trump) 举行的总统辩论的获胜者;10 月 1 日,哈里斯竞选伙伴明尼苏达州州长蒂姆·沃尔兹 (Tim Walz) 与特朗普竞选伙伴俄亥俄州参议员 JD 万斯 (JD Vance) 之间的副总统辩论的获胜者。

围绕选举的问题 

中枢神经系统多次向 ChatGPT 询问相同的基本问题,期待与政治专家进行讨论。每次的结果都略有不同,但答案的主题是一致的。

当 中枢神经系统10 月 14 日,ChatGPT 向 ChatGPT 询问 2024 年大选中哪些问题最重要,给出了 10 个问题(排名不分先后)。名单中包括:

  • 经济:通货膨胀和生活成本,以及围绕工资增长和劳动力未来的问题
  • 医疗保健:堕胎、医疗保健的获取和负担能力
  • 气候变化:可再生能源、化石燃料、能源价格上涨以及向清洁能源的过渡
  • 移民:边境安全和移民政策
  • 犯罪和公共安全:犯罪率和围绕警察改革的持续辩论
  • 教育:围绕批判种族理论和 LGBTQ+ 包容性、教师短缺和高等教育成本的课程争论
  • 枪支管制:持续的大规模枪击事件、枪支管制和第二修正案辩论
  • 投票权和选举诚信:围绕 2020 年的辩论、选民欺诈和对选区划分的担忧
  • 外交政策:中东紧张局势、俄罗斯和乌克兰以及对华贸易
  • 技术和数据隐私:言论自由和社交媒体以及监管技术和人工智能

乔治城大学麦考特公共政策学院副教授兼该校海量数据研究所副研究教授 Loge 和 Thessalia Merivaki 表示,这些问题基本上是正确的。

“这些都是选民关心的问题,”洛格说。“根据我从皮尤研究中心和盖洛普看到的情况,是的,人们关心这些东西。”

梅里瓦基表示,结果在很大程度上反映了共识,但令人惊讶的是没有提及国债。

“关于特朗普提议的减税和增加国债的讨论有很多,”梅里瓦基说。

Democratic presidential nominee Vice President Kamala Harris speaks at a campaign rally, Wednesday, Oct. 30, 2024, in Raleigh, N.C. (AP Photo/Allison Joyce)
民主党总统候选人副总统卡马拉·哈里斯于 10 月 30 日在北卡罗来纳州罗利举行的竞选集会上发表讲话。(艾莉森·乔伊斯/美联社)

当被问及 Harris 截至 10 月 14 日的优势和劣势时,ChatGPT 做出了以下回应:哈里斯的优势

历史意义:哈里斯是第一位女性、第一位黑人和第一位南亚副总统,赋予她独特的形象和吸引力,尤其是对少数群体和女性而言。

  • 经验:作为前加州总检察长、美国参议员、现任副总统哈里斯拥有丰富的履历,在执法、治理、外交和立法程序方面拥有丰富的经验。
  • 进步人士的吸引力:哈里斯吸引了许多进步人士,特别是在刑事司法改革、医疗保健和气候变化等问题上。
  • 她在社会正义、妇女权利和投票权方面的立场使她受到某些民主党团体的喜爱。
  • 竞选技巧:哈里斯以其尖锐的辩论和提问风格而闻名,这在参议院听证会和竞选活动中非常明显。
  • 筹款和政党支持:作为现任副总统,哈里斯拥有重要的政党支持并有能力筹集大量资金。如果她成为提名人,民主党建制派可能会团结起来支持她。

哈里斯的弱点

  • 民意调查数字和支持率低:哈里斯即使担任副总统,也一直在与持续低的支持率作斗争。一些民意调查显示,大部分选民对她持负面看法。
  • 对领导力的看法:党内外的批评者有时质疑她的领导力和政治敏锐性。
  • 关键问题的处理:哈里斯因其如何处理分配给她的关键任务而面临审查,例如评估美国-墨西哥边境的移民政策。
  • 适度进步的紧张局势:一些左翼人士批评她作为检察官的记录,认为她在刑事司法问题上过于强硬。
  • 竞选风格:一些批评者认为哈里斯缺乏激发大批群众的魅力或强烈的修辞风格。

关于 Harris 的大部分言论都代表了使用 ChatGPT 或任何人工智能信息的潜在风险,尤其是 Harris 的弱点,Loge 表示其中许多弱点已经过时。在优势方面也有一些不准确和过时的措辞例子,包括 ChatGPT 在筹款和政党支持类别下说“如果哈里斯成为提名人”。

洛格发现民意调查数字低、领导力认知和竞选技能类别存在问题。他认为,她在许多民意调查中领先特朗普,近几个月在政策上采取了强硬立场,自今年夏天成为民主党旗手以来,她激励了数千人。

“如果 GPT 只是查看所有可用信息并提取最可用的信息,它就会错过这一点,”Loge 说。“她担任司法部长、[2020] 总统候选人和副总统的时间比她过去 10 周里竞选热门候选人的时间要多得多。”

当被问及在哪里找到有关 Harris 弱点的信息时,ChatGPT 引用了 5 篇文章,全部来自 2023 年。中枢神经系统向 ChatGPT 询问每篇文章的 URL。它们都不能正常工作。

其中一篇文章 中枢神经系统无法核实是否有一篇所谓的《Politico》文章,题为“你现在已跻身大联盟了”:卡马拉·哈里斯的内心世界——副总统的令人沮丧的开局”,发表于 2023 年 10 月 11 日,更多在她担任这个角色后不到 2 1/2 年。

Former U.S. President Donald Trump speaks at a campaign rally on May 1, 2024, in Waukesha, Wisconsin. A recent poll has Trump and President Joe Biden tied in the state. (Scott Olson/Getty Images/TNS)
美国前总统唐纳德·特朗普 5 月 1 日在威斯康星州沃克夏举行的竞选集会上发表讲话。(斯科特·奥尔森/盖蒂图片社/TNS)

当被问及截至 10 月 14 日特朗普的优势和劣势时,ChatGPT 的回应如下:特朗普的优势

强大的支持基础:特朗普拥有深厚的忠实支持者基础。

  • 民粹主义吸引力:特朗普的反建制言论和民粹主义信息引起了很大一部分感觉被传统政治抛在后面的选民的共鸣。
  • 久经考验的筹款和媒体头脑:特朗普是筹款大国,并表现出主导媒体周期的能力,通过社交媒体、集会和传统媒体吸引注意力。
  • 经济记录:许多选民认为特朗普在新冠肺炎 (COVID-19) 大流行之前担任总统的头三年里表现强劲。
  • 作为前总统的经历:已经任职了一个任期的特朗普被许多人视为一位知道如何驾驭局势的领导者 
  • 系统特朗普的弱点

争议和法律挑战:特朗普面临众多法律挑战,包括与选举干预、商业行为等相关的起诉和调查。

  • 两极分化:他的政治风格往往会疏远和吸引很多人。
  • 1 月 6 日和否认选举:特朗普在 1 月 6 日美国国会大厦骚乱中所扮演的角色以及他对 2020 年选举的持续虚假陈述可能会损害他的可信度。
  • 选民疲劳:一些共和党选民可能会对围绕特朗普的持续争议感到疲劳,并可能在党内寻找新面孔。
  • 在关键人口统计方面的弱点:特朗普在女性、年轻选民和少数族裔等关键投票群体中遇到了困难。
  • 梅里瓦基没有对特朗普的调查结果提出任何反对意见,而洛格则反对将筹款作为一种优势,并部分不同意这位前总统在关键人口统计方面存在弱点。

美国有线电视新闻网 (CNN) 报道称,10 月初,特朗普的竞选团队手头有 2.85 亿美元,比哈里斯少了 6100 万美元,哈里斯自 7 月参加竞选以来,在筹款方面一直击败特朗普。

– 筹款活动陷入困境。

他过去曾筹集过一大笔资金,”洛格说。“他们在筹款方面落后于哈里斯和沃尔兹,最近的报道称特朗普在闭门会议上失去了理智。”

洛奇说,虽然特朗普的言论存在争议,但他在黑人和西班牙裔选民中的表现比共和党内的前任要好得多。

《纽约时报》和锡耶纳学院最近的一项民意调查显示,哈里斯在黑人选民中以 78% 比 15% 的支持率领先,在西班牙裔选民中则以 56% 比 37% 的支持率领先。根据罗珀民意研究中心的数据,2012 年,共和党人米特·罗姆尼获得了 6% 的黑人选票和 27% 的西班牙裔选票。

“他的表现比过去的共和党人要好,”洛格说。– 根据过去的共和党候选人的说法,这是一种相对优势;与民主党候选人相比,这是一个相对弱点。”

Democratic vice presidential nominee Minnesota Gov. Tim Walz speaks at an event Tuesday, Oct. 22, 2024, in Madison, Wis. (AP Photo/Morry Gash)
民主党副总统候选人明尼苏达州州长蒂姆·沃尔兹 (Tim Walz) 于 10 月 22 日在威斯康星州麦迪逊市举行的一次活动中发表讲话。(莫里·加什/美联社)

当被问及截至 10 月 14 日为止 Walz 的优势和劣势时,ChatGPT 做出了以下回应:沃尔扎的优势

行政经验:自 2019 年起担任明尼苏达州州长,沃尔兹在管理政府、应对危机和应对州级政策挑战方面拥有行政领导经验。

  • 军事背景:沃尔兹在国民警卫队服役 24 年,以军士长身份退役。
  • 吸引农村和城市选民:沃尔兹曾在国会代表农村地区,拥有吸引农村和城市选民的经验。
  • 进步治理:沃尔兹以支持进步政策而闻名,但他也被认为是务实的,在必要时跨越党派界限。
  • 在明尼苏达州的受欢迎程度:沃尔兹在明尼苏达州保持着稳固的支持率。
  • 沃尔扎的弱点

有限的全国形象:与更知名的政治人物相比,沃尔兹在全国范围内的影响力或知名度并不高。

  • 处理内乱:沃尔兹因其对乔治·弗洛伊德抗议活动和随后明尼阿波利斯内乱的反应而受到批评。
  • 政策看法:虽然沃尔兹支持进步事业,但他并不被视为国家进步问题的领军人物。
  • 党派紧张局势:明尼苏达州政治在他任职期间变得更加两极分化,受到共和党的尖锐批评。
  • 梅里瓦基表示,她没有发现任何错误。

洛格还表示,ChatGPT 对沃尔兹的评价基本上是准确的,尽管沃尔兹州长的军事背景一直是包括万斯在内的一些知名共和党人批评的目标。

洛格表示,这次回顾也缺乏让明尼苏达州州长受到如此多选民喜爱的因素。

“蒂姆·沃尔兹的优势在于他令人难以置信,”洛奇说。——他是一个中产阶级,喜欢开玩笑的无聊老爸。我认为蒂姆·沃尔兹最大的优势在于他就是蒂姆·沃尔兹。”

Republican vice presidential nominee Sen. JD Vance, R-Ohio, speaks at a campaign rally, Monday, Aug. 19, 2024, at DiSorb Systems, Inc. in Philadelphia. (AP Photo/Chris Szagola)
共和党副总统候选人、俄亥俄州共和党参议员 JD Vance 于 8 月 19 日在费城 DiSorb Systems Inc. 举行的竞选集会上发表讲话。(美联社照片/克里斯·萨戈拉)

当被问及截至 10 月 14 日 Vance 的优势和劣势时,ChatGPT 做出了以下回应:万斯的优势

文化相关性:万斯凭借他的畅销回忆录获得了全国关注, 乡巴佬挽歌

  • 他在阿巴拉契亚一个贫穷的工人阶级家庭长大并走向成功的故事吸引了重视美国梦理念的选民。吸引工人阶级选民:万斯与俄亥俄州和其他所谓“铁锈地带”州工人阶级和农村选民的联系给了他一个优势。
  • 来自共和党建制派的支持:万斯在成功的参议院竞选中获得了唐纳德·特朗普的支持。
  • 局外人身份:尽管万斯拥有耶鲁大学法学院毕业生的精英资格并从事风险投资工作,但他一直保持着局外人的形象。
  • 敏锐的修辞技巧:万斯是一位善于表达的演讲者和辩论家。
  • 万斯的弱点

被认为反复无常:万斯因观点转变而受到批评。

  • 万斯最初直言不讳地批评特朗普,后来接受了特朗普的政策并寻求他的支持。
  • 缺乏从政经验:2022年当选参议员的万斯执政经验有限;
  • 意识形态极端主义:万斯的一些言论,例如他对堕胎和社会问题的评论,可能会疏远温和派或独立选民。
  • 与风险投资的联系:他在风险投资方面的工作可能会被用来对付他。
  • 两极分化和文化战争:万斯在种族、性别和移民等文化问题上一直直言不讳,所采取的立场可能会引起共和党基础的共鸣,但可能会疏远更广泛的受众。

“华尔兹和万斯[结果]都非常有帮助,”梅里瓦基说,他警告说,答案没有附有引用。

洛格表示,他将风险资本主义视为弱点的说法可能有些夸张。事实上,洛格相信他与 PayPal 联合创始人、亿万富翁彼得·蒂尔的关系实际上是一种优势。

“JD 万斯之所以被列入候选名单,是因为他可以回应特朗普的信息,但要以一种有纪律的方式,”洛奇说。“当特朗普讲话时,他知道要闭嘴,而且他可以接触到很多很多富人,而且他做了所有这些事情。”

争论和更多错误 

ChatGPT 遵循政治观察家的共识,即哈里斯在 9 月 10 日的总统辩论中获胜,同时断言万斯在副总统辩论中的表现优于沃尔兹。

然而,当 10 月 14 日最初被问到“谁赢得了卡马拉·哈里斯和唐纳德·特朗普之间的总统辩论”时,ChatGPT 回答说没有发生辩论。

“如果哈里斯和特朗普成为 2024 年大选的提名人,那么他们可能会互相辩论,”ChatGPT 表示。“但是,由于这种情况尚未发生,因此在直接辩论中,两者之间没有明确的“赢家”。”

当问题被澄清说哈里斯和特朗普9月10日的辩论时,ChatGPT给出了详细的回答,提到哈里斯多次迫使特朗普进行防守,并重点讨论了他的刑事指控和2020年大选的问题。

Merivaki 做了自己的实验,她向 ChatGPT、Claude 3.5 Sonnet 和 Gemini AI 系统询问有关选举的问题。根据梅里瓦基分享的电子表格,双子座表示,它目前对回应有关选举和政治人物的信息没有帮助,因为它可能会犯错误。

当梅里瓦基询问特朗普五月封口费审判的结果时,ChatGPT 和克劳德都表示,特朗普没有被定罪,尽管事实恰恰相反。

克劳德表示,其对此次审判的“最后一次信息更新”是在四月份,即特朗普被定罪之前。基本的 ChatGPT-4 没有这样的免责声明,而 ChatGPT Omni(功能扩展的语言模型版本)包含有关特朗普 5 月 34 日定罪的正确信息。

中枢神经系统向基本模型和 Omnion 询问了特朗普的定罪情况,发现 Omni 提供了事实上正确的信息,而更广泛使用的免费模型又出现了错误。

“截至 2024 年 10 月,唐纳德·特朗普尚未被判犯有任何罪行,但他面临着几起备受瞩目的民事和刑事法律案件,”ChatGPT-4 模型表示。

经过多次追问,并收到美联社有关定罪的文章,基本版本终于提供了信息。

当消费者使用 ChatGPT 时,它会在屏幕底部提供警告: – ChatGPT 可能会出错。检查重要信息。

梅里瓦基表示,在政治方面尤其如此,他敦促公民阅读新闻并跟随当地选举官员学习如何最好地投票。

“对于这些广泛的比较,因为候选人是如此不同,我们将得到的摘要非常有帮助,”梅里瓦基说。“但是,当涉及到……有关本周期中非常有争议的讨论主题的更详细提示时,我真的想知道我们将获得多少详细信息。”

首都新闻社是一个由学生主导的新闻组织,由马里兰大学菲利普·梅里尔新闻学院运营。

关于《基本事实和公然错误:人工智能对总统选举的评价》的评论


暂无评论

发表评论

摘要

根据所提供的信息和分析,以下是有关 JD 万斯作为 2024 年潜在总统候选人的优势和劣势的关键要点:**优点:**1. **对工薪阶层选民的吸引力:** 他的背景和故事引起了那些因经济变革而感到落后并相信美国梦的选民的共鸣。2. **共和党建制派的支持:** 他已经获得了唐纳德·特朗普等关键人物的支持,这对于赢得党内坚定支持者的支持至关重要。3. **局外人形象:** 尽管他受过精英教育并在风险投资领域拥有职业生涯,但他仍然保持着与普通美国人而不是政治机构有联系的形象。4. **修辞技巧:** 他被认为是一位敏锐的辩论家和口才好的演讲者,这可以帮助他在辩论和演讲中与选民建立联系。**缺点:**1. **被认为反复无常:**因在各种问题上改变观点而受到批评,特别是与唐纳德·特朗普的政策有关的观点。2. **缺乏政治经验:** 2022年当选参议员,他在治理和政策执行方面的经验有限。3. **意识形态极端主义:** 他在堕胎等社会问题上的立场可能会疏远温和派或独立选民,否则他们可能会支持共和党候选人。4. **风险投资联系:** 反对者可能会利用这种背景来反对他,强调与他的农村根源的对比。5. **两极分化的言论:** 强调文化和身份政治可以在他的支持者内部产生强烈共鸣,但可能会令更广泛的选民失去兴趣,包括摇摆选民。**附加上下文:**- 批评者认为万斯与风险资本主义的关系可能是一种负担,尽管一些支持者将其视为一种资产。- 他在辩论(如副总统辩论)中的表现得到了一些观察家的积极评价,尽管偶尔也会出现失误。总而言之,JD 万斯为他的候选资格带来了令人信服的叙事和修辞能力,但必须克服与感知不一致、有限的政治经验和两极分化言论相关的潜在陷阱。在他寻求 2024 年总统选举的共和党提名时,这些因素将在塑造选民的看法方面发挥关键作用。