人工智能可以承担许多功能,包括编码、研究、改进业务运营和寻找晚餐食谱。但它对于引导这次总统选举也同样有用吗?
美联社、NORC 公共事务研究中心和 USAFacts 9 月份的一项民意调查发现,约三分之二的美国成年人对人工智能产生可靠信息缺乏信心。为了测试这一点,首都新闻服务向ChatGPT-4(当前免费版本的聊天机器人)询问了有关即将举行的总统选举的简单问题,并咨询了两位专家来衡量答案的准确性。
实验结果好坏参半。虽然 ChatGPT 提供的基线概述可能具有教育意义,但在快速变化的政治气候中盲目信任该技术的缺陷是显而易见的。特别是,ChatGPT 错误地声称没有举行总统辩论,并且截至本月前总统唐纳德·特朗普尚未被判犯有任何罪行。该聊天机器人还提供了过时的信息和一些无法验证的来源。
– 我的一个学生说这是一台现状机器。它真的很擅长发现流行的内容并重复它,”乔治华盛顿大学媒体与公共事务学院政治传播伦理项目的创始主任彼得·洛格(Peter Loge)说。“不幸的是,流行的内容往往不准确,并且无法解释新信息。”
向 ChatGPT 提出的问题涵盖以下内容: 可能决定选举结果的问题;每个候选人的优点和缺点;9 月 10 日民主党副总统卡马拉·哈里斯 (Kamala Harris) 与共和党总统候选人特朗普 (Trump) 举行的总统辩论的获胜者;10 月 1 日,哈里斯竞选伙伴明尼苏达州州长蒂姆·沃尔兹 (Tim Walz) 与特朗普竞选伙伴俄亥俄州参议员 JD 万斯 (JD Vance) 之间的副总统辩论的获胜者。
中枢神经系统多次向 ChatGPT 询问相同的基本问题,期待与政治专家进行讨论。每次的结果都略有不同,但答案的主题是一致的。
当 中枢神经系统10 月 14 日,ChatGPT 向 ChatGPT 询问 2024 年大选中哪些问题最重要,给出了 10 个问题(排名不分先后)。名单中包括:
乔治城大学麦考特公共政策学院副教授兼该校海量数据研究所副研究教授 Loge 和 Thessalia Merivaki 表示,这些问题基本上是正确的。
“这些都是选民关心的问题,”洛格说。“根据我从皮尤研究中心和盖洛普看到的情况,是的,人们关心这些东西。”
梅里瓦基表示,结果在很大程度上反映了共识,但令人惊讶的是没有提及国债。
“关于特朗普提议的减税和增加国债的讨论有很多,”梅里瓦基说。
当被问及 Harris 截至 10 月 14 日的优势和劣势时,ChatGPT 做出了以下回应:哈里斯的优势
历史意义:哈里斯是第一位女性、第一位黑人和第一位南亚副总统,赋予她独特的形象和吸引力,尤其是对少数群体和女性而言。
哈里斯的弱点
关于 Harris 的大部分言论都代表了使用 ChatGPT 或任何人工智能信息的潜在风险,尤其是 Harris 的弱点,Loge 表示其中许多弱点已经过时。在优势方面也有一些不准确和过时的措辞例子,包括 ChatGPT 在筹款和政党支持类别下说“如果哈里斯成为提名人”。
洛格发现民意调查数字低、领导力认知和竞选技能类别存在问题。他认为,她在许多民意调查中领先特朗普,近几个月在政策上采取了强硬立场,自今年夏天成为民主党旗手以来,她激励了数千人。
“如果 GPT 只是查看所有可用信息并提取最可用的信息,它就会错过这一点,”Loge 说。“她担任司法部长、[2020] 总统候选人和副总统的时间比她过去 10 周里竞选热门候选人的时间要多得多。”
当被问及在哪里找到有关 Harris 弱点的信息时,ChatGPT 引用了 5 篇文章,全部来自 2023 年。中枢神经系统向 ChatGPT 询问每篇文章的 URL。它们都不能正常工作。
其中一篇文章 中枢神经系统无法核实是否有一篇所谓的《Politico》文章,题为“你现在已跻身大联盟了”:卡马拉·哈里斯的内心世界——副总统的令人沮丧的开局”,发表于 2023 年 10 月 11 日,更多在她担任这个角色后不到 2 1/2 年。
当被问及截至 10 月 14 日特朗普的优势和劣势时,ChatGPT 的回应如下:特朗普的优势
强大的支持基础:特朗普拥有深厚的忠实支持者基础。
争议和法律挑战:特朗普面临众多法律挑战,包括与选举干预、商业行为等相关的起诉和调查。
美国有线电视新闻网 (CNN) 报道称,10 月初,特朗普的竞选团队手头有 2.85 亿美元,比哈里斯少了 6100 万美元,哈里斯自 7 月参加竞选以来,在筹款方面一直击败特朗普。
– 筹款活动陷入困境。
他过去曾筹集过一大笔资金,”洛格说。“他们在筹款方面落后于哈里斯和沃尔兹,最近的报道称特朗普在闭门会议上失去了理智。”
洛奇说,虽然特朗普的言论存在争议,但他在黑人和西班牙裔选民中的表现比共和党内的前任要好得多。
《纽约时报》和锡耶纳学院最近的一项民意调查显示,哈里斯在黑人选民中以 78% 比 15% 的支持率领先,在西班牙裔选民中则以 56% 比 37% 的支持率领先。根据罗珀民意研究中心的数据,2012 年,共和党人米特·罗姆尼获得了 6% 的黑人选票和 27% 的西班牙裔选票。
“他的表现比过去的共和党人要好,”洛格说。– 根据过去的共和党候选人的说法,这是一种相对优势;与民主党候选人相比,这是一个相对弱点。”
当被问及截至 10 月 14 日为止 Walz 的优势和劣势时,ChatGPT 做出了以下回应:沃尔扎的优势
行政经验:自 2019 年起担任明尼苏达州州长,沃尔兹在管理政府、应对危机和应对州级政策挑战方面拥有行政领导经验。
有限的全国形象:与更知名的政治人物相比,沃尔兹在全国范围内的影响力或知名度并不高。
洛格还表示,ChatGPT 对沃尔兹的评价基本上是准确的,尽管沃尔兹州长的军事背景一直是包括万斯在内的一些知名共和党人批评的目标。
洛格表示,这次回顾也缺乏让明尼苏达州州长受到如此多选民喜爱的因素。
“蒂姆·沃尔兹的优势在于他令人难以置信,”洛奇说。——他是一个中产阶级,喜欢开玩笑的无聊老爸。我认为蒂姆·沃尔兹最大的优势在于他就是蒂姆·沃尔兹。”
当被问及截至 10 月 14 日 Vance 的优势和劣势时,ChatGPT 做出了以下回应:万斯的优势
文化相关性:万斯凭借他的畅销回忆录获得了全国关注, 乡巴佬挽歌
被认为反复无常:万斯因观点转变而受到批评。
“华尔兹和万斯[结果]都非常有帮助,”梅里瓦基说,他警告说,答案没有附有引用。
洛格表示,他将风险资本主义视为弱点的说法可能有些夸张。事实上,洛格相信他与 PayPal 联合创始人、亿万富翁彼得·蒂尔的关系实际上是一种优势。
“JD 万斯之所以被列入候选名单,是因为他可以回应特朗普的信息,但要以一种有纪律的方式,”洛奇说。“当特朗普讲话时,他知道要闭嘴,而且他可以接触到很多很多富人,而且他做了所有这些事情。”
ChatGPT 遵循政治观察家的共识,即哈里斯在 9 月 10 日的总统辩论中获胜,同时断言万斯在副总统辩论中的表现优于沃尔兹。
然而,当 10 月 14 日最初被问到“谁赢得了卡马拉·哈里斯和唐纳德·特朗普之间的总统辩论”时,ChatGPT 回答说没有发生辩论。
“如果哈里斯和特朗普成为 2024 年大选的提名人,那么他们可能会互相辩论,”ChatGPT 表示。“但是,由于这种情况尚未发生,因此在直接辩论中,两者之间没有明确的“赢家”。”
当问题被澄清说哈里斯和特朗普9月10日的辩论时,ChatGPT给出了详细的回答,提到哈里斯多次迫使特朗普进行防守,并重点讨论了他的刑事指控和2020年大选的问题。
Merivaki 做了自己的实验,她向 ChatGPT、Claude 3.5 Sonnet 和 Gemini AI 系统询问有关选举的问题。根据梅里瓦基分享的电子表格,双子座表示,它目前对回应有关选举和政治人物的信息没有帮助,因为它可能会犯错误。
当梅里瓦基询问特朗普五月封口费审判的结果时,ChatGPT 和克劳德都表示,特朗普没有被定罪,尽管事实恰恰相反。
克劳德表示,其对此次审判的“最后一次信息更新”是在四月份,即特朗普被定罪之前。基本的 ChatGPT-4 没有这样的免责声明,而 ChatGPT Omni(功能扩展的语言模型版本)包含有关特朗普 5 月 34 日定罪的正确信息。
中枢神经系统向基本模型和 Omnion 询问了特朗普的定罪情况,发现 Omni 提供了事实上正确的信息,而更广泛使用的免费模型又出现了错误。
“截至 2024 年 10 月,唐纳德·特朗普尚未被判犯有任何罪行,但他面临着几起备受瞩目的民事和刑事法律案件,”ChatGPT-4 模型表示。
经过多次追问,并收到美联社有关定罪的文章,基本版本终于提供了信息。
当消费者使用 ChatGPT 时,它会在屏幕底部提供警告: – ChatGPT 可能会出错。检查重要信息。
梅里瓦基表示,在政治方面尤其如此,他敦促公民阅读新闻并跟随当地选举官员学习如何最好地投票。
“对于这些广泛的比较,因为候选人是如此不同,我们将得到的摘要非常有帮助,”梅里瓦基说。“但是,当涉及到……有关本周期中非常有争议的讨论主题的更详细提示时,我真的想知道我们将获得多少详细信息。”
首都新闻社是一个由学生主导的新闻组织,由马里兰大学菲利普·梅里尔新闻学院运营。