作者:Vladimir Hedrih
对ChatGPT发布后的前三个月内数百万条英语推文的分析显示,尽管普通公众对该强大新工具表示兴奋,但也对其可能被滥用产生了担忧。负面观点提出了对其可信度、潜在偏见、伦理问题以及数据标注员和程序员就业权利相关的问题。另一方面,正面看法则强调了其在各个领域潜在应用的兴奋之情。该论文发表于PLOS ONE.
ChatGPT是由OpenAI开发的高级人工智能语言模型,旨在根据用户输入理解并生成类似人类的文本。它于2022年11月作为GPT-3.5架构的一部分首次向公众发布,并后来通过如GPT-4等版本进行增强。ChatGPT能够执行多种任务,例如回答问题、提供解释、生成文本、提供建议和协助解决问题。它使用深度学习技术预测最相关的响应,使其能够在广泛的主题上开展互动对话。该模型在包括书籍、文章和在线内容在内的大型数据集上进行了训练,从而能够生成连贯且符合上下文的回应。
尽管在许多领域都很有用,但ChatGPT存在一些局限性,例如偶尔会提供不准确或有偏见的信息,或者生成完全虚构的回复(被称为AI幻觉)。它已被应用于教育、客户服务和内容创作等不同领域。
当ChatGPT首次推出时,其受欢迎程度迅速上升,一个月内用户数量就达到了一亿。从那时起,许多公司开发了新的AI语言模型。然而,可以说ChatGPT引发了工作场所的AI革命,激起了关于AI的广泛讨论,并促使人们对其影响形成各种不同的看法。
研究人员刘本 Ng 和 Ting Yu Joanne Chow 意在分析公众对 ChatGPT 初始认知的热情和情感。他们研究了一组数据集,其中包含 420 万条提及 ChatGPT 的推文,这些推文发布于 2022 年 12 月 1 日至 2023 年 3 月 1 日期间——即 ChatGPT 发布后的前三个月。研究人员旨在识别最常讨论的问题和主题以及关于 ChatGPT 推文中最常见的关键词和情感。
该研究从两个方面分析了数据集。首先,研究人员专注于识别Twitter上关于ChatGPT的活动显著增加的时间段,即推文、回复和转发数量异常高的时期,并分析用户在这些时间段内的言论内容。他们收集并分析了这些时期的前100条互动最多的推文。其次,他们每周确定表达对ChatGPT持积极、中立或消极态度的关键词。
结果显示,在研究期间推特上有23个活动高峰。第一个高峰出现在ChatGPT发布后仅5天用户数就突破了500万,反映了人们对这一新工具的初始关注和谨慎态度。第二个高峰主要集中在讨论ChatGPT的潜在用途上。随后的高峰分别探讨了它在学术环境中的应用价值、检测偏见的能力、哲学思想实验、其道德可接受性以及作为人类镜子的角色。
关键词分析显示,最常见的负面术语表达了对ChatGPT的可信度的关注(例如,幻觉、疯狂循环、认知失调、知识有限、简单错误、过度自信、误导),生成回复中隐含的偏见(例如,偏见、误导、政治偏见、翼偏见、宗教偏见),环境伦理(例如,化石燃料),数据标注员的就业权利(例如,外包工人、调查),以及关于使用基于现有作品训练的神经网络是否道德的相邻辩论(例如,被盗艺术品、最小努力)。
积极和中性关键词表达了对各种可能性的兴奋(例如,巨大的突破、最大的技术创新),特别是在编码方面(例如,良好的调试伴侣、极其有用、代码),作为创意工具(例如,内容创作超级力量、文案工作者),在教育领域(例如,课程计划、论文、本科论文、学术目的、语法检查器),以及个人使用(例如,锻炼计划、饮食计划、卡路里目标、个性化会议模板)。
研究作者总结道:“总体而言,情绪和主题是双刃剑,既表达了对这一强大新工具的兴奋之情,也表现出对其潜在滥用风险的警惕。”
该研究提供了关于ChatGPT的公共讨论的历史分析,颇具趣味。然而值得注意的是,这项研究仅关注了英文推文,而广泛的讨论很多发生在Twitter以外以及非英语语言环境中。
论文“强大的工具还是过于强大?关于ChatGPT的早期公共讨论跨越了400万条推特。本文由刘本和 Ting Yu Joanne Chow 撰写。