他突然收到一封电子邮件:是大学行为准则团队发来的。19 岁的英语本科生阿尔伯特浏览了内容,惊呆了。他被指控使用人工智能来完成一项评估工作。如果他没有参加听证会来解决教授提出的主张,也没有回复电子邮件,他将在该模块上收到自动失败的信息。问题是,他没有作弊。
要求匿名的阿尔伯特心烦意乱。这可能不是他最大的努力,但他在这篇文章上下了很大的功夫。他当然没有使用人工智能来写它:“并因为“路标短语”而受到指责,例如“除了……之外”和“相比之下”,感到非常丢脸。”指控的后果在他的脑海中萦绕不去——如果他没通过这个模块,他可能不得不重新夺回了全年的成绩,但不得不为自己辩护。“因为一篇写得不好的论文,这感觉就像是对我整个模块的辛勤工作的一记耳光,”他说。– 我学习很努力,而且总体上是一名全优学生 – 一篇糟糕的论文突然意味着我使用了人工智能? –
在听证会上,阿尔伯特在三名工作人员面前坐下——其中两名来自他的部门,一名在场旁听。他们告诉他听证会正在录音,并询问他的姓名、学生证和课程代码。然后他就他的任务被盘问了半个小时。距离他提交论文已经过去了几个月,他意识到自己无法像他希望的那样自信地回答问题,但他尽力了。他们问,他是否曾在以下网站创建过帐户:聊天GPT?怎么样语法?直到最后,阿尔伯特都觉得自己无法为自己辩护,此时他已经快要哭了。“我什至向他们承认,我知道这篇文章不好,但我没有使用人工智能,”他说。
自 Chat GPT-3 向全世界发布以来已经过去了四年。它震动了从电影到媒体再到医学的各个行业,教育也不例外。由旧金山创建开放人工智能,它使几乎任何人都可以根据一些基本输入在几秒钟内写出还过得去的书面作品。现在有许多这样的工具可用,例如 Google 的双子座、微软副驾驶,克洛德和困惑。这些大型语言模型就像人脑一样吸收和处理大量数据集,以生成新材料。对于学生来说,这是在最后一刻论文截止日期前最接近仙女教母的机会。然而,对于教育工作者来说,这是一场噩梦。
据一项研究称,超过一半的学生现在使用生成式人工智能来帮助他们进行评估高等教育政策研究所的调查,大约5%的学生承认用它来作弊。十一月,泰晤士高等教育 报道称,尽管“记录保存不完整”,病例数似乎仍在猛增罗素集团一些大学报告称,作弊行为增加了 15 倍。但对于如何使用这些工具(如果有的话)的困惑已经让人们对旨在建立在信任基础上的机构产生了怀疑。有些人认为,人工智能将彻底改变人们的学习方式,使其变得更好,就像 24/7 的个人导师——HAL 教授,如果你愿意的话。对于其他人来说,这是对整个学习系统的生存威胁 – a –教育瘟疫— 作为一篇专栏文章高等教育内部这么说——这将摧毁学术探究的过程。
在努力把这个精灵装回瓶子里的过程中,大学陷入了一场不断升级的技术军备竞赛,甚至求助于人工智能来试图捕捉不当行为。导师们开始攻击学生,学生们互相攻击,勤奋的学习者也遭到了猛烈的攻击。这让许多人对高等教育的未来感到悲观。但就是聊天GPT大学真的需要解决这个问题吗?或者是更深层次的东西?
艾伯特并不是唯一一个发现自己被错误指控使用人工智能的学生。多年来,学院反作弊武器库中的主要工具一直是软件,例如特尼丁,它会扫描提交的内容是否存在抄袭迹象。2023 年,Turnitin 推出了一款新的 AI 检测工具,可以评估可能由 AI 编写的文本比例。
在急于应对人工智能撰写作业激增的情况下,这似乎是一颗灵丹妙药。自那时起,Turnitin 已处理了超过 1.3 亿篇论文,并表示其中 350 万篇论文的 80% 是由人工智能撰写的。但它也不是 100% 可靠;广泛报道了误报案例,一些大学选择退出。Turnitin 表示错误率低于 1%,但考虑到学生人数的规模,难怪许多人发现自己陷入困境。
还有证据表明人工智能检测工具对某些人群不利。斯坦福大学的一项研究发现,许多 AI 检测器对非英语使用者存在偏见,61% 的情况下会对他们的工作进行标记,而对以英语为母语的人则只有 5%(Turnitin 并未参与这项特定研究)。上个月,彭博商业周刊报道了一名患有自闭症谱系障碍的学生的案例,该学生的作业被检测工具错误地标记为由人工智能撰写。她形容被指控作弊就像是“肚子上挨了一记重拳”。神经分歧的学生,以及那些使用更简单的语言和语法写作的学生,似乎受到这些系统的影响尤为严重。
迈克·帕金斯博士越南英国大学的生成式人工智能研究员认为,人工智能检测软件存在“重大局限性”。“所有研究都一再表明这些工具不可靠,”他告诉我。“而且他们很容易被欺骗。”他自己的调查发现,AI 检测器可以以 39.5% 的准确率检测 AI 文本。采用简单的规避技术(例如对文本进行轻微修改)后,准确率降至仅 22.1%。
正如 Perkins 指出的那样,那些决定作弊的人不会简单地从 ChatGPT 中剪切和粘贴文本,他们会对其进行编辑,或者将其融入自己的作品中。还有人工智能“人性化者”,例如复制天才和隐形GPT,后者声称它可以生成无法检测的内容,并声称已帮助 50 万学生生成了近 500 万篇论文。– 唯一不这样做的学生确实在挣扎,或者他们不愿意或没有能力支付最先进的人工智能工具的费用,例如聊天GPT 4.0或者双子座1.5”,帕金斯说。“无论如何,你最终抓住的都是那些学术生涯最有可能受到损害的学生。”
如果有人知道那是什么感觉,那就是艾玛。一年前,她期待收到课程作业的结果。相反,一封电子邮件进入了她的收件箱,通知她她的得分为零。“对剽窃的担忧,”它写道。艾玛是一位正在攻读艺术学位的单亲家长,那一年一直在苦苦挣扎。学习、照顾孩子、做家务……她还挤出时间申请兼职工作,以维持自己的经济状况。在这一切之中,随着最后期限的临近,她慢慢地被 ChatGPT 的诱惑所吸引。当时,她感到如释重负——任务完成了。现在,她感觉自己被石化了。
艾玛也要求保持匿名,她在使用生成式人工智能之前并没有过多考虑它。她没有时间。但她的社交媒体上对此议论不断,当一场疾病导致她的学习落后、心智能力枯竭时,她决定仔细看看它能做什么。登录 ChatGPT,她可以快速跟踪分析的最后部分,将其放入论文中然后继续。“我知道我所做的事情是错误的,但那种感觉完全被疲惫压倒了,”她说。“我没有什么可以给出的,但我必须提交一份已完成的作品。”当她的导师在屏幕上调出一份来自 Turnitin 的报告时,显示整个部分已被标记为由 AI 编写,艾玛除了坦白之外别无选择。
她的案件被转交给不当行为小组,但最终她很幸运。她的减刑情节似乎已被考虑在内,尽管这让她感到惊讶——特别是因为她承认使用 ChatGPT——但专家组认为抄袭的具体主张无法得到证实。
这是一种解脱,但更多的是羞辱。“那一年我获得了第一名,”艾玛说,“但感觉有污点,不值得。”整个经历震惊了她,她的学位和未来都悬而未决。但她认为,大学可以更加意识到学生所面临的压力,并更好地帮助他们驾驭这些不熟悉的工具。“学生使用人工智能的原因有很多,”她说。“而且我预计他们中的一些人并没有意识到他们使用它的方式是不可接受的。”
无论是否作弊,怀疑的气氛已经给校园蒙上了一层阴影。一名学生告诉我,尽管在 Turnitin 的人工智能检测工具上得分很低,但在导师确信该学生使用了 ChatGPT 之后,他们还是被拉进了不当行为听证会,因为他的一些观点是结构化的在列表中,聊天机器人倾向于这样做。尽管他最终被证明无罪,但这段经历“扰乱了我的心理健康”,他说。他的信心受到了严重的打击。“我什至没有使用拼写检查器来帮助编辑我的作品,因为我太害怕了。”
许多学者似乎相信,“你总能判断”作业是否是由人工智能撰写的,他们可以了解与这些工具相关的风格特征。越来越多的证据表明他们可能高估了自己的能力。雷丁大学的研究人员最近进行了一项研究盲测其中 ChatGPT 编写的答案是通过大学自己的考试系统提交的:94% 的人工智能提交的答案未被发现,并且获得了比人类提交的分数更高的分数。
学生们也互相攻击。大卫是一名也要求保持匿名的本科生,当时他正在做一个小组项目,这时他的一位同学发来了一件可疑的抛光作品。大卫解释说,这名学生的英语很吃力,这不是他们的错,但老实说,这份报告是我见过的最好的报告。
大卫通过几个人工智能探测器运行了这项工作,证实了他的怀疑,他礼貌地向学生提出了这个问题。学生当然否认了。大卫觉得自己没有什么可以做的,但他确保收集他们聊天消息的证据。– 因此,如果我们的课程作业被标记,那么我可以说我确实检查过。我知道有人花了几个小时研究这个问题,但只需要一个就毁掉了整个事情。”
大卫绝不是人工智能的反对者。他发现它对于复习、输入学习文本以及要求 ChatGPT 发回问题供他回答非常有用。但他周围普遍存在的作弊行为令人沮丧。“我已经对此不再敏感了,”他说。– 我班上有一半的学生所做的演讲显然不是他们自己的作品。如果我对每次使用人工智能的情况都做出反应,那么我在这一点上就会发疯。”最终,大卫认为学生们只是在欺骗自己,但有时他想知道这种对诚信的侵蚀将如何影响他自己的学业和职业生涯。“如果我正在攻读硕士学位,或者在工作,而每个人都是通过作弊到达那里的,该怎么办?”
最终,什么算作弊由机构和考官决定。许多大学已经在调整评估方法,制定“人工智能积极”政策。例如,在剑桥大学,生成式人工智能的适当使用包括将其用于“新概念概述”、“作为协作教练”或“支持时间管理”。该大学警告不要过度依赖这些工具,这可能会限制学生培养批判性思维技能的能力。我采访过的一些讲师表示,他们认为这种方法很有帮助,但其他人则表示这是投降。其中一位表达了沮丧之情,因为她所在的大学似乎不再认真对待学术不端行为;她收到了“低声警告”,称她不得再将涉嫌人工智能的案件提交给中央纪律委员会。
他们都同意,转向不同形式的教学和评估——一对一辅导、口授等——将使学生更难使用人工智能来完成繁重的工作。——如果我们认真地、真实地评估学生,而不仅仅是让他们参加每年 9,000 英镑的课程,希望他们不会抱怨,那就是我们需要这样做的方式,— 红砖大学的一位讲师告诉我。“但这意味着要雇用员工,或减少学生人数。”他说,他的部门面临着如此大的压力,甚至连讲师也承认使用 ChatGPT 来制定研讨会和辅导计划。难怪学生们也热衷于此。
如果说有什么不同的话,那就是人工智能作弊危机暴露了获得学位的过程变得多么交易化。高等教育日益市场化;大学资金短缺,以牺牲学习质量为代价来追逐客户。与此同时,学生们也面临着自己的经济压力,痛苦地意识到有保障的毕业生职业越来越稀缺。正如二十世纪九十年代论文工厂的兴起与高等教育的迅速扩张同时发生一样,ChatGPT 的出现正值学位感觉比以往任何时候都更加贬值的时候。
学生作弊的原因很复杂。研究指出了诸如执行压力、时间管理不善或仅仅是无知等因素。大学文化也可能助长作弊行为——当一个机构被认为不认真对待作弊行为时,作弊行为肯定会加速。但当谈到解决作弊问题时,我们往往会得到相同的答案:师生关系。保拉·迈尔斯博士在一篇文章中写道:最近的论文了解学生作弊的原因“至关重要”,并且它“在帮助减少学术不端行为方面发挥着强大的作用”。目前,似乎只要人类互动稀少,人工智能就能填补这一空白。
阿尔伯特不得不等等贪婪地谢天谢地,他花了两个月的时间才发现自己已经通过了该模块。这让他松了口气,尽管他无法查明相关文章是否已被标记。然而,到那时,损害已经造成了。他已经感觉自己在大学格格不入,正在考虑退学。不当行为听证会促使他做出决定,他决定在第二年转学到另一个机构。
他说,从很多方面来说,这段经历都是他大学时光的象征。他对教授最初没有就这篇论文与他交谈感到沮丧,并且对学生在他学习期间寻求帮助和支持的机会如此之少感到沮丧。当谈到人工智能时,他是不可知论的——他认为用它来学习和做笔记是可以的,只要它不是用于提交的工作。他认为,更大的问题是高等教育让人感觉非常不人性化。“大学最好不要再将学生视为数字,而更多地视为真实的人,”他说。
部分名称已更改