教师正在使用软件来查看学生是否使用了人工智能。出错时会发生什么?

2025-12-16 10:00:00 英文原文

作者:Lee V. Gaines

Ailsa Ostovitz, left, and her mother, Stephanie Rizk, at their home in the Maryland suburbs of Washington, D.C. In mid-November, Rizk met with Ostovitz’s teachers to discuss accusations that her daughter had used AI to do some of her schoolwork.

艾尔莎·奥斯托维茨(左)和她的母亲斯蒂芬妮·里兹克在华盛顿特区马里兰州郊区的家中。11 月中旬,里兹克会见了奥斯托维茨的老师,讨论了有关她女儿使用人工智能完成部分作业的指控。贝克·哈伦/NPR 隐藏标题

切换标题

贝克·哈伦/NPR

艾尔莎·奥斯托维茨 (Ailsa Ostovitz) 被指控在本学年两个不同班级的三项作业中使用人工智能。

17 岁的奥斯托维茨说:“这让人精神疲惫,因为我知道这是我的工作。我知道这是我的大脑将文字和概念写在纸上供其他人理解。”

An illustration of high school students on their devices.

奥斯托维茨是华盛顿特区马里兰州郊区埃莉诺·罗斯福高中的一名三年级学生,她向 NPR 分享了一位老师对她的指控。该消息来自 9 月份,其中包括人工智能检测程序的屏幕截图,显示奥斯托维茨在一项写作作业中使用人工智能的可能性为 30.76%,其中包括对她所听音乐的描述。

“我写的是音乐。我喜欢音乐。为什么我要使用人工智能来写一些我喜欢谈论的东西?”奥斯托维茨说。

奥斯托维茨通过学校的在线学习平台联系了她的老师关于这项作业的信息。“我说,说实话,我没有使用人工智能。你能尝试一下不同的探测器吗?”

老师没有回应,并扣掉了奥斯托维茨的成绩。

奥斯托维茨的妈妈斯蒂芬妮·里兹克 (Stephanie Rizk) 说,她的女儿是一名成绩优异的学生,关心在学校的表现,当老师在学年这么早就对奥斯托维茨的工作得出结论时,她感到震惊。

“了解他们的技能水平,然后你的人工智能探测器也许会有用,”里兹克说。

里兹克告诉 NPR,她在 11 月中旬与老师会面,老师说他们从未看到过她女儿的信息。

Ostovitz says she now runs all her homework assignments through multiple AI detection tools before she turns them in.

奥斯托维茨说,她现在在交作业之前会通过多种人工智能检测工具来完成所有作业。贝克·哈伦/NPR 隐藏标题

切换标题

贝克·哈伦/NPR

乔治王子县公立学校学区在一份声明中明确表示,奥斯托维茨的老师自己使用了人工智能检测工具,学区不支付该软件的费用。

声明称:“在员工培训期间,我们建议教育工作者不要依赖此类工具,因为多个来源已经记录了它们潜在的不准确性和不一致之处。”

PGCPS 拒绝让奥斯托维茨的老师接受采访。里兹克告诉 NPR,在他们会面后,老师不再相信奥斯托维茨使用了人工智能。

An illustration of a teacher standing at the front of a college classroom, teaching about AI. Meanwhile, throughout the classroom, an image of the same teacher, but with bits of code on her clothing, is seen throughout the classroom, performing different tasks.

但奥斯托维茨的遭遇并不令人意外。

据调查,超过 40% 的 6 至 12 年级教师在上学年使用了人工智能检测工具全国代表性民意调查由民主与技术中心发起,这是一个倡导数字时代公民权利和公民自由的非营利组织。

即便如此众多 研究 研究表明人工智能检测工具远不可靠。

越南英国大学学术诚信和人工智能领域的首席研究员迈克·珀金斯 (Mike Perkins) 表示:“学术诚信领域现在已经相当确定,这些工具不适合其用途。”

Perkins 发现,一些最流行的人工智能检测器(包括 Turnitin、GPTZero 和 Copyleaks)将一些并非人工智能的东西标记为人工智能,反之亦然。当人工智能文本被操纵得更加人性化时,他们的准确率进一步下降。

“我们看到一些最丰富的人工智能文本检测工具确实存在一些令人担忧的问题,”他说。

尽管存在这些问题,NPR 发现从犹他州到俄亥俄州的学区阿拉巴马州在这些工具上花费了数千美元。

为什么美国最大的地区之一使用人工智能检测软件

迈阿密附近的布劳沃德县公立学校花费超过 55 万美元与 Turnitin 签订了一份为期三年的合同。这家历史悠久的教育科技公司历来为学校提供抄袭检测软件;2023年,它引入了AI检测功能。当教育工作者通过这个工具放置学生作业时,它会生成一个百分比,反映软件确定的可能由人工智能生成的文本量。一个警告:据该公司称,20% 或更低的分数不太可靠。

An illustration depicts a preteen boy with white skin and blond hair, wearing a backward baseball hat. He sits cross-legged on the floor with over-the-ear headphones pulled down around his neck, while he stares down at a tablet in his hands. Speech bubbles, emojis, an exclamation point and a question mark emanate from the screen, off to either side of him. A hand reaches into the frame as his parent puts a hand on his shoulder, symbolizing discussing the use of AI with your children and teens.

“Turnitin 工具可以帮助我们促进对话和反馈,而不是评分,”布劳沃德学区创新学习总监 Sherri Wilson 说,该学区招收了超过 230,000 名学生,是美国最大的学区之一。

威尔逊表示,该学区“完全了解”研究表明,包括 Turnitin 在内的人工智能检测工具并非 100% 准确或可靠。

Turnitin 也承认这一点:在公司网站上,它说,“我们的人工智能写作检测可能并不总是准确的......所以它不应该被用作针对学生的不利行为的唯一依据。”

Turnitin 在给 NPR 的一份声明中写道,避免错误地指责学生作弊比捕捉所有人工智能写作更重要。

Wilson 表示,Turnitin 工具仍然很有价值,因为它可以快速扫描学生作业以查找可疑的人工智能使用情况,从而节省教师的时间。

威尔逊说,布劳沃德教师能够使用该工具的另一个原因是该学区参与学术项目, 例如国际文凭(IB),学生的作业必须经过教师的验证,然后才能送交外部审查。

布劳沃德提供的 IB 和剑桥国际教育项目告诉 NPR,学校不需要使用人工智能检测软件作为身份验证过程的一部分。尽管如此,布劳沃德在一份声明中告诉 NPR,“我们选择向我们的教师提供 [Turnitin] 作为满足要求的工具之一。”

但威尔逊表示,对于学生的作业是否属于自己的问题,教师拥有最终决定权,而不是人工智能检测工具。

“他们使用这些工具作为反馈,然后与学生一起度过那些受教育的时刻,”她说。

为什么一位老师使用人工智能检测工具 

语言和文学老师约翰·格雷迪表示,对他来说,人工智能检测工具提供了“一个起点”,可以与可能使用过人工智能的学生开始对话。

Shaker Heights High School teacher John Grady says he puts all student essays through GPTZero – but it isn’t the only tool he relies on to determine if a student’s work is their own. 

Shaker Heights 高中的老师 John Grady 表示,他将所有学生的论文都通过 GPTZero 进行处理,但这并不是他用来确定学生的作业是否属于自己的唯一工具。 NPR 达斯汀·弗兰兹 隐藏标题

切换标题

NPR 达斯汀·弗兰兹

“这当然不是万无一失的,”他说。“但它给了你一些可以挂帽子的东西。”

格雷迪在谢克高地高中任教,该高中是克利夫兰郊外谢克高地城市学区的一部分。该学区为大约 4,400 名学生提供服务,今年将向另一家人工智能检测软件公司 GPTZero 支付约 5,600 美元,为该学区 27 名教师提供年度许可证。该工具计算学生的作业由人工智能生成的可能性百分比。

Grady 说他将所有学生论文都通过 GPTZero;如果该工具显示超过 50% 的可能性使用人工智能来完成任务,格雷迪就会进行更深入的挖掘。这包括使用修订历史记录工具来查看学生在作业上花费了多少时间,以及他们在写作过程中进行了多少次编辑。如果某个学生只做了一些编辑并且几乎没有花时间写作,他会与该学生联系。

“我会说,‘嘿,这个被标记了。你能告诉我为什么吗?’我想说,大多数时候,比如 75%,如果是人工智能,他们会说,“是的,我做到了。”我想,‘好吧,现在你必须用更少的信用重写它,’”格雷迪说。

GPTZero 联合创始人兼首席执行官 Edward Tian 表示,这就是教育工作者的方式应该使用他公司的工具。

“我们绝对不相信这是一种惩罚工具,”田说。“这需要成为工具箱中的一个工具,而不是最终确凿的证据。”

This 22-year-old is trying to save us from ChatGPT before it changes writing forever

他表示,重要的是要理解,GPTZero 概率得分低于 50% 意味着该文本更有可能是人类生成的,而不是人工智能生成的。他说,超过 50% 的分数值得更仔细的检查——就像格雷迪所描述的那样。

Tian 并不否认 GPTZero 并不总是可靠的研究。但他指出,像格雷迪这样的教育工作者仍然认为它提供的信息很有价值。

他说,像他这样的工具提供了“关于课堂上发生的事情的信号”,但如果该信号显示出一些令人担忧的事情,教师应该始终跟进学生。

人工智能检测怀疑论者

Shaker Heights 的三年级学生子石的第一语言是普通话,他说他的写作风格有时看起来像人工智能,“因为我使用的单词重复。我觉得这是因为我的词汇量有限。”

施并不是格雷迪的学生,他说他仍在提高写作技巧,他担心人工智能检测软件可能会对像他这样的非英语母语人士产生偏见。

一些教育工作者也有同样的担忧,尽管迄今为止的研究有限且相互矛盾。

施说,他今年秋天早些时候为英语课完成的一项作业被 GPTZero 标记为可能是人工智能生成的。他说他的老师建议他使用名为 Grammarly 的在线工具可能触发了检测软件。Grammarly 使用人工智能来纠正语法,并在出现提示时生成文本。(老师向 NPR 证实了石的说法。)

石说他只是用 Grammarly 来清理他的写作,作业是他自己写的。“看到它被标记为人工智能的评论绝对令人失望,”石说。

施认为人工智能探测器应该被视为“烟雾警报器,它是一个标志或警告。但是,你知道,有时它可能像是一个误报。”

他质疑学区是否应该花费数千美元购买人工智能检测软件。他说,钱可以更好地花在教师的专业发展上。

克利夫兰都会学区的一名高中英语老师凯莉·科弗(距离谢克高地仅几英里)也持同样的观点。

去年,作为一项实验,她上传了博士学位论文的一个章节。论文进入 GPTZero。“它提出了大约 89% 或 91% 的人工智能编写的内容,我想,‘哦,不,我认为这是不对的,因为这都是我的,’”科弗说。

In Cleveland, English teacher Carrie Cofer says educators will need to adapt to AI by changing how they teach and assess student learning.

在克利夫兰,英语老师 Carrie Cofer 表示,教育工作者需要通过改变教学和评估学生学习的方式来适应人工智能。NPR 达斯汀·弗兰茨 隐藏标题

切换标题

NPR 达斯汀·弗兰茨

Cofer 正在帮助她的学区制定人工智能政策和指导方针;她说克利夫兰学校目前不支付人工智能检测软件的费用,她反对这样做。

“我认为这不是他们资金的有效使用,”科弗说。“孩子们会以某种方式解决这个问题。”

学生可以采取的一些解决方法包括自己使用人工智能检测软件、参加研讨会作业,这样他们就不会被标记,以及使用“AI人性化”计划,声称让人工智能生成的写作显得更加人性化。

她说,最终,教师需要通过改变教学和评估学生学习的方式来适应人工智能。

回到马里兰州,高中三年级学生艾尔莎·奥斯托维茨也在适应。现在,她在交作业之前会通过多种人工智能检测工具来完成所有作业。

她说,这篇文章是她自己写的,但她会重写软件识别为可能由人工智能生成的句子,这一额外步骤会让每项作业增加大约半个小时。

“我认为我肯定变得更加警惕,将我的作品呈现为我的作品,而不是人工智能,”她解释道。

她不想冒任何风险。

本报告得到了来自塔贝尔人工智能新闻中心

编辑:妮可·科恩
视觉设计和开发:LA Johnson
音频故事制作:Lauren Migaki

关于《教师正在使用软件来查看学生是否使用了人工智能。出错时会发生什么?》的评论


暂无评论

发表评论

摘要

艾尔莎·奥斯托维茨 (Ailsa Ostovitz) 是马里兰州埃莉诺·罗斯福高中的一名成绩优异的三年级学生,她被错误地指控使用人工智能来完成学校作业。她的母亲与老师会面讨论这些基于不可靠的人工智能检测工具的指控。该事件凸显了美国各地教育工作者使用的人工智能检测工具不准确的问题日益严重,引发了人们对其可靠性以及对学生学术诚信的影响的担忧。