英语轻松读发新版了,欢迎下载、更新

使用AI对学生的工作进行评分的老师会发出明确的信息:他们无关紧要,很快就会过时

2025-05-10 10:30:07 英文原文

最近与老师交谈,您可能会了解AI对学生注意力的影响,阅读理解和作弊。

随着AI在日常生活中无处不在 - 多亏了科技公司强迫我们的喉咙``学生都以几乎前所未有的规模使用诸如Chatgpt之类的软件可能并不令人震惊。一项研究数字教育委员会发现近86%的大学生在工作中使用某种类型的AI。

这导致一些喂养的老师使用AI聊天机器人为学生的工作评分而用火扑灭。一位老师沉思在reddit上:“欢迎您使用AI。让我知道。如果您这样做,AI也会给您评分。您不写它,我不读它。”

在一个例子中由 。有些人甚至需要学生使用AI。纽约州伊萨卡的一位教授两者都分享Chatgpt对学生论文以及她自己的评论,并要求她的学生独自通过AI进行论文。

乔治亚大学的研究人员说,虽然AI可能会为教育工作者提供一些时间和宝贵的脑力 - 这可以说是演出的大部分 - 该技术甚至还没有削减工作。虽然我们都应该知道,用AI评分论文是一个坏主意新研究在UG的计算学院通过计算学院收集了有关它有多糟糕的数据。

该研究任务了大型语言模型(LLM)混音,并对中学作业进行了书面响应。而不是像以前那样给llm喂养人类创建的标题通常完成在这些研究中,UG团队负责Mixtral创建自己的评分系统。结果很糟糕。

与人类分级器相比,LLM仅在33.5%的时间内准确地分级学生工作。即使提供人类标语,该模型的准确率刚刚超过50%。

尽管LLM迅速“分级”,但其分数通常是基于LLMS固有的缺陷逻辑。

研究人员写道:“尽管LLM可以迅速适应得分任务,但它们经常诉诸捷径,绕过人类评分中预期的更深层次的逻辑推理。”

UG研究人员之一Zhai说:“学生可能会提到温度升高,大型语言模型可以解释所有学生在温度升高时颗粒的移动速度更快。”“但是,基于学生写作,作为人类,我们无法推断学生是否知道粒子是否会移动更快。”

尽管UG研究人员写道:“融合旨在反映人类评分逻辑的高质量分析标题可以减轻差距并提高LLMS得分的准确性”,但可笑的准确性从33.5%提高到50%是可笑的。请记住,这是应该带来“新时代“我们倾注的技术更多的种子钱比人类历史上的任何人。

如果您的汽车在高速公路上有50%的机会在灾难性上失败,那么我们每个人都不会开车。那么,为什么老师可以与学生进行同样的赌博呢?

这只是进一步的确认,AI不能代替生活,呼吸的老师,而且这种情况不太可能很快改变。实际上,有越来越多的证据表明AI的理解能力正在增强更糟 随着时间的流逝,原始数据变得稀缺。最近的报告纽约时报发现最新一代的AI模型幻觉距离过去的数字高达79%。

当老师选择拥抱AI时,这是他们将其推向孩子的技术:众所周知,不准确,,,,过于渴望,容易彻底撒谎。那是我们甚至进入认知能力下降这会带来定期使用的AI。如果这是对AI作弊危机的答案,那么削减中间人可能会更有意义:关闭学校,让孩子们与人造伙伴一对一地进行。

有关AI的更多信息:拥有这种教育水平的人使用最多的工作


关于《使用AI对学生的工作进行评分的老师会发出明确的信息:他们无关紧要,很快就会过时》的评论


暂无评论

发表评论

摘要

老师正在努力与学生的广泛使用Chatgpt这样的AI工具,导致一些人将AI集成到评分过程中。但是,佐治亚大学的一项研究表明,诸如混合式的AI模型与准确的评分斗争,仅在没有人类指导的情况下就可以达到33.5%的准确性,并在提供专栏时仅超过50%。这凸显了AI复制细微差别评估的能力的重大局限性,强调了依靠AI在教育环境中的担忧。