英语轻松读发新版了,欢迎下载、更新

人工智能导师:教育的炒作还是希望?

2024-12-03 10:00:22 英文原文

作者:John Bailey, John Warner

人的因素

导师机器人所能提供的服务与学生和老师之间的人类交流之间的另一个脱节是,学习不仅仅是关于某人知道什么, 但某人在想什么。错误的答案可能有许多不同的根源,而诊断问题就是利用一个人的答案判断,这是大型语言模型无法做到的行为,但人类教师每天会做数百甚至数千次。

例如,在我 20 多年的教学生涯中,我经常会问学生“这有意义吗?”有时候,他们嘴上说“是”,但脸上却说“不”数不胜数。在这些情况下,我必须继续运用我的判断力来保持学生的学习。

然而,最大的障碍是第四点:让学生使用学习对象。

Sataya Nitta,IBM Watson 辅导项目的负责人,解释了为什么团队注定会失败, – 我们错过了一些重要的事情。教育的核心,任何学习的核心,都是参与。”

写在教育下一步,劳伦斯·霍尔特 (Laurence Holt) 描述了他所谓的“5% 问题”。霍尔特观察到,在许多情况下,在线数学程序(现代教学机器)在研究对象中表现出了巨大的积极效应。例如,可汗学院的数学练习网站被证明可以为“按照建议使用该项目的学生”提供相当于“几个月的额外教育”的费用。

尽管这些计划得到了广泛采用并且效果明显,但学生的总体成绩并没有提高。为什么不呢?

只有 5% 的学生使用这些程序按照推荐。正如 Holt 所说,“想象一下一位医生给 100 名患者开了一种复杂的新药,结果发现其中 95 人没有按照处方服用。这就是当今 K-12 教育中许多在线数学干预的情况。它们是 5% 的人的解决方案。其他 95% 的学生看到的收益(如果有的话)也微乎其微。——绝大多数学生选择不使用该软件。正确使用它的 5% 的学生似乎会做老师布置的任何事情。

我认为汗米戈可能有一些确保学生参与的秘密公式,但汗在他的书中没有提供这方面的证据。相反,他进行了猜测,就像当他暗示让伦勃朗·范·莱恩 (Rembrandt van Rijn) 聊天机器人询问你是否喜欢画画一定很有趣时。鉴于 Khanmigo 的测试版于 2023 年 3 月推出,Khanmigo 的书于 2024 年 5 月出版,书中缺乏证据是可以理解的。由于起草、修改、编辑、复制编辑所需的时间,印刷并分发一本书,就没有时间收集有关学生如何使用 Khanmigo 的任何真实数据。Khan 的预测源于对大型语言模型的惊讶,这是可以理解的似乎能够做到,而不是现实世界的试验。

人们渴望在大型语言模型的输出中找到智能和推理能力,但这些都是 Baldur Bjarnason 所说的副产品——智力错觉——将代理分配给实际上是自动语法生成机器的自然冲动。就大型语言模型可以“推理”的程度而言,我们知道它的推理形式与人类的推理形式完全不同。

可汗似乎没有考虑到其他概念层面的问题。例如,始终可用的导师机器人被吹捧为能够提供“实时”反馈,但没有证据表明“实时”(而不是更有用的“及时”)) 反馈有助于学习。实时反馈是提高效率的工具,但在什么样的世界里学习一定是高效的呢?

事实上,当谈到写作教学时——我教学时的重点领域——实时反馈会造成很大的伤害。写作必然是在修辞情境中对作品的交际目的进行缓慢的思考和考虑的过程。指导学生尽可能高效地完成作业的实时写作辅助工具可能会缩短培养写作技能所需的摩擦。

有时,在与学生一起工作时,我会详细地反复讨论他们的写作意图和我作为读者的经历。其他时候,我会读一篇学生的文章,然后简单地说,“还没汤”,意思是我知道(学生也知道)这篇文章还没有完成。知道该对学生说什么以保持他们的学习源于我建立的人际关系以及我随着时间的推移收集的学生写作知识——聊天机器人尚无法模拟这些事情,更不用说真正做到了。

可汗还将人工智能定义为自动化所谓的较低级别教师任务(例如课程计划和评分)的辅助手段,但只有没有教过书的人才会称之为较低级别的任务。乐团指挥会将表演节目的制作外包给人工智能吗?

同样,至少在学生写作方面,评分是一个重要因素基本的教师的任务,因为它不仅是评估证据的最佳方式什么学生们不仅学会了,还如何他们已经学会了(或者还没有学会)。教授写作课程并将评分外包类似于管弦乐队指挥只听到观众的掌声而不是聆听表演本身,或者足球教练知道比分但不观看比赛。这简直是​​无稽之谈。

虽然我对我们即将经历一场人工智能驱动的教育革命持怀疑态度,但我确实相信我们应该积极、广泛地尝试所有可能帮助学生学习的方法。让一百朵、一千朵、一百万朵花绽放。

但这些实验应该是合理且成比例的。截至 2024 年 3 月,据报道,Khanmigo 被 65,000 名学生使用。微软提供了资源,让 Khanmigo 免费向所有学生开放,这是一项难以衡量的投资。但考虑到我们对 ChatGPT 的“计算成本”的了解,我们谈论的一定是数百万美元。

相信生成式人工智能将带来变革,需要抛开我们所知道的关于之前的变革尝试如何以及为何失败的知识。让人想起电影中的场景这是脊椎穿刺当 Christopher Guest 的 Nigel Tufnel 向 Marty Di Bergi(Rob Reiner 饰)展示他的“特殊”Marshall 音箱时,最大音量为 11 而非标准的 10,Di Bergi 问道:“为什么不这样做”难道你只是把 10 调大一点,然后让 10 成为最高的数字吗?——Tufnel 之前思考了一两拍说:“这些转到 11。”

将生成式人工智能分层到个性化学习模型上就像 Tufnel 所说的那样,“这些数字为 11”,这是一种声明,表明该技术的不同之处仅仅在于它具有更高的数字。

这些创新将带来变革的理论是建立在一厢情愿的想法之上的。目前的证据还很少,之前的大量经验表明,这种模型注定会与人类行为的现实相冲突。

如果我们要帮助学生学习,我们需要从人类的本质入手,而不是被人工智能自动化冲昏头脑。

关于《人工智能导师:教育的炒作还是希望?》的评论


暂无评论

发表评论

摘要

本文讨论了辅导机器人和大型语言模型在教育环境中的局限性,强调了人类判断和参与有效学习的重要性。它强调学习不仅仅涉及知识获取;还涉及知识的获取。它还需要了解学生如何思考并通过个人互动来诊断问题。这篇文章批评 Khanmigo 等基于人工智能的辅导系统缺乏提高学生参与度和学习成果的证据,认为此类技术无法复制人类教师提供的细致入微的支持。此外,它还对利用人工智能实现教师任务自动化将带来教育重大改进的观点提出质疑,这表明真正的变革需要深入了解人类行为和需求,而不是仅仅依赖技术进步。