生成式人工智能在人类学习中的机遇与挑战
作者:Gašević, Dragan
参考文献
Gašević, D., Siemens, G. & Sadiq, S. 为人工智能时代赋能学习者。计算机教育与人工智能 4, 100130 (2023).
颜丽等。大型语言模型在教育中的实践和伦理挑战:系统性综述英国教育技术杂志 35, 90–112 (2023).
戴, W. 等。大型语言模型能为学生提供反馈吗?以ChatGPT为例的研究。在2023年IEEE国际高级学习技术会议 proceedings323-325 (IEEE, 2023).
李,Y. 等人。大型语言模型能否进行反思性写作。计算机教育人工智能 4, 100140 (2023).
伊尔迪里姆-埃尔巴斯基, S. N. & 布卢特, O. 基于对话的评估:在数字化形成性评估中提高考试努力程度的一种新颖方法。计算机教育人工智能 4, 100135 (2023).
马佐利,C. A.,塞梅拉罗,F. & 坎贝尔尼,L. 提高心搏骤停教育水平:探索Midjourney的潜在应用。复苏 189, 109893 (2023).
瓦尔蒂ainen, H. & 特德雷, M. 在工艺教育中使用人工智能:利用文本到图像生成模型进行创作。数字。创作。 34, 1–21 (2023).
卡斯内西,E. 等人。ChatGPT助力教育?大型语言模型在教育中的机遇与挑战。学习。个体差异。 103, 102274 (2023).
法尔科恩,T. P., 梅洛,R. F. & 罗德里格斯,R. L. 拉丁美洲学习分析的应用。J. 学习分析 51, 871–874 (2020).
达尔维希,A.,霍什拉维,H.,萨迪克,S.,加舍维奇,D.及西蒙斯,G. 关于人工智能辅助对学生自主性影响的研究。计算机教育 210, 104967 (2024).
莫萨万纳斯巴,E. 等人。智能辅导系统:特征、应用和评价方法的系统回顾。互动。学习。环境。 29, 142–163 (2021).
维果茨基,L. S. & 科尔,M.社会中的心智:高级心理过程的发展(哈佛大学出版社,1978年)
约克西莫维奇,S.,伊芬塔勒,D.,马罗内,R.,德拉特,M.及西米尔斯,G. 人工智能在支持复杂问题解决方面的机遇:基于综述研究的发现。计算机教育与人工智能 4, 100138 (2023).
常,Y.等. 大型语言模型评估综述。ACM交易智能系统技术 15, 1–45 (2024).
meet Khanmigo:Khan Academy 的人工智能教学助手和家教。可汗学院 https://www.khanmigo.ai/ (2023).
李,V. S. 什么是探究引导学习?新方向。教学。学习。 129, 5–14 (2012).
陈锦耀,胡威:学生对生成式人工智能的看法、益处和挑战:高等教育中的声音国际教育技术高等教育期刊 20, 43 (2023).
亨尼斯,S.,楚库罗瓦,M.,莱温,C.,马夫里基斯,M.及梅杰,L.《BJET》2024年编辑部文章:呼吁严谨的研究态度。英国教育技术杂志 55, 5–9 (2024).
达尔维希,A.,霍斯拉维,H.,萨迪克,S.,加谢维奇,D.及西米恩斯,G.人工智能辅助对学生自主性的影响。计算机教育 210, 104967 (2024).
Nie, A. 等。GPT 的惊喜:在大规模编程课程中提供大型语言模型聊天降低了参与度但提高了采用者的考试成绩。arXiv 预印本https://doi.org/10.48550/arXiv.2407.09975 (2024).
莫伦纳尔,I. 混合人机学习技术的发展。欧洲教育杂志 57, 632–645 (2022).
Ji, H., Han, I. & Ko, Y. 对语言教育中对话人工智能的系统回顾:侧重于与人类教师的合作。教育技术研究期刊 55, 48–63 (2023).
杨,KB等. 调查教师在动态分组协作学习中的人机控制偏好和界限。在第十六届欧洲技术增强学习会议 proceedings260–274 ( Springer, 2021 ).
佩索夫斯基,I.,桑托斯,R.,亨里克,R.及特拉伊科维奇,V. 可定制学习体验的生成式AI。可持续性 16, 3034 (2024).
黄,K., 王,K., 阿洛梅尔,M., 崔,F.-S. & 陈,L. K. 关于自动多选题生成与评估:与布卢姆分类学对齐。在第25届会议Proceedings简称 Proc. 25th 国际人工智能教育大会389–396 (施普林格, 2024).
Radford, A. 等人。从自然语言监督中学到可转移的视觉模型。在第38届国际机器学习大会 proceedings8748–8763 (PMLR, 2021).
邱 TK. 生成式人工智能(GenAI)对教育实践、政策和研究方向的影响:以ChatGPT和Midjourney为例。互动。学习。环境。 https://doi.org/10.1080/10494820.2023.2253861 (2023).
李,U.等.Prompt Aloud!:利用学习分析将生成图像的AI融入STEAM课程中使用提示数据。教育技术信息学 29, 9575–9605 (2024).
陈 yan(假设yan为名,因为原名未给出),张 xian(假设xian为名,因为原名未给出)及胡 lin(假设lin为名,因为原名未给出)。一种基于逐步提示的生成式AI方法,用于通过促进学生在学习中国古代诗歌中的成就和感知来提高其学习效果。教育技术协会杂志 27, 284–305 (2024).
龙, L., MacBlain, S. & MacBlain, M. 在中学阶段支持患有阅读障碍的学生:一个情感化的读写模型。青少年成人文学 журнал или Adolescence and Adulthood Literature 如果没有更具体的语境,直接翻译可能不准确,所以这里提供两种常见理解的翻译。但根据要求只输出翻译结果,那么: 青少年成人文学 51, 124–134 (2007).
莱克尔,D.,吉伦,A. R.,埃尔德索基,I.及居库罗娃,M. 用于学习的生成式AI:探究具有合成虚拟讲师的学习视频的潜力。在第24届国际人工智能教育大会论文集523–529 (施普林格,2023).
巴达,S. O. & 奥卢塞贡,S. 建构主义学习理论:教学与学习的范式。教育研究方法杂志 5, 66–70 (2015).
塔瓦科利,M.,法拉吉,A.,莫拉维,M.,摩尔,S. T. & 基斯米霍克,G. 混合人机AI课程开发在个性化非正式学习环境中的应用。在第十二届国际学习分析与知识大会论文集563–569 (ACM, 2022).
帕尔多,A.,约万诺维奇,J.,道森,S.,加塞维克,D.及米里亚希,N.利用学习分析扩大个性化反馈的提供。英国教育技术杂志 50, 128–138 (2019).
林,L.-A. 等。什么变了,对谁变?基于学习分析的过程反馈在大型课程中的影响研究。学习。指导。 72, 101202 (2021).
哈蒂,J. & 坦普利,H. 反馈的力量。复习教育研究 77, 81–112 (2007).
普洛斯,A. & 马洪尼,M. J. 反馈的有效性:学生的视角。评估。评价。高等教育。 33, 143–154 (2008).
斯泰斯,J. 等人。比较人类和ChatGPT对学生写作反馈的质量。学习。指导。 91, 101894 (2024).
梅耶尔等人。利用大语言模型将基于证据的反馈带入课堂:人工智能生成的反馈增加了中学生对文本修订的积极性、动机和积极情绪。计算机教育与人工智能 6, 100199 (2024).
张, Z. 等。学生对生成式人工智能编程反馈的感知和偏好。在第38届人工智能国际联合会会议Proceedings23250–23258 (AAAI, 2024).
梁志,Sha Lei,Tsai Yi-Shuan,Gašević Dragana及陈刚. 朝向教育中易于应用的个性化反馈的自动化生成. 在第25届国际人工智能教育大会论文集75–88 ( Springer, 2024 ).
Wiboolyasarin, W., Wiboolyasarin, K., Suwanwihok, K., Jinowat, N. & Muenjanchoey, R. 协同写作与人工智能反馈相结合:基于维基环境的二语写作能力提升研究。计算机教育与人工智能 6, 100228 (2024).
颜, L. 等。VizChat:使用多模态生成式AI聊天机器人增强学习分析仪表板的上下文解释。在第25届国际人工智能教育大会论文集180-193 ( Springer, 2024 ).
MATCHA, W., GAŠEVIĆ, D. & PARDO, A. 等。从自我调节学习的角度系统回顾学习分析仪表板的实证研究。IEEE Transactions on Learning Technologies 13, 226–245 (2019).
杨, M. & 卡レス, D. 反馈三角形与对话式反馈过程的增强。高等教育 18, 285–297 (2013).
Dawson, P. 等人在学习、设计与技术:理论、研究、实践与政策的国际综述集695–739 ( Springer, 2023 ).
王,T.等. RODIN:一种使用扩散过程塑造3D数字化身的生成模型。在2023 IEEE/CVF计算机视觉和模式识别会议论文集4563–4573 (IEEE, 2023).
Le, M. 等人。Voicebox:文本引导的多语言大规模语音生成。在神经信息处理系统进展(奥等人编) 14005-14034 (科朗协会, 2023).
麦卡锡,J. 高等教育总结性评估任务中书面、音频和视频反馈的评价。教育研究问题 25, 153–169 (2015).
奥兰多,J. 文本、语音和屏幕 casting 反馈与在线学生比较。 注意:“screencasting”在技术语境中通常指“屏幕录制”,此处按照原文给出的表述进行翻译,但为了准确传达意思,保持原词以避免误导。若需更具体的解释或专业术语调整,请告知。美国远程教育杂志 30, 156–166 (2016).
亨德森,M. & 菲利普斯,M. 基于视频的对学生评估的反馈:令人惊恐的私密性。澳大利亚教育技术期刊 31, 51–66 (2015).
斯威克基,Z. 等人. 人工智能时代的评估。计算机教育与人工智能 3, 100075 (2022).
吴,Q.等。AutoGen:通过多代理对话启用下一代LLM应用。预印本于arXiv https://doi.org/10.48550/arXiv.2308.08155 (2023).
朴哲圣等。生成代理:人类行为的交互式模拟。在第36届ACM用户界面软件和技术年会论文集1–22 (ACM,2023)。
樊,Y.等. 基于痕迹数据的自我调节学习测量有效性的研究探讨。元认知学习 17, 949–987 (2022).
Allen, L. K., Creer, S. C. & Öncel, P. 在学习分析手册第二版(编辑:Lang, C 等人)46-53页(学习分析研究协会,2022年)。
Gašević, D., Greiff, S. & Shaffer, D. W. 加强学习分析与评估之间联系:一种前景新结合的挑战与潜力。计算机与人类行为 134, 107304 (2022).
Lagakis, P. & Demetriadis, S. EvaAI:一种利用大型语言模型进行增强自动化评分的多智能体框架。在第20届国际智能 tutoring 系统大会论文集378–385 ( Springer, 2024 ).
沙赫扎德,R. 等人。电子学习环境中学生认知评估的多智能体系统。IEEE访问(IEEE Access) 12, 15458–15467 (2024).
杨,K. 等。使用多智能体大型语言模型(LLM)进行内容知识识别。在第25届国际人工智能教育大会 proceedings284-292 ( Springer, 2024 ).
宋,W.等.基于口腔知识图谱的智能虚拟标准病人在医学生培训中的应用。IEEE多媒体交易公报 25, 6132–6145 (2022).
姬思远,潘淑燕,Cambria E,Marttinen P & Philip SY. 关于知识图谱的综述:表示、获取和应用。 IEEE Transactions on Neural Networks and Learning Systems 33, 494–514 (2021).
雷姆,J.,雷斯霍德科,I.,博尔森,S. Z. &贡德森,O. E. 虚拟驾驶教练:通过知识图谱协作的多智能体系统以实现可扩展的驾驶员教育。在第38届AAAI人工智能会议论文集 22806–22814 (2024).
金俊,李圣,申赫,金智。教AI编程:利用大型语言模型作为可教学代理进行编程教育。在2024年人因因素在计算系统中的CHI大会 proceedings1–28 (ACM, 2024).
杨庆锋,连丽婉,赵继红. 开发游戏化人工智能教育机器人以促进本科生实验室安全课程的学习效果和行为。国际教育技术高等教育期刊 20, 18 (2023).
Thanh,B. N. 等人. 与机器赛跑:评估生成式AI解决真实评估任务的能力。澳华教育技术杂志 39, 59–81 (2023).
切斯勒,N. C. 等。一种新型的工程教育模式:个性化指导和评估工程思维的虚拟实习。生物医学工程杂志 137, 024701 (2015).
坎特,R. P. & 科oper,S. J. 基于模拟的学习在护士教育中的系统评价。J. 高护进展 66, 3–15 (2010).
梅内兹,J.,纳拉扬,S.,博亨特,B. & 麦克唐纳,R. 关于摘要生成中的忠实性和事实性。在第58届计算语言学协会年会 proceedings1906–1919(计算语言学协会,2020)。
姬志 et al. 自然语言生成中的幻觉调查。ACM计算调查 журнал 55, 1–38 (2023).
Carlini, N. 等人。从大型语言模型中提取训练数据。在第30届USENIX安全研讨会论文集2633–2650 (USENIX, 2021).
Borji, A. ChatGPT失败的分类档案。预印本位于arXiv https://doi.org/10.48550/arXiv.2302.03494 (2023).
Chelli, M. 等人。ChatGPT 和 Bard 在系统综述中的幻觉率和引用准确性:比较分析。J. Med. Internet Res. 26,吴53164(2024)。
沙奥,N. R. 等。解决大规模语言模型中的偏见和幻觉问题。在2024年国际计算语言学联合大会暨语言资源与评估会议论文集73–79 (ELRA语言资源协会,2024)。
Ng, D. T. K., Leung, J. K. L., Chu, S. K. W. & Qiao, M. S. 概念化人工智能素养:探索性回顾。计算机教育人工智能 2, 100041 (2021).
Leiser, F. 等人。从ChatGPT到FactGPT:一项参与式设计研究,以减轻大规模语言模型幻觉对用户的影响。在人机交互大会2023 Proceedings81–90 ( Association for Computing Machinery, 2023 ).
Schneider, J., Richner, R. & Riser, M. 关于可信自动评分短的多语言、多种类型答案的研究方向。国际人工智能教育杂志 33, 88–118 (2023).
霍斯拉维,H. 等人. 教育领域的可解释人工智能。计算机教育与人工智能 3, 100074 (2022).
杨 SJ, 小野田 H, 松尾 T, & 陈 NS. 教育中以人为本的人工智能:透过可见洞察无形。计算机教育与人工智能 2, 100008 (2021).
哈特(H. Short). 对信任在职场技术增强学习中的贡献的有效性进行批判性评估:文献回顾。英国教育技术杂志 45, 1014–1022 (2014).
穆蒂穆克韦,C.,维伯格,O.,奥贝格,L.-M. & 塞拉托-帕尔格曼,T. 学习分析中学生的隐私担忧:模型开发。英国教育技术杂志 53, 932–951 (2022).
布朗,H.,李,K.,米雷什加拉赫,F.,肖克里,R.及特梅尔,F. 语言模型如何保护隐私意味着什么?在2022年ACM公平性、问责制与透明度大会论文集2280–2292 (ACM, 2022).
纳斯尔等。从(生产)语言模型中大规模抽取训练数据。预印本于arXiv https://doi.org/10.48550/arXiv.2311.17035 (2023).
温格罗德,A. 嘴巴松的大语言模型会泄露你的秘密:大语言模型的隐私影响。哈佛法学科技期刊 36, 616–656 (2023).
姚,Y.等. 大型语言模型(LLM)安全和隐私调查:好的、坏的和丑陋的。高可信计算 4, 100211 (2024).
普格,S. L. 等人。说什么?从学生的真实对话中自动建模协作解决问题的技能。第十四届国际学习分析大会 proceedings55–67 (国际教育数据挖掘协会,2021)。
沙, L. 等. 自动分类教育论坛帖子的算法公平性评估。在第22届国际人工智能教育大会论文集381-394 ( Springer, 2021 ).
梅琳,R. & 普卡亚斯塔哈,S. 关于AI生成的文本摘要在研究生卫生信息学专业内容中的风险与收益。在第十一届国际医疗保健信息学大会 proceedings567–574 (IEEE, 2022).
沙,L.,拉科维茨,M.,达斯,A.,加舍维奇,D.及陈,G. 利用类平衡技术减轻教育预测任务中的算法偏见。IEEE学习技术 Transactions 15, 481–492 (2022).
沙, L., 李, Y., 加塞维奇, D. & 陈, G. 更多数据还是更公平的数据?通过主动采样增强BERT进行教育文本分类。在第29届国际计算语言学大会 proceedings1275–1285 (国际计算语言学委员会,2022)。
吴,J. 在人工智能背景下将心理健康教育融入大学公民课程教学的影响分析与评估。无线通信与移动计算 https://doi.org/10.1155/2022/5378694 (2022).
特利利,A. 等。如果魔鬼是我的守护天使:以ChatGPT为例探讨聊天机器人在教育中的应用。智能学习环境。 10, 15 (2023).
欧盟AI法案:首个关于人工智能的法规。欧洲议会 https://www.europarl.europa.eu/news zh-CN 头条新闻 社会 20230601STO93804 欧盟人工智能法案:首个针对人工智能的法规 (2023).
毛俊杰,陈斌和刘佳春. 教育中的生成式人工智能及其对评估的影响。科技趋势 68, 58–66 (2023).
杨,Z.等。AppAgent:多模态代理作为智能手机用户。预印本于arXiv https://doi.org/10.48550/arXiv.2312.13771 (2023).
维伯格,O.,哈塔卡,M.,巴尔特,O.及马弗罗迪,A. 高等教育中学习分析的现状。计算机与人类行为 89, 98–110 (2018).
西门子,G. 等人. 人类和人工认知。计算机教育人工智能 3, 100107 (2022).
贾尔维莱,S. 等人。混合智能——多现实中的人类与AI共进化和学习(HI)。在第2届国际混合人大会 proceedings–人工智能392-394 (IOS Press, 2023).
Long, D. & Magerko, B. 什么是AI素养?能力与设计考量。在2020年CHI大会人机交互会议 proceedings1–16 (ACM, 2020)
魏泽尔,B. 当你的律师使用ChatGPT时会发生什么。纽约时报(2023年5月28日)
Kabir, S., Udo-Imeh, D. N., Kou, B. & Zhang, T. Stack Overflow是否过时?对ChatGPT回答Stack Overflow问题的实证研究。在2024年人因因素在计算系统中的CHI大会 proceedings1–17 (ACM, 2024).
Bjork, R. A., Dunlosky, J. & Kornell, N. 自我调节学习:信念、技巧和错觉。《年度心理学评论》 64, 417–444 (2013).
Kabir, S., Udo-Imeh, D. N., Kou, B. & Zhang, T. 堆溢出过时了吗?对ChatGPT回答Stack Overflow问题的实证研究。预印本在arXiv https://doi.org/10.48550/arXiv.2308.02312 (2023).
拉弗纳,J.,比蒂,R. E.,考夫曼,J. C.,卢巴特,T. 和舍尔森,J. 生成式AI时代的创造力。自然人类行为学 журнал(或者直接使用原文,因为这是一个英文缩写,通常在中文文献中保留不变) 7, 1836–1838 (2023).
施耐德曼,B.以人为本的人工智能:可靠、安全及值得信赖。国际人机交互期刊 36, 495–504 (2020).
吉安尼尼,S. 生成式人工智能在教育中的应用:斯特凡尼亚·吉安尼尼的评论文章。联合国教科文组织.org https://www.unesco.org/en/articles/generative-artificial-intelligence-and-education-what-are-the-opportunities-and-challenges(联合国教科文组织,2023).
Kung, T. H. 等人。ChatGPT在美国执业医师考试中的表现:使用大规模语言模型辅助医学教育的潜力。PLoS 数字健康 2,e0000198 (2023).
Choi, J. H., Hickman, K. E., Monahan, A. B. & Schwarcz, D. ChatGPT上法学课程。J. 教育法 71, 387 (2021).
特维施,C.ChatGPT会获得沃顿商学院MBA学位吗?基于其在运营管理工作课程中的表现的预测(沃顿商学院,2023)
张,SJ等。使用大型语言模型探索MIT数学和EECS课程。预印本位于arXiv https://doi.org/10.48550/arXiv.2306.08997 (2023).
乔杜里,R.,德什穆克,N.及科普洛,D.不,GPT4不能通过MIT的考试。Raunak做开发 https://bit.ly/No-GPT4-can-t-ace-MIT (2023).
洛伦兹,P.,佩塞特,K.及贝里希尔,J.生成式人工智能的初始政策考虑事项(OECD, 2023)