人工智能使抄袭变得更加复杂。科学家应该如何应对?
作者:Lenharo, Mariana
ChatGPT 以来的两年里已向公众发布,研究人员一直用它来打磨他们的学术写作,回顾科学文献和编写代码来分析数据。尽管有些人认为这款于 2022 年 11 月 30 日广泛亮相的聊天机器人提高科学家的生产力,其他人则担心这是助长抄袭行为,在研究文章中引入不准确之处,消耗大量能量。
人工智能使抄袭变得更加复杂。科学家应该如何应对?
总部位于新泽西州霍博肯的出版公司 Wiley 在 3 月和 4 月对 1,043 名研究人员进行了调查,了解他们如何使用 ChatGPT 等生成式人工智能 (AI) 工具,并将初步结果分享给自然。81% 的受访者表示,他们曾在个人或职业上使用过 ChatGPT,这使其成为迄今为止在学术界中最受欢迎的此类工具。四分之三的人表示,他们认为在未来 5 年内,研究人员开发人工智能技能来完成他们的工作将非常重要。
“人们之前使用过一些人工智能写作助手,但随着这些非常强大的大型语言模型的发布,发生了相当大的变化,”加利福尼亚州斯坦福大学的人工智能研究员 James Zou 说。引发翻天覆地变化的是聊天机器人 ChatGPT 的底层,它是由位于加利福尼亚州旧金山的技术公司 OpenAI 创建的。
为了纪念聊天机器人两岁了,自然收集了有关其使用情况的数据,并与科学家讨论了 ChatGPT 如何改变了研究领域。
Ø 60,000:2023 年发表的预计在大型语言模型 (LLM) 的帮助下撰写的学术论文的最低数量1。这略高于研究团队调查的学术出版物 Dimensions 数据库中所有文章的 1%。
Ø 10%:预计 2024 年上半年生物医学科学界成员发表的研究论文中摘要是在法学硕士的帮助下撰写的最低百分比2。另一项研究估计 2 月份计算机科学界的这一比例更高(17.5%)3。
Ø 6.5~16.9%:提交给 2023 年和 2024 年精选顶级人工智能会议的同行评审中,估计大部分由法学硕士产生的百分比4。这些审查评估为会议提出的研究论文或演示文稿。
HTW 柏林应用科学大学的计算机科学家兼抄袭研究员 Debora Weber-Wulff 表示,所有这些数据都是通过评估法学硕士特有的文本模式和关键词而获得的,可能都是保守估计。她的工作表明,检测工具无法确定论文是否是在人工智能的帮助下撰写的5。
在过去的两年里,科学家们发现,使用 ChatGPT 起草论文摘要、资助申请和学生支持信,可以让他们更有能力专注于复杂的任务。“值得我们花时间的事情是难题和创造性假设,”奥罗拉市科罗拉多大学医学院的医学信息学家米尔顿·皮维多里 (Milton Pividori) 说。
人工智能可以帮助你写下一篇论文吗?
研究人员表示,法学硕士对于克服语言障碍特别有用。“它使写作民主化,并帮助那些以英语为第二语言的人,”宾夕法尼亚州匹兹堡卡内基梅隆大学的化学家加布·戈麦斯说。11 月份在预印本服务器 SSRN 上进行同行评审之前发布的一项分析发现,ChatGPT 发布后,母语非英语的作者的论文写作质量有所提高,并且比母语非英语的作者的论文写作质量有所提高。英语流利6。
自 2022 年发布以来,ChatGPT 已进行了多次升级。GPT-4,2023 年 3 月发布,其生成类似人类文本的能力给用户留下了深刻的印象。最新型号,o1,九月份宣布的OpenAI 表示,它可以向付费客户和某些开发人员进行试用,可以“通过复杂的任务进行推理,并解决比以前的科学、编码和数学模型更难的问题”。加利福尼亚州莫菲特菲尔德湾区环境研究所的数据科学家 Kyle Kabasares 使用了 o1从他的博士项目中重新创建一些代码。当卡巴萨雷斯研究论文方法部分的信息提示时,人工智能系统在一小时内编写了代码,而这些代码花了他近一年的研究生学习时间才完成。
Pividori 表示,ChatGPT 和类似的人工智能系统迄今为止不太成功的一个领域是文献综述。“它们并不能真正帮助我们提高生产力,”他说,因为研究人员需要充分阅读和理解与其领域相关的论文。“如果这篇论文不是你研究的核心,你也许可以使用人工智能工具来总结它,”他说。但法学硕士已被证明会产生幻觉7——即编造信息。例如,他们可能会谈论论文中不存在的数字。
隐私是使用法学硕士的研究人员遇到的另一个问题。例如,当科学家将尚未发布的原始数据输入到这些人工智能工具之一中来撰写论文时,这些内容可能会被用来训练这些模型的更新版本。“这些都是黑匣子,”韦伯-武尔夫说。“您不知道上传到那里的数据会发生什么。”
人工智能模型是否比研究人员产生更多原创想法?
为了避免这种风险,一些研究人员选择使用小型本地模型而不是 ChatGPT。“您在计算机中运行它,不会与外部共享任何内容,”Pividori 说。他补充说,某些 ChatGPT 订阅计划可确保您的数据不会用于训练模型。
研究人员在过去一年中一直在追求的一个大问题是 ChatGPT 是否能够超越虚拟助手的角色,成为一名人工智能科学家。一些初步努力表明这是可能的。邹正在领导一个虚拟实验室的开发,其中不同的法学硕士在跨学科团队中扮演科学家的角色,并由一名人类科学家提供高水平的反馈。“他们共同制定新的研究项目,”他说。上个月,Zou 和他的同事在同行评审之前将其中一个项目的结果发布到预印本服务器 bioRxiv8。该虚拟实验室设计了纳米抗体(一种小型抗体),能够与导致 COVID-19 大流行的冠状病毒 SARS-CoV-2 的变体结合。人类研究人员通过实验验证了这项工作,并确定了两个有希望的候选者进行进一步研究。
Gomes 和他的同事也对在实验室中使用 ChatGPT 的前景感到兴奋。他们利用该工具设计并进行多种化学反应去年年底在机器人设备的帮助下。“我们期望这些模型能够发现新的科学,”戈麦斯说。
Gray, A. arXiv 的预印本https://doi.org/10.48550/arXiv.2403.16887(2024)。
Kobak, D.、González-Márquez, R.、Horvát, E.-à。& Lause, J. arXiv 的预印本https://doi.org/10.48550/arXiv.2406.07016(2024)。
梁,W.等人。arXiv 预印本https://doi.org/10.48550/arXiv.2404.01268(2024)。
梁,W.等人。arXiv 预印本https://doi.org/10.48550/arXiv.2403.07183(2024)。
韦伯-武尔夫,D.等人。 国际。J.教育。积分。 19,26(2023)。
Liang, Y.、Yang, T. 和 Zhu, F. SSRN 的预印本https://doi.org/10.2139/ssrn.4992755(2024)。
法夸尔,S.等人。 自然630、625–630 (2024)。
Swanson, K.、Wu, W.、Bulaong, N. L.、Pak, J. E. 和 Zou, J. BioRxiv 的预印本https://doi.org/10.1101/2024.11.11.623004(2024)。