维基百科宣战人工智能低质量内容

2024-10-10 17:10:07 英文原文

编辑们正在反击。

它开始了

AI生成的低质量内容威胁到了维基百科的可用性——而其编辑们正在反击。

作为404 媒体报告一群维基百科编辑集结起来创建了“WikiProject AI Cleanup”, которое 看起来这里出现了俄语的混入,正确的中文翻译应该是: 一群维基百科编辑集结起来创建了“WikiProject AI Cleanup”项目,描述自己作为一项合作,旨在打击维基百科上日益严重的无来源、质量差的AI生成内容的问题。

该团体明确表示他们并不希望完全禁止负责任的人工智能使用,而是致力于消除滥用的实例。来源不明的, 充满幻觉的或以其他方式无帮助的侵蚀了网络上数十年来积累的信息宝库的整体质量的人工智能生成的内容。

“该项目的目的不是限制或禁止在文章中使用AI,”准备战斗的一方在其维基百科论坛上表示。“但要验证其输出是否可接受且具有建设性,并在必要时进行修复或移除。”

频谱泄漏

在某些情况下,编辑们被告知 404,AI的滥用显而易见。一个明显的迹象是,使用AI工具的用户在维基百科条目中留下了众所周知的聊天机器人自动回复,例如以“作为一个AI语言模型,我……”或“截至我的最后一次知识更新……”开头的段落。编辑们还表示,他们已经学会了识别某些文字段落模式和“套话”,这使他们能够发现并消除粗制滥造的AI文本。

“我们中的一些人注意到了大量不自然的写作,这些明显是由AI生成的,而且我们成功地使用ChatGPT复制了类似的‘风格’,”WikiProject AI Cleanup发起成员Ilyas Lebleu表示。404指出“发现一些常见的AI套话让我们能够迅速识别出一些最糟糕的生成文章。”

仍然,很多质量差的AI生成的内容很难被发现,尤其是在复杂的材料中隐藏着听起来很自信的错误。

一个示例标记为404编辑们撰写了一部令人印象深刻的历史著作,描述了一个并不存在的“木质结构”的奥斯曼堡垒。尽管这一说法是错误的,但文本本身写得足够好,除非你专门研究13世纪的奥斯曼建筑,否则你可能不会发现这个错误。

正如我们此前报道的,维基百科编辑在某些情况下选择降低某些新闻网站(如)的可靠性评级。CNET —哪一个我们抓住了去年发布有错误的AI文章——作为一个直接结果of 的中文通常不单独使用,如果是在特定短语或句子中,比如表示所属关系可以译为“的”,否则保持原文: ofAI滥用.

由于大规模生产的成本极其低廉,限制粗制滥造的AI内容往往很困难。再加上维基百科一直是一个由志愿者驱动的众筹互联网项目,对抗AI垃圾内容的潮流变得更加艰难。

关于维基百科和人工智能:维基百科不再认为CNET是一个“通常可靠的”来源,因为在人工智能丑闻之后


关于《维基百科宣战人工智能低质量内容》的评论


暂无评论

发表评论

摘要

OnAI 的乱用威胁到了维基百科的可用性——而编辑们正在反击。“该团队明确表示,他们并不希望完全禁止负责任的AI使用,而是致力于消除那些来源不明、充满幻觉或其它无益的AI内容,这些内容损害了互联网上这个几十年来的信息宝库的整体质量。一个被编辑们标记给404的例子是一篇关于一座并不存在的“timbery”奥斯曼堡垒的历史文章,其制作得相当精良。正如我们之前报道过的那样,在某些情况下,维基百科编辑选择降低像CNET这样的新闻网站的可靠性——我们在去年发现了它发布错误频出的AI文章——这是直接由于AI滥用造成的后果。关于维基百科和AI的更多内容:在AI丑闻之后,维基百科不再认为CNET是一个“一般可靠的”来源