X说,AI可以增强社区注意事项,但这有明显的风险。
埃隆·马斯克(Elon Musk)的X可以说是通过推出“社区笔记”来彻底改变社交媒体事实核对事实,该事实核实了“社区笔记”,该系统创建了一个系统,以众包某些X帖子是否值得信赖。
但是现在,该平台计划允许AI编写社区笔记,这可能会破坏X用户对X完全认可的事实检查系统的信任。
在研究论文,X将该计划描述为“升级”,同时解释了AI写的社区笔记可能出错的一切。
在理想的世界中,X描述了AI代理,这些AI代理会加快和增加添加到不正确职位的社区笔记的数量,从而加强了范围内的事实检查工作。每个AI编写的音符将由人类审稿人进行评级,提供反馈,使AI代理在编写音符方面更好,反馈循环周期的时间越长。随着AI代理商在编写笔记方面变得更好,这使得人类审稿人专注于AI无法快速解决的更细微的事实检查,例如需要利基专业知识或社会意识的帖子。X的论文建议,人类和人工智能评论者在一起,如果一切顺利,不仅可以改变X的事实检查,而且还可以提供“在生产公共知识中的新形式的人类合作形式的蓝图”。
然而,在仍然存在的关键问题中,这是一个很大的问题:X不确定AI编写的笔记是否与人类所写的注释一样准确。更复杂的是,AI代理似乎可能会产生“有说服力但不准确的笔记”,因为AI“在制定有说服力的,情感上的共鸣和看似中性的笔记方面,人类评估者对此可能会有所帮助。”X的研究论文警告说,这可能会破坏反馈循环,减少社区笔记,并使整个系统随着时间的推移不值得信赖。
该论文说:“如果额定的帮助与准确性完全没有相关,那么高度抛光但具有误导性的音符可能更有可能通过批准门槛。”“这种风险可能会随着LLM的发展而增长;他们不仅可以说服力地写作,而且更容易研究并为几乎任何主张(无论其真实性如何)建立了看似强大的证据,这使得人类评估者更难发现欺骗或错误。”
X已经对其AI计划面临批评。周二,前英国技术部长达米安·柯林斯(Damian Collins)指责X建立一个系统,该系统可以“对人们所看到的工业操纵和决定信任”,在一个平台上,有超过6亿用户,监护人报告。
柯林斯声称,AI笔记有可能增加X上的“谎言与阴谋论”的促进,而他并不是唯一发出的专家警报。艾伦·图灵研究所(Alan Turing Institute)新兴技术与安全中心的研究助理塞缪尔·斯托克韦尔(Samuel Stockwell)告诉《卫报》,X的成功在很大程度上取决于“ X的保障质量X的质量与这些AI Note note note作家可能会幻觉并放大输出中的误解的风险。”
斯托克韦尔说:“ AI聊天机器人经常在细微差别和背景下挣扎,但擅长于自信地提供答案,即使是不真实的,也可以说服力。”“如果平台没有有效解决,那可能是危险的组合。”
还使事情复杂化:任何人都可以使用任何技术创建AI代理来编写社区笔记,X的社区笔记帐户解释了。这意味着某些AI代理可能比其他人更有偏见或有缺陷。
如果发生这种反乌托邦版本的事件,X预测,人类作家可能会厌倦写笔记,威胁到使社区笔记的观点的多样性开始。
对于任何坚持的人类作家和审稿人来说,大量的AI写入音符可能会超负荷。英国一个事实检查组织AI负责人安迪·杜德菲尔德(Andy Dudfield)称为《卫报》(Full Fact Fact),他告诉《卫报》(Guardians),X风险“增加对人类审稿人的重大负担,以检查更多的笔记草案,为令人担忧和合理的情况打开了大门,在这些情况下,可以通过仔细考虑人AI来起草,审查和发表的笔记,而无需仔细考虑,就可以提供人类的投入。”
X正在计划更多的研究,以确保“人类评级能力可以足够扩展”,但是如果它无法解决这个谜语,它就会知道“最真实批评的笔记的影响”风险被淡化。
研究人员指出,解决这种“瓶颈”的一种可能解决方案是消除人类审查过程,并在人类评估者先前批准的“类似情况”中应用AI编写的注释。但是,那里最大的潜力是显而易见的。
X的论文承认:“自动将注释与人们认为需要它们不需要的帖子会大大破坏对系统的信任。”
研究人员承认,最终,X上的AI Note作家可能被认为是“错误的”工具,但他们继续进行测试以找出答案。
AI写的笔记将于本月开始发布
X的社区笔记帐户说,所有AI编写的社区笔记将为用户明确标记。”该帐户说,第一份AI票据只会出现在人们要求票据的帖子上,但最终可以允许AI笔记作者选择事实检查的帖子。
当本月晚些时候,当AI写入的音符开始出现在X上时,将会揭示更多信息,但与此同时,X用户可以立即开始测试AI Note作家并很快被考虑在AI代理的最初队列中入院。(如果任何ARS读者最终都会测试AI Note作家,则该ARS作者很好奇了解您的经验。)
对于研究的研究,X与研究生,研究分支机构以及研究主题的教授合作,诸如AI中的人类信任,微调AI和AI的安全,马萨诸塞大学技术学院,斯坦福大学和华盛顿大学。
研究人员一致认为,在某些情况下,AI代理可以“在很少的时间和精力中产生与人写的笔记相似的说明”。他们建议需要进行更多的研究来克服标记的风险,从而获得“变革性机会”的好处,而“有望大大提高对X的事实检查的规模和速度”。
该论文说,如果AI Note作家“产生代表比单个人类作家通常可以更广泛的观点的初始草稿,那么从一开始就可以提高社区审议的质量。”
AI笔记的未来
研究人员认为,一旦完成X的测试,AI Note Writors却不能只是帮助研究人类用户标记的有问题的帖子,而是有一天可以预测的帖子被预计会传播病毒,并停止错误地传播的速度比人类审稿人更快。
他们认为,来自该自动化系统的其他津贴将包括X Note Raters快速访问更彻底的研究和证据综合,以及更清晰的音符组成,这可能会加快评级过程。
研究人员推测,也许有一天,人工智能代理人甚至可以学会预测评分得分以加快进度。但是,需要进行更多的研究,以确保不会使社区笔记均匀,将它们抛光到没有人读的地步。
本文中提出的最重要的想法也许是培训AI笔记作家的概念,并以冲突的观点“对抗性辩论音符的优点”。据说,“可以立即帮助浮出潜在的缺陷,隐藏的偏见或捏造的证据,从而赋予人类评估者做出更明智的判断。”
该论文说:“评估者现在没有从头开始,而是扮演评估结构化论点的裁决者的角色。”
研究人员说,尽管X可能正在减少X用户编写社区笔记的工作量,但很明显,AI永远无法取代人类。这些人不仅仅是橡皮戳AI写的音符所必需的。
该论文说,“从头开始书写”的人类笔记对于培训AI代理人是有价值的,并且一些评估者的利基专业知识无法轻易复制。也许最明显的是,人类“是独特的定位,可以识别缺陷或偏见”,因此更有可能被迫写下“自动化作家忽略的话题”,例如垃圾邮件或骗局。