AI生成的医疗播客甚至欺骗了专家

研究人员首次评估了人工智能（AI）从同行评审的科学文章中生成播客。使用Google的NotebookLM应用程序，该团队根据发表在欧洲心血管护理杂志（（EJCN）。结果令人大开眼界：一半的作者没有意识到播客主持人不是人类。

该研究评估了AI是否可以模拟两位讨论已发表研究的演讲者之间的现实科学对话。在今年的心血管护理协会和盟友职业协会和同时的年度大会上提出了调查结果出版在EJCN。太抛光了，不能成为人类？AI生成的播客平均为10分钟。

大多数作者在不知道内容是机器生产的情况下说，他们的研究以简单的语言和结构化交付清楚地概述了。

有人甚至指出，托管的听起来就像他们具有临床或护理背景。

但是并非所有的反馈都在发光。几位参与者认为，交付是不自然的 - 缺乏犹豫，重复或有机的来回来源，促使人们怀疑AI的参与。其他人则标记了错误发音的医疗条款和事实错误。例如，一个播客专注于心力衰竭诊断而不是管理。尽管研究包括男性，但另一个人专门谈到了女性。

一些作者也因叙述的过度热情，美国风格的语气而分心，最高法是用来描述适度的结果。他们认为，更合适的语气将更合适 - 特别是如果该工具用于科学受众。

由比利时鲁汶市鲁文公共卫生和初级保健系的Philip Moons博士领导，研究人员创建了10个基于EJCN文章。尽管不完美，他们得出的结论是，AI生成的播客能够以易于理解和引人入胜的方式总结关键发现。

作者写道：``发现播客最适合患者和公众，但如果相应地量身定制，对研究人员和医疗保健专业人员也可能有用。”

播客一般而言，这令人震惊。知道我们正处于这种AI生成的播客的开始，随着时间的流逝，质量可能会在接下来的几个月内变得更好。”新闻稿。他认为该工具可以帮助研究人员更有效地传播他们的工作。

卫星在测试后得到了这个想法笔记本借助他自己的一篇论文，在Google于2024年9月推出该功能后不久。

在生成了播客之后，要求研究人员通过问卷调查和30分钟的视频采访来评估内容。

所有参与的作者都同意，播客以简单，可访问的语言有效地传达了其研究的关键发现。许多人还发现两个主机之间的对话格式使内容更具吸引力。

一些人称赞了主人的专业精神。一位作者说，我对他们的背景感到好奇。但是，有些人因缺乏入门背景而感到不安。这些播客没有提供有关说话者身份或如何产生音频的信息，使听众不确定源头。

总体而言，大多数人发现内容可靠，尽管有一些指出了事实错误。一位作者指出，肥胖被描述为一种习惯，可能会通过暗示这只是一种生活方式的选择来误导听众。

尽管存在这些问题，但其中一半的作者是AI专家 - 并未意识到播客是机器生成的。许多人说，他们对质量感到震惊或惊讶。大多数参与者是常规的播客听众。即使是那些怀疑AI参与的人也对结果的自然和流利感到惊讶。

所有作者都同意，未来版本应清楚地披露AI的参与。如果目标受众包括研究人员，则大多数人也建议采用更学术的基调，并更加关注研究方法和局限性。

尽管患者和公众被确定为主要受众，但研究人员指出，AI生成的播客可以作为医疗保健专业人员在新研究中保持最新的一种经济高效，可扩展的方式。他们还建议这种格式可以帮助扩大科学出版物的知名度和覆盖范围。

Moons说，这可能是一种可持续的模型，将信息传达给通常不阅读科学期刊的人们。”尽管如此，他还是强调了对人类监督的需求，以增加细微差别。

这种愿景可能已经成形。现在，Google Notebooklm的Beta版本（目前仅以英语提供）允许与AI实时互动。启动播客后，用户可以直接向其中一个主机提出问题。AI会产生口语回复，然后播客继续持续 - 无缝整合人机对话。

这个故事是从 Medscape的法语版。