微软说，在诊断复杂的健康状况方面，AI系统比医生要好

作者：Dan Milmo

微软揭示了人工智能系统的细节，该系统在复杂的健康诊断时的表现比人类医生更好，从而为医疗超级智能创造了道路。

公司的AI部门，由英国技术先驱穆斯塔法·苏莱曼（Mustafa Suleyman），已经开发了一个模仿一组专家医师来应对诊断复杂且智力要求的案例的系统。

微软表示，当与OpenAI的Advanced O3 AI模型配对时，其方法解决了10个案例研究中的八个以上，专门为诊断挑战而选择。当尝试这些案例研究以实践医生而无法访问同事，教科书或聊天机器人时 - 准确性率为10。

微软表示，它比使用人类医生更便宜，因为它在订购测试方面更有效。

尽管它突出了其研究中节省的潜在成本，但微软却表现出了工作的影响，他认为AI会补充医生的角色，而不是取代他们。

他们的临床角色比仅仅做出诊断要广泛得多。该公司在宣布这项研究的博客文章中写道，他们需要以AI为不愿意的方式进行歧义并与患者及其家人建立信任。

但是，使用口号，通往医疗超级智能的道路增加了医疗保健市场的根本变化的前景。尽管人工通用智能（AGI）是指在任何给定任务下与人类认知能力匹配的系统，但超级智能是一个同样的理论术语，指的是超过人类知识表现的系统。

微软AI的首席执行官苏莱曼（Suleyman）告诉《卫报》，该系统将在未来十年内完美运行。

很明显，我们正在通往这些系统在未来5 - 10年内几乎没有错误的道路。他说，这将是全球所有卫生系统的肩膀的巨大重量。”

在解释研究背后的基本原理时，微软对AI在美国医疗许可检查中得分出色的能力提出了怀疑，这是美国获得医疗执照的关键测试。它说，多项选择测试有利于记忆的答案，而不是对主题的深刻理解，这可以帮助夸大AI模型的能力。

微软表示，它正在开发一种系统，该系统像现实世界中的临床医生一样，采取了逐步的措施，例如提出特定问题并要求诊断测试以进行最终诊断。例如，在医生诊断出肺炎之前，患有咳嗽和发烧症状的患者可能需要进行血液检查和胸部X射线检查。

新的微软方法使用了《新英格兰医学杂志》（NEJM）的复杂案例研究。

Suleyman的团队将其中300多项研究转变为用于测试其方法的互动案例挑战。微软的方法使用了现有的AI模型，包括Chatgpt的开发人员，OpenAI，Mark Zuckerberg的Meta，Anthropic，Elon Musk的Grok和Google的Gemini。

然后，微软随后使用了一个定制的，类似于代理的AI系统，称为诊断编排者，与给定的模型一起工作，以进行哪些测试以及可能是什么诊断。演奏家实际上模仿了一组医生，然后提出了诊断。

微软表示，当与OpenAI的高级O3模型配对时，它解决了10个NEJM案例研究中的八个以上，而人类医生的10个成功率中有2个。

微软表示，它的方法能够运用超越个人医生的广度和深度，因为它可能涵盖了多个医学学科。

它补充说：扩展这种推理水平及以后 - 有可能重塑医疗保健。AI可以使患者能够自我管理护理的常规方面，并为临床医生提供对复杂病例的高级决策支持。

OC