医学可能是艺术和科学的结合,但是微软只是表明,这两种方法都可以通过机器人来学习。
该公司报告学习在预印本网站上发布arxiv它是基于AI的医疗程序Microsoft AI诊断编排者(MAI-DXO),正确诊断了85%新英格兰医学杂志。这是人类医生的准确率高四倍,他们在大约20%的时间内提出了正确的诊断。
这些案例是《杂志周刊》系列的一部分,旨在使医生陷入困境:诊断不明显的复杂,具有挑战性的情况。微软花了大约300例此类案件,并将其Mai-Dxo的表现与美国和英国的21位通用医生的表现进行了比较。为了模仿医生通常通过收集信息,分析信息,订购测试,然后基于这些结果的团队首先制定逐步进行逐步研究的决定来模仿此类案例。这使医生和AI系统都可以根据他们在每个步骤中学到的信息,类似于决策的流程图,并根据以前的信息收集到的信息,提出问题并决定下一步,例如订购测试。
将21位医生与一组合并的现成的AI模型进行了比较,其中包括Claude,DeepSeek,Gemini,GPT,Grok,Grok和Llama。为了进一步反映人类医生处理此类具有挑战性的案件的方式,微软团队还建立了一个编排者:对同事和咨询委员会的虚拟仿真,医生在复杂案件中经常寻求这些咨询。
在现实世界中,订购医疗测试要花钱,因此Microsoft跟踪了AI系统和人类医生下令查看哪种方法可以更便宜地完成的测试。
Mai-Dxo不仅在正确诊断上降落时远远超过了医生,而且AI机器人的平均成本低20%。
转化医学主席兼Scripps Research Translational Institute主席兼创始人Eric Topol博士说,准确性的提高远大于以前的研究表明。在大多数情况下,绝对百分比差异有10%,所以这是一个很大的跳跃。”但是真正引起他的注意力是成本。”不仅AI更准确,而且价格便宜得多,”他说。
Mai-Dxo仍在开发中,在研究之外尚不可用。但是将这种模型纳入医学可能会导致医疗错误减少,这占医疗保健成本的很大一部分,并提高了人类医生的效率,这反过来又可能导致患者的更好结果。
Microsoft AI首席执行官Mustafa Suleyman说,这是一个令人震惊的结果。我认为,以令人难以置信的负担得起的价格为世界上所有人提供最好的专家诊断,这使我们有一定的视线。”
苏莱曼说,十年前,当AI算法首次引入医学中时,它们专注于二进制任务,例如扫描图像以检测肿瘤。他说,今天,这些模型的质量很高,提出正确的问题并以正确的方式进行探测,建议在正确的时间进行正确的测试和干预措施。”
AI系统可能拥有的另一个优点是,它没有人类经验中固有的许多偏见。Microsoft AI副总裁Dominic King博士说,我们都有确认偏见。有时候,临床医生会看到一些东西并思考,``我确定这就像我上周见过的病人一样。但是AI的思考略有不同。”
阅读更多:乡村医院关闭的令人惊讶的原因
Mai-Dxo不仅吐出答案。它显示了它的工作,以便医生可以潜在地研究和审查其推理过程。苏莱曼说:“这是对人类临床医生的实时监督。”“这是我们之前从未见过的思维过程的一种透明度和可见性。反过来,这又可以改善教育和培训医生的进一步提高诊断准确性,并最终提高诊断准确性和最终患者。
尽管如此,一些AI和医学领域的专家仍指出,微软的方法并不完全是新颖的,因为它的诊断取决于多种AI模型的综合性能。马萨诸塞州综合医院首席数据科学官Keith Dreyer说:“在我看来,他们没有测试为医疗保健优化的任何单独模型。”“他们正在测试今天测试所有模型并将他们的决策结合在一起的概念。对我来说,这一部分并不奇怪。”
Dreyer还指出,结果并不一定会使此类系统更接近获得美国食品和药物管理局等监管机构的批准,而美国食品药品监督管理局(Us Food and Drug Administration)仍然没有对这种系统是否是医疗设备的权衡。
微软不是唯一探讨基于AI的医疗计划来诊断疾病的公司。Google正在开发一个基于对话的系统为了模仿来回医生的医生,模仿人类医生在收集患者信息并将这些症状解释以诊断出现的信息时的推理。在早期测试中,该系统在准确诊断模拟的患者案例研究方面优于医生。在2024年测试与使用案例研究进行的Microsoft类似,Google系统的早期版本可准确诊断出59%的病例,而人类医生的率为33%。但是,真正的测试将是这些AI系统在实际卫生系统中的表现。
这就是了解AI如何补充或补充医生在诊断疾病中的作用的下一步。他们的所作所为令人印象深刻。但是,直到他们在真正的医疗高速公路上取出医学习惯都不会改变医疗实践为止。
Topol希望AI系统将在不同的卫生系统中进行测试,在这些卫生系统中,可以在许多不同且更典型的情况下比较医生和AI平台。这将需要一项全面的临床试验,并获得监管机构的批准,以确保不会通过更严重地依靠基于AI的决策来提供医疗服务来遭受伤害。金说:“我们非常努力创建支持临床医生和患者以改变其健康所需的证据基础。”
如果得到证实,此类结果可能会为世界部分地区引入高质量的医学专业知识奠定基础,这些医学专业知识可能目前可能无法获得主要的学术机构或尖端的医疗保健。萨勒曼说:````我在未来五到十年中的主要重点是确保世界上的每个人都能获得各种最好的医疗建议。”我们对此感到非常非常兴奋。