
更容易获得的人工智能(AI)模型的开发改变了健康诊断和医学领域,AI用于诊断准确性,个性化治疗计划,解释医疗图像,简化操作,支持远程患者监测等等。
来自eHealth实验室在佛罗里达州立大学信息学院一直在评估AI的应用,以帮助医疗保健提供者进行更准确的患者诊断。该进步有可能增强治疗方法并改善患者预后。
高级作家兼董事FSU的成功寿命研究所 zhe他和客座助理教授Balu Bhasuran是多机构研究的合着者。这项研究已经引起了极大的关注,自3月中旬出版以来,该论文的访问量超过3,000次。
该论文发表在NPJ数字医学,扩展FSULABGENIE项目,一种旨在改善老年人对实验室测试结果的患者参与工具。
研究团队一直在探索使用大语言模型(LLM)的可行性,这是一种从大量文本中学习的AI,以准确回答问题,以协助临床医生并提高差异诊断的准确性和效率。鉴别诊断(DDX)是临床决策的关键步骤,帮助医疗保健提供者区分出相似症状的情况。
他说,AI产生的鉴别诊断在涵盖患者的所有可能诊断方面非常全面。”他说。这项研究有助于表明如何将AI用作帮助从业者为患者做出更明智的决定的工具。”
该研究涉及利用LLM生成临床医生评估的顶部,五和十大DDX的列表。研究人员评估了LLM的准确性和预测能力,并检查了合并实验室测试结果如何影响其诊断准确性。
这项研究有助于表明如何将AI用作帮助从业者为患者做出更明智的决定的工具。”
FSU成功长寿研究所的高级作家兼董事
该研究测试了五个LLMS - GPT-4,GPT-3.5,Llama-2-70B,Claude-2和Mixtral-8x7b使用临床小插曲或叙事性患者相关病例,这些病例来自50例病例报告。他们的发现表明,实验室测试数据可显着提高诊断准确性,而GPT-4的性能最高。
具体而言,GPT-4在实验室数据中实现了55%的顶级准确性和60%的前10个准确性,宽大精度达到80%。LLM通常正确解释了实验室测试,包括肝功能,代谢/毒理学面板和血清学/免疫测试。
Bhasuran说,当我们向模型询问模型的顶部鉴别诊断时,大多数模型都能够产生患者的确切诊断。”这非常有趣,因为它意味着即使在极少数情况下,该模型也能够预测。
该研究旨在帮助解决众所周知的关注领域,从提供者和患者的角度来看,在医疗保健环境中经常感受到。准确的诊断对于有效的患者管理,直接影响治疗决策和整体患者预后至关重要。减少诊断错误有助于简化患者护理,消除对过度或重复测试的需求,并最终通过减少住院和不必要的程序来降低医疗保健费用。
这项工作得到了医疗研究和质量授予机构并部分由佛罗里达大学弗洛里达大学州立大学临床和转化科学奖和国家医学图书馆。它还包括与坦帕综合医院和佛罗里达州立大学的合着者,南佛罗里达大学和北德克萨斯大学健康科学中心的合作者。FSU本科研究机会计划(UROP)学生Angelique Deville,Hailey Thompson,Maggie Awad和Yash Alva协助为案件报告提取关键信息。
要了解更多信息,请访问ehealthlab.cci.fsu.edu。.