作者:by Hayley Kamin, Medical University of South Carolina
如果计算机可以阅读患者的医疗笔记并帮助医生确定其治疗的重要信息怎么办?
在MUSC Hollings癌症中心,由M.D. Jihad Obeid和Mario Fugal博士领导的研究人员正在使用高级形式的人工智能(AI)来做,这就是埋葬在医疗记录中的关键细节以量身定制的关键细节以量身癌症影响大脑。他们的高准确模型可以改变医生对转移性肿瘤进行分类和治疗的方式,提供更快的答案和更个性化的护理,而无需增加医生的工作量。
在新研究中,出版在JCO临床癌信息学,研究人员使用一种称为自然语言处理(NLP)的AI形式来解决一个令人沮丧的问题:如果患者安排了放射线以进行辐射,如何有效地在不同专业的医生之间在医生之间进行诊断的细节脑肿瘤。
大脑中的大多数癌症(称为脑转移)并未开始。相反,这些癌症开始于体内其他地方,例如肺,乳房,皮肤,肾脏或消化道,然后进入大脑。
知道脑转移的起源是临床难题中的关键部分。对于接受称为立体定向放射外科手术(SRS)的专门治疗的患者尤其如此,该治疗在一次会议中提供了高剂量的靶向辐射。虽然非常有效,但SRS确实有风险。这些包括辐射过多的副作用和附近健康的非癌组织的潜在损害。
但是,如果患者的治疗是根据其原始癌症类型量身定制的,则可以降低甚至避免这些风险,因为不同的癌症对辐射的反应不同。例如,肺癌对辐射非常敏感,可以用较低剂量治疗。相反,肾癌倾向于抵抗辐射,需要更长的治疗。
Fugal说:“大脑是一种敏感的器官,我们希望用辐射剂量尽可能精确。”“但是首先,我们需要知道我们到底正在处理什么,然后根据该信息制定特定的治疗计划。”
临床笔记包含有关患者诊断和治疗的大量信息。但是,潜入个体的患者笔记以提取相关细节是一个劳动密集型且耗时的过程。
Obeid解释说:“医疗记录从未为研究设计。它们通常是混乱且不完美的。”“但是,如果我们能理解它们,我们可以通过改善研究工作并实现更精确的护理来将它们变成帮助医生和患者的事物。”
那就是NLP的AI分支,该分支训练计算机了解人类语言可以提供帮助。NLP本质上允许计算机理解我们所说的内容,从而弥合了人类通信和计算机数据之间的差距。
有些人可能会因为需要一种更好的方法来识别癌症诊断而感到惊讶。医疗专业人员已经有一种常见的诊断语言来记录和追踪疾病,称为国际疾病分类(ICD)代码。
不幸的是,对于像脑转移等复杂情况,这些代码常常错过标记。这是因为ICD代码可能无法解决肿瘤的潜在来源,特别是对于一种以上癌症或癌症早期扩散时。这些代码还缺乏破坏癌症亚型的特异性。
福加尔说:“临床记录是最接近正在发生的事情的真相,因为它的细微差别是ICD代码所缺乏的。代码只会说'肺癌'。它不会进入左肺,肺的上部与小细胞的下部与非小细胞的肺部。
在这项研究中,研究人员开发了一个NLP模型,该模型可以“阅读”医生的笔记,并确定指示主要癌症类型的关键词和短语,例如,诸如乳腺癌的“导管”和皮肤癌的“黑色素瘤”之类的词。通过开发自动从临床注释中提取数据的NLP,研究人员希望使患者进行治疗和研究更容易。
Fugal强调:“有了更好的数据,我们可以设计更好的研究,更快地发现发现并为每个患者更精确地量身定制治疗方法。”
研究人员对NLP模型进行了测试电子健康记录具体而言,辐射肿瘤学说明了癌症类型和历史的详细描述。他们想看看该模型是否可以比标准医疗法规更准确地识别原始癌症诊断。
研究人员在82,000中测试了该模型临床注释来自病历在1400多名接受SRS治疗的患者中,用于脑转移。该模型旨在阅读笔记,查找文本中的模式,并使用该数据来确定每个患者的主要癌症类型。专家审阅者手动检查了说明以进行确认。
NLP模型非常准确。尽管ICD代码通常是错误的或不清楚的,但该模型在超过90%的病例中正确识别了原发性癌症。对于肺,乳腺癌和皮肤癌等常见癌症,分类几乎是97%的完美。该计划甚至可以识别ICD代码无法做到的肺癌亚型。这些结果验证了NLP作为临床数据提取的强大工具,能够超过传统医疗法规,以确定患者的原始癌症诊断。
福加尔说:“这种方法填补了关键的空白。”“我们的AI工具从医生的笔记中迅速,准确地将诊断从医生的笔记中提取,而没有为护理团队提供额外的工作。”
重要的是,该模型被设计为简单有效。它不需要大数据集,强大的培训示例或密集的计算能力,并避免了许多与较大的生成AI模型相关的道德问题。
奥贝德说:“这里的真正力量是这种方法是轻巧且可扩展的。”“即使资源有限,其他医院也可以轻松地使用此工具。”
研究小组将这项工作描述为针对癌症患者的数据驱动,个性化护理迈出的重要一步。提高效率和癌症分类的准确性最终可能意味着更快的研究,更好的治疗方法,对医生的猜测更少。
该小组现在正在使用类似的NLP方法进行一项研究,以识别出有辐射坏死风险的大脑肿胀风险的患者,这是辐射过多的罕见但严重的副作用。这种努力可以帮助更早地捕获并发症或完全避免它们。未来的研究人员还可以将NLP模型与其他卫生系统和其他癌症类型一起使用,也可以添加健康数据,例如成像扫描或实验室测试。
对于Obeid而言,这项工作反映了医疗保健的更大趋势:不仅将电子健康记录用于文档,而且是可以实时改善护理的丰富数据来源。
他说:“从已经在健康记录中的非结构化笔记中提取数据可以自动化数据集,从而构成了准确的,最新的数据集。”“这种方法节省了时间,并为放射外科手术和其他治疗后的结果进行更有意义的研究打开了大门。”
随着癌症治疗变得更加复杂,类似数据驱动的工具变得重要。通过教计算机阅读医生写的记录,研究人员正在帮助弥合原始数据与真实理解之间的差距。
更多信息:Mario Fugal等人,通过使用临床注释的自然语言处理来对立体定向放射外科患者进行分类,JCO临床癌信息学(2025)。doi:10.1200/cci-24-00268
引用:自然语言处理如何帮助医生(2025年7月31日)检索2025年7月31日摘自https://medicalxpress.com/news/2025-07-natural-language-aid-doctors.html
该文档具有版权。除了为私人研究或研究目的的任何公平交易外,没有未经书面许可,可以复制部分。内容仅用于信息目的。