加州大学洛杉矶分校 (UCLA) 的研究人员开发了一种新的深度学习人工智能框架,可以快速分析复杂的医学扫描,包括 MRI 和 3D 医学图像,其准确度可与临床专家相媲美。这项强调系统功能的研究发表在《自然生物医学工程》上。
该模型称为 SLIViT(Vision Transformer 的 SLice Integration),代表了医学成像领域的重大进步。与通常专注于单一类型扫描或特定疾病的现有模型不同,SLIViT 已经过一系列成像数据的测试,包括 3D 视网膜扫描、超声视频、用于肝脏疾病评估的 MRI 扫描以及用于肺结节筛查的 3D CT 扫描。研究人员表示,这一基础可以使其适用于本研究测试之外的其他环境。
人工神经网络(例如 SLIViT)通过处理由医学专家注释的大量数据集来发挥作用。传统的 3D 成像本质上很复杂,因为这些扫描将深度以及长度和宽度整合在一起。这一增加的维度需要更详细的分析,单个 3D 视网膜扫描可能包含多达 100 个独立的 2D 医学图像。专家通常需要花几分钟仔细检查这些图像,以识别细微的疾病标记。
共同第一作者 Oren Avram 指出,使用传统资源来编译和注释标准 3D 模型所需的大型体积数据集是不可行的,博士,加州大学洛杉矶分校计算医学博士后研究员。虽然存在多种模型,但它们的训练通常仅限于一种成像类型和特定器官或状况。
SLIViT 模型与其他 AI 模型不同,因为它包含两个 AI 组件和一种不同的学习方法,允许它加州大学洛杉矶分校博士生 Berkin Durmus 表示,我们发现 SLIViT 虽然是一个通用模型,但始终优于更专业的模型。谁参与了这项研究。我们表明,尽管 SLIViT 是一个通用模型,但与特定领域的最先进模型相比,它始终能够实现显着更好的性能。它具有临床应用潜力,可与临床专家手动专业知识的准确性相匹配,同时将时间缩短 5,000 倍。与其他方法不同,SLIViT 足够灵活和强大,可以处理并不总是处于完美顺序的临床数据集。
重要的是,Avram 说,他们的新系统可以用作基础模型,可以使用使用医学图像创建未来的预测模型。它的自动注释还可以使临床医生和研究人员受益,因为它可以降低数据采集成本和持续时间。
共同资深作者、加州大学洛杉矶分校健康中心眼科教授 SriniVas R. Sadda 医学博士表示,他对这一功能感到非常兴奋SLIViT 在现实条件下和少量训练数据集下执行的能力。SLIViT 在某些任务中只需数百个而不是数千个训练样本即可蓬勃发展,这使其在几乎所有与 3D 生物医学成像注释相关的实际案例中都比其他基于标准 3D 的方法具有显着优势。
团队意识到了潜力人工智能工具的偏差可能会对诊断准确性产生不利影响并加剧健康差异。虽然 SLIViT 注释过程的速度令人印象深刻,但研究团队计划确保减轻任何系统偏差。
展望未来,加州大学洛杉矶分校的研究人员将扩大他们的研究范围,包括其他治疗方式并探索 SLIViT 的潜力用于预测疾病预测。通过解决偏见和增强框架功能,他们希望促进早期诊断以改善治疗方案。