该研究旨在评估人工智能辅助对放射科住院医师和高级放射科医生肺结节检出率的影响,并评估两种不同的商用人工智能软件系统在提高胸部 CT 的检出率和 LungRADS 分类。该研究队列包括 198 名参与者,有 221 个肺结节。在人工智能辅助下,居民平均检测率从 64% 显着提高至 77%,而老年人检测率基本保持不变(85% vs. 86%)。在人工智能的帮助下,居民的节段结节定位有显着改善,而老年人则没有。软件 2 在提高检测率方面略优于软件 1(6777% 与 8086%),但两者均未显着影响 LungRADS 分类。研究表明,临床经验可以减少对额外人工智能软件的需求,而 CAD 与住院医生的结合是最有益的方法。两个软件系统的表现相似,软件 2 的检测率略有提高,但增幅并不显着。
肺癌仍然是发病率最高的癌症之一,并且仍然是全球癌症相关死亡的主要原因1。2018 年,全球癌症观察站 (GLOBOCAN) 估计,全球新诊断肺癌人数超过 200 万,死亡人数超过 170 万。此外,预计未来十年肺癌的发病率将进一步增加3。因此,肺癌在未来仍将是一个非常重要的临床问题。
低剂量CT筛查可以在早期发现肺癌,并已被证明可以显着降低高死亡率中的癌症相关死亡率。- 风险组4。筛查有效性的关键是肺结节的识别和正确表征。尤其是小结节和亚实性结节的检测对于放射科医生来说仍然是一个挑战5,6。在此背景下,国际早期肺癌行动计划(I-ELCAP)研究报告显示,75%的确诊癌症患者在既往CT扫描中可回顾性检测到相应的小结节7。
根据 Torres 等人的一项研究,放射科医生在一次读取中漏掉了高达 35% 的小结节8。这些发现是相关的,特别是考虑到大量的肺癌筛查项目,导致越来越多的胸部 CT 扫描供放射科医生阅读。
解决这一问题的一个解决方案是计算机辅助诊断(CAD)系统。20 世纪 80 年代末,第一个 CAD 系统被开发出来,以协助放射科医生进行肺结节检测9。迄今为止,各种研究表明,CAD 系统的使用,特别是用作第二读取器设备时,可以显着提高结节检出率,并且已得到欧洲胸部影像学会 (ESTI) 的认可10,11,12。近年来,基于深度学习(DL)的 CAD 等新技术已成为研究焦点。与传统 CAD 相比,基于 DL 的 CAD 可以自主学习13。与传统的基于机器学习的 CAD 相比,基于 DL 的 CAD 甚至被证明在检出率和肺结节体积方面具有优越性14,15。甚至有人尝试通过基于 DL 的 CAD 系统来改进对新检测到的肺结节的恶性肿瘤风险的预测16,17。
DL-CAD 系统的主要局限性之一是其产生较高比率的倾向。假阳性结果的数量比人类读者多9,18。
虽然关于用于结节检测的 DL-CAD 系统的文献越来越多,但比较提高性能潜力的大型队列研究数量有限放射科医生18,19。
本研究的目的是 (1) 在第二个读取器设置中使用大型临床队列来评估两种不同的基于 DL 的 CAD 系统在肺结节检测和分类方面的性能,以及(2)评估对不同经验水平读者的影响。
本研究经当地伦理委员会批准,并按照赫尔辛基宣言(包括后来的修正案)。所有纳入的参与者均提供了书面知情同意书。
这项回顾性探索性研究由 205 名符合条件的受试者组成,有 228 个指标结节(亚实性,n = 66;实性,n = 162).
该队列由当地肺癌中心提供的 122 名患者组成,其中包括经组织学证实的 1 期 (T1) 肺部肿瘤患者。作为三级肺癌中心,主要机构作为当地参考中心;从而检索来自各个机构的 CT 扫描。
纳入的 CT 扫描是在 2010 年 12 月至 2020 年 12 月期间在 20 个不同机构获取的。
将研究队列扩大到足够多的人尺寸,我们回顾了过去两年在当地机构获得的胸部 CT 扫描。鉴于微结节代表性不足