作者:Abigail Brooks, MA
对于长期接受抗病毒治疗的慢性乙型肝炎患者,ML 模型比以前的传统 HCC 模型表现出更好的预测性能。
一种新颖的机器学习模型可能为预测病毒学和生化稳定的慢性肝细胞癌患者的新发肝细胞癌(HCC)风险提供更准确的工具。乙型肝炎病毒(HBV)经过5年有效的抗病毒治疗。1
提出的模型,创造了 –中号机器学习一个算法磷的改写L肝癌后5抗病毒治疗年数™ (MAPL-5),通过结合基于 36 个综合临床变量的逻辑回归和随机森林,解决了传统模型在这种情况下预测 HCC 风险的有限准确性。1
据世界卫生组织统计,到2022年,估计有2.54亿人患有慢性乙型肝炎感染,估计有110万人死于乙型肝炎,其中大部分死于肝硬化和肝癌。使用恩替卡韦 (ETV) 或替诺福韦 (TFV) 等强效核苷类似物 (NA) 治疗可显着降低 HBV 并发症和死亡风险,但这些患者的长期 HCC 风险仍然令人担忧。2– 随着病毒学和生化稳定的慢性乙型肝炎患者预期寿命的延长,预计 HCC 的总体发病率会增加。 – 韩国蔚山大学医学院牙山肝脏中心的 Han Chu Lee
韩国和同事写的。1– 因此,对于治疗前 5 年未发生 HCC 的 CHB 患者需要建立预测模型,因为这些患者发生肝癌的风险相对较低;然而,考虑到患者寿命的延长,绝对风险可能会逐渐增加。”
研究人员试图开发并验证一种机器学习模型,用于预测慢性乙型肝炎患者接受 ETV 或 TFV 治疗 5 年后的 HCC。为此,他们进行了一项多中心回顾性队列研究,利用来自 2 家医院的患者数据,这些患者在 2009 年 1 月至 2015 年 12 月期间开始 ETV/TFV 治疗并持续治疗超过 5 年。1在 ETV/TFV 治疗的前 5 年内诊断出 HCC 或其他恶性肿瘤的患者;
ETV/TFV 治疗开始时失代偿性肝硬化;ETV/TFV 治疗后 5 年内死亡或肝移植;没有定期监测 HCC 的发展情况;以及慢性肝病的其他明确病因被排除在研究之外。1
研究人员收集了基线数据,定义为首次处方日期和 ETV/TFV 治疗的 5 年标记。他们使用 36 个变量(包括基线特征和实验室值)来进行模型开发。总共 5 种机器学习算法应用于训练数据集,使用测试数据集进行内部验证,并进一步进行外部验证。1
该研究总共纳入了 6470 名患者,其中 5908 名患者和 562 名患者分别纳入推导队列和外部验证队列。研究人员注意到,推导队列中的患者明显比外部验证队列中的患者年龄大(平均年龄为 50 岁 vs 46 岁;磷—<.001)。男性患者的比例也较高(66.1% vs 58.4%;磷‐<.001) 和肝硬化患者 (60.0% vs 23.5%;磷—<.001)。1在中位随访时间为 8.6(95% CI,8.5–8.7)年期间,衍生组和外部验证组中分别共有 279 名(4.7%)和 25 名(4.5%)患者发展为 HCC。
5-15 年。1在 4726 名患者的训练数据集中,AdaBoost (0.729)、逻辑回归 (0.735) 和随机森林 (0.721) 表现出最高的平衡精度。
研究人员随后将各个模型组合起来进行集成学习,最终确定逻辑回归和随机森林相结合的集成模型优于非集成基线模型,最高平衡精度为 0.754,AUC 为 0.811。因此,选择该模型作为最终的预测模型。1研究人员进行了 3 个类别的消融研究,以评估每个变量对整体模型中整个系统的贡献,包括基线时是否存在肝硬化;
实验室值和 Child-Pugh 评分的绝对变化;以及实验室值和 Child-Pugh 评分的相对变化。最终的集成模型包含先前选择的 26 个变量的所有 3 个类别,在灵敏度、准确度、平衡准确度和 AUC 4 个指标上实现了最佳性能。1
在独立测试数据集(n=1182)中,结合 LR 和随机森林的 MAPL-5 模型表现出预测 HCC 发展的最佳性能,平衡精度为 0.712,AUC 为 0.784。研究人员注意到交叉验证结果与测试数据集之间的相似性表明模型存在最小的过度拟合或欠拟合。1此外,在独立队列中进行的外部验证 (n=562) 证实了 MAPL-5 模型的良好性能,在平衡准确度 (0.771) 和 AUC (0.862) 方面具有最高的准确度指标。1
研究人员承认这些研究结果存在多种局限性,包括对其他种族和不同 HBV 基因型的患者可能缺乏普遍适用性;需要对更多患者进行额外分析,以确定高风险与低风险的最佳临界值;
以及在前瞻性队列中进行验证的需要。1
研究人员总结道:“MAPL-5 模型可以协助从业人员进行临床决策、教育患者并为公共卫生组织制定有关 HCC 监测的循证政策。”1
参考