作者:Abbara, Ali
不孕症影响着全世界六分之一的夫妇,对人口健康构成重大挑战,被世界卫生组织认定为全球最严重的残疾之一1。辅助生殖技术(ART),包括体外受精(IVF)治疗,已成为帮助不孕不育患者的一种有价值的干预措施,进行的周期数量每年都在增加1。IVF 方案是为典型患者设计的,临床医生利用他们的经验和专业知识为每个人提供个性化治疗。此外,体外受精治疗周期会产生大量复杂的数据,这对于临床医生在做出此类治疗决策时充分吸收和利用来说可能是一个挑战。这可能会导致使用简化的“经验法则”来简化解释的常见做法。然而,这种方法可能是简化的,并导致丰富的可用信息的利用不足。在这种情况下,可解释的人工智能 (XAI),更具体地说是机器学习 (ML) 技术,凭借其处理复杂大型数据集的能力,为增强 ART 治疗的个性化和功效提供了机会2。
IVF 治疗的一个关键决定是确定卵巢刺激 (OS) 后何时开始下一阶段的 IVF 治疗,即“卵母细胞成熟的触发点”。触发因素通常是人绒毛膜促性腺激素 (hCG) 或促性腺激素释放激素 (GnRH) 激动剂,它提供类黄体生成素 (LH) 的暴露,使卵母细胞重新开始减数分裂并变得“成熟”,从而获得受精能力通过精子3。这是 IVF 治疗方案中的关键步骤,会影响取出的成熟卵母细胞的数量和治疗的成功。然而,触发给药时的卵泡太小或太大(称为“成熟后”),产生卵母细胞的可能性较小4,5,6。因此,在 OS 期间监测卵泡的大小,以确定施用触发剂的最佳时间。
卵母细胞数量与累积活产率呈正相关,尤其是在卵母细胞数量较低的情况下,因此优化卵母细胞产量是临床相关的治疗目标7,8。事实上,国际研究优先事项设定联盟已经确定了了解卵母细胞产量的决定因素9,但迄今为止只有少数研究旨在确定 OS 期间最有可能产生成熟卵母细胞的特定卵泡大小,这反过来又可以告知何时完成 IVF 方案的 OS 阶段5,10,11。
最近的一项前瞻性研究(n–= –157 名患者)旨在确定卵母细胞拾取 (OPU) 当天(通常发生在触发后 36-38 小时)最有可能产生成熟卵母细胞的卵泡大小,并重申卵泡尺寸较小的可能性较小5。然而,何时管理触发器的决定是在 OS 期间做出的(通常是 OPU 当天的约 2 天),这对这些数据的回顾性外推提出了挑战。同样,考虑到所有观察到的不同大小的卵泡解释起来很复杂,因此最大的或“领先”2-3个卵泡的大小通常用作替代(尽管不太精确)测量来表示整个卵泡群12。
关于这些主导卵泡的最佳大小的最终临床共识尚未确定13,这样 IVF 中心通常会使用两个或三个直径大于 17 或 18mm 的主导卵泡的阈值作为启动触发管理的简单标准10。然而,仅当招募了单个卵泡大小紧密的队列时,依靠领先卵泡来代表整个队列才是合适的,因此与单独考虑每个卵泡的大小相比缺乏精确度10。
在本研究中,我们使用 XAI 技术检查所有单个卵泡,以确定触发给药当天卵泡的大小,这对随后取出的成熟卵母细胞的数量贡献最大。这些数据可以帮助确定触发卵母细胞成熟的最佳时间,进而优化下游临床结果。我们还研究了卵泡大小对孕酮过早升高的影响,孕酮过早升高会促进子宫内膜成熟,使其在移植时与胚胎不同步,从而对活产率产生负面影响14。为此,我们利用了英国和波兰 11 家诊所的数据,纳入了 19,000 多名患者的第一个治疗周期。我们进行了迄今为止最大规模的研究,以确定最有可能产生成熟卵母细胞、受精卵和囊胚的卵泡,以优化临床结果并帮助 IVF 的个性化。
使用基于直方图的梯度提升回归树模型确定了触发当天 (DoT) 的卵泡大小,该大小对 OPU 当天取出的成熟卵母细胞数量贡献最大15。模型输入特征的较高排列重要性值表明最有贡献的卵泡大小。DoT 上尺寸为 12-20-mm 的卵泡对所有取出的卵母细胞数量的贡献相对最大(图 1)。 1a) (n-= -19,082),而尺寸为 13 - 18 - 毫米的卵泡对成熟(即中期 II (MII))卵母细胞数量的贡献最大(图 1) 1b) (n–= –14,140)。
当考虑下游实验室结果,例如两个原核 (2PN) 受精卵(即已受精的成熟卵母细胞)和高质量囊胚时,相似的卵泡大小仍然是最有影响的(图 1)。 1c、d)。具体来说,尺寸为 13-18-mm 的卵泡对 2PN 受精卵的数量贡献最大(n—=—17,822),(图 1c),14×20×mm的卵泡对于高质量囊胚最为重要(n–= –17,488)。作为敏感性分析,我们选择了胞浆内单精子注射 (ICSI) 治疗周期(
n–= –14,140),因为只有确认成熟的卵母细胞才会继续尝试受精,并且大小为 13 – 18 – 毫米的卵泡对产生 2PN 受精卵的贡献最大(n–= –13,415),但 15 – 18 – 毫米的更严格范围的卵泡最有可能产生高质量的囊胚(n–= –12,091)。年龄或治疗方案对最有贡献的卵泡大小的影响我们进一步研究了对 MII 卵母细胞数量影响最大的卵泡大小是否因年龄或所使用的 IVF 治疗方案类型而异。尺寸为 13-18-mm 的卵泡再次成为 35 岁患者中最重要的(
☀=☀5707)(图 2a),而在那些>35岁的人中(n-= -4717),尺寸为 11 - 20 - 毫米的更广泛的卵泡类别贡献最大(图 2) 2b),其中 15-18mm 的卵泡贡献最大。图 2:按患者亚组分层的成熟卵母细胞的贡献卵泡大小。对卵母细胞成熟度进行分级的 ICSI 治疗周期中卵泡大小(毫米)的治疗周期中的归一化排列重要性值(平均值±±SD)(n
–= –3981) 共同治疗方案对卵泡大小影响最大。在“长”方案周期中,大小为 14-20-mm 的卵泡对 MII 卵母细胞的贡献最大(图 1)。 2c),而尺寸为 12-19-mm 的卵泡在“短”方案周期中最为重要(图 1) 2d)。触发给药前几天最有贡献的卵泡大小为了进一步验证结果并检查卵泡大小(如果 OS 期间的最终超声扫描是在 DoT 之前进行的),我们对倒数第二天也进行超声扫描的患者的数据实施了两个进一步的模型 (DoT-1;n
= 9533 名患者),在 DoT 之前(图 1) 3一个)。DoT-1 上贡献最大的尺寸范围为 12 - 16 - 毫米,DoT-2 上为 10 - 15 - 毫米,这对应于每天 1 - 2 - 毫米的预期平均卵泡生长率16。图 3:触发前几天的贡献卵泡以及触发当天的可解释性。一个ICSI 治疗周期中卵母细胞成熟度已在交叉验证方案中的所有 11 个诊所进行平均分级的治疗周期中卵泡大小(以毫米为单位)的标准化排列重要性值(平均值±±±SD)。三个独立的模型接受了治疗周期的训练,其中在触发(DoT)给药当天可以进行超声扫描(
1。对于每个模型,报告所有交叉验证折叠的平均性能及其标准差 (SD)。一般来说,经过广泛的超参数调整(补充表2),所有模型的结果相似。平均绝对误差 (MAE) 和中值绝对误差 (MedAE) 的单位对应于卵母细胞、MII 卵母细胞、2PN 受精卵或高质量囊胚的绝对数量。预测 ICSI 群体中成熟卵母细胞的模型(n = 14,140 名患者)执行 MAE 3.60 (SD 0.35) 和 MedAE 2.59 (SD 0.31),这是“内部-外部验证”程序期间 11 个诊所的平均值。补充表中列出了每个诊所预测所有卵母细胞和 MII 卵母细胞的模型的性能 1,并且每个诊所收集的颜色编码的预测与实际 MII 卵母细胞的图显示在补充图 1 中。 1。用于预测 MII 卵母细胞的多层感知器模型的评估显示出较高的 MAE 3.85 (0.53),将 14-18-mm 卵泡确定为最重要的。当在预测 MII 卵母细胞的单独模型中排除 ICSI 群体的潜在异常数据时(n–= –11,819),平均 MAE 提高到 2.54 (0.45),右2至 0.49 (0.06)。表1 预测临床结果的模型性能此外,为了进一步验证结果,图 1 中显示了一个诊所的“SHAP”值图。
。在类似范围的中等大小的卵泡中观察到“SHAP”值显着增加,特别是当存在三个或更多该大小的卵泡时。这反过来又对应于对 MII 卵母细胞的期望增加。相反,当没有中间范围内的卵泡大小计数时,“SHAP”值会出现负值。极值中的卵泡大小对应于 MII 卵母细胞预期的最小增加,即使存在许多卵母细胞,与图 1 中所示的分析一致。 1b。
我们评估了不同变量对训练模型预测 MII 卵母细胞数量的影响。虽然 13-18mm 的卵泡对取出的成熟卵母细胞数量的相对贡献最高,但这并不意味着其他卵泡也没有贡献,尽管程度相对较小。如果我们根本不考虑卵泡大小并包括 DoT 上的卵泡总数(无论大小如何)(即所有卵泡大小为 6-26-mm),则生成的模型的 MAE 为 3.92-(0.45)和右20.26-(0.15)。当考虑单个卵泡大小范围时,我们发现大小为 12–23–mm 的卵泡数量最能预测(相对于最低 MAE)所获取的成熟卵母细胞数量 (MAE 3.71–(0.23);右20.31-(0.12))。然而,我们的 ML 模型考虑了每个卵泡大小的计数以及该大小的卵泡的相对贡献,具有更高的预测性能(MAE 3.60(0.35);右20.35 (0.13))(表 1)。纳入其他变量,包括:年龄、体重指数、刺激天数、触发类型、IVF 方案和 DoT 给药中的雌二醇(n-= -2068)作为单独的输入变量,仅将 MAE 提高了 0.06 个单位(MAE:3.54 -(0.36))并且右20.01(右2:0.36-(0.12))。总体而言,DoT 上卵泡大小的知识是估计回收的 MII 卵母细胞数量的最重要因素。成熟卵母细胞产量的提高我们使用了所有成熟度分级患者的数据(ICSI 周期;n
4a)。我们计算了 MII 卵母细胞的百分比产量除以 DoT 上所有卵泡(大小 6×26mm)的数量(此处表示为“成熟卵母细胞产量”)。最大正中位数差异被记录为 10% 的改进 (Mann-WhitneyU-测试:p当 DoT 上至少存在 3 个大小为 17mm 的卵泡时,成熟卵母细胞产量会降低 -< -0.0001)。当 DoT 上存在两个大小为 17mm 的卵泡时,成熟卵母细胞产量的改善最小(p≤=≤0.229)。图 4:不同触发标准下的成熟卵母细胞产量。
4b),DoT 上至少有 10% 的卵泡在 13-18-mm(或 15-18-mm)范围内,与成熟卵母细胞产量提高 >10% 相关(p–< –0.0001)。此外,在最佳尺寸范围内最大化 DoT 上的卵泡比例可以进一步提高成熟卵母细胞的产量,例如,当至少 70% 的卵泡尺寸为 15-18-mm 时,产量可提高高达 42%(p–< –0.0001)。卵泡大小对活产率的影响大小为 13-18mm 的卵泡对获取的 MII 卵母细胞数量贡献最大,因此我们分析了该大小范围内的卵泡比例是否与新鲜胚胎移植后的活产率 (LBR) 相关。
–= –12,724)。使用逻辑回归模型(nØ=Ø9209),我们发现DoT上13Ø18Ømm内的卵泡比例与LBR呈正相关(OR:每10%点变化1.03(1.00Ø1.06);p–= –0.048)当根据年龄、总卵泡计数和所施用的触发类型进行调整时(图 1)5a)。接下来我们检查了平均卵泡大小是否影响 LBR(图 1)。5b),并发现负关联(OR:每 1 毫米变化 0.95 (0.93–0.98);p≤=≤0.001)。我们发现LBR(n = 427) 随着 DoT 上黄体酮升高而减少(图 1) 5c),而成熟卵母细胞产量(n�=�646) 保持相似。此外,DoT 上的血清孕酮(n随着 DoT 上尺寸 > 18mm 的卵泡数量增多,α=α994)逐渐升高(图 2)。 5天)。图 5:卵泡大小分布和黄体酮升高对活产率的影响。
与使用主导卵泡大小来告知触发时间相比,我们的数据表明,最大化该大小范围内的卵泡比例可以进一步优化取出的成熟卵母细胞的数量,以改善 IVF 结局,包括 LBR,有待前瞻性评估。此外,延长 OS 持续时间会导致 DoT 上出现更多较大的卵泡 (>18mm),这不仅对成熟卵母细胞的产量贡献较小,而且还会导致黄体酮过早升高,从而对活期产生负面影响。出生17 号,18,可能是由于其对子宫内膜阶段的不利影响14。这些数据凸显了机器学习方法在帮助个性化 ART 治疗以优化临床结果方面的潜力。
我们的结果与之前的一项试点研究一致,该研究使用了 499 名患者的较小样本量,该研究发现 DoT 上尺寸为 12-19-mm 的卵泡对成熟卵母细胞的数量贡献最大10。哈里顿等人。发现包含 DoT 上大小为 16-20-mm 的卵泡数量的输入特征对模型性能影响最大,该模型使用来自单个诊所的数据(包含采用各种方案的 7866 个 ICSI 治疗周期)中具有相似复杂性的整体 ML 模型类型19。同样,Reuvenny 等人。对来自单个中心的 GnRH 拮抗剂(短方案)联合治疗周期的数据使用 XGBoost 模型(n= 3599 个治疗周期),表明 DoT 上 14-16-mm 大小的卵泡的输入变量对模型性能有很大贡献20。此外,范顿等人。利用来自美国三个诊所的数据开发了一个线性回归模型(n–= –30,278 个治疗周期),确定 DoT 上 14 – 15 – 毫米大小的毛囊输入变量最重要,其次是 16 – 17 毫米毛囊大小21。在我们的研究中,我们检查了单个卵泡的大小,以确定对成熟卵母细胞的回收以及下游临床结果贡献最大的卵泡组。
为了进一步验证该方法,我们还分析了 DoT 前几天最重要的卵泡大小。我们发现,DoT-2 上尺寸为 10-15-mm 的卵泡和 DoT-1 上尺寸为 12-17-mm 的卵泡对于预测 DoT 前几天的 MII 卵母细胞产量贡献最大。最佳卵泡大小范围变化的平滑轨迹很好地证实了 OS 期间每日平均卵泡生长率的预期16。上述 ML 研究也显示出一致性,其中利用卵泡大小的模型的最重要输入变量在 DoT 前一天的范围内下降了 1-2-mm20,21。
为了检查相似的卵泡大小对于预测卵巢反应良好的患者是否重要,我们按年龄对数据进行了分层。我们发现,大小为 13-18-mm 的卵泡对于年龄≤ 35 岁的年轻患者影响最大,但那些 11-20-mm(尤其是 15-18-mm)的卵泡对于年龄 > 35 岁的患者最重要。35 年。根据我们的数据,即 OS 结束时平均卵泡大小的增加与 LBR 的负面影响相关,有人建议,卵巢储备功能减弱的老年患者可能会受益于修改自然周期中的早期触发给药22。迄今为止,年龄对 IVF 周期触发时间的影响仍不确定。同样,尽管大多数患者必须不吸烟才能获得国家资助的护理,但吸烟状况的记录不足,无法正式评估吸烟的影响。
据推测,由于前一段时间的促性腺激素抑制可以使卵泡生长同步,因此 GnRH 激动剂联合治疗(“短”)方案可能会导致比 GnRH 拮抗剂联合治疗更均匀的卵泡群。处理过的(“长”)协议23。我们发现,在 GnRH 激动剂联合治疗方案周期中,尺寸为 14-20-mm 的较大卵泡对成熟卵母细胞的产量贡献更大,而尺寸为 12-19-mm 的卵泡在 GnRH 拮抗剂方案周期中最重要。七项随机对照试验的荟萃分析(n–= –1295 名患者)比较方案类型发现,接受“长”方案的患者获得的卵母细胞数量明显更高(p–< –0.00001) 对于那些在 OS 后 24 – 48 – 小时收到延迟 hCG 触发的患者24。我们的数据与之前的这些试验一致,表明较大的卵泡可能与 GnRH 激动剂联合治疗方案中卵母细胞产量的提高有关25,26。我们提出的研究应该强调几个优点。首先,我们在研究中使用了 XAI 技术。
目前,可解释性是 ART 诊所中人工智能决策的一个重要特征,引入与临床推理相一致的数据驱动的见解将促进 ART 领域临床决策支持系统的更广泛采用。2,27,28。其次,使用两个国家(包括 11 个诊所)的数据呈现出具有不同临床实践和治疗方案的异质患者群体。由于涉及许多诊所,因此在这个开发阶段使用内部-外部验证是合适的29,30,由于每个诊所都充当独立的测试集来观察排列重要性和模型误差,因此开发的模型及其性能指标具有标准差。此外,在报告结果指标时,我们选择避免在训练和测试集中对来自同一诊所的数据进行随机分割,因为这已被证明会导致对更广泛患者群体的偏见和未知的普遍性(“可移植性”)30。第三,通过仅使用单个卵泡大小作为单独的输入变量(即不以分组/分箱的方式),可以更明确地识别对成熟卵母细胞产量贡献最大的连续范围的卵泡。最后,我们确保仅将每位患者的第一个治疗周期纳入本研究中,以进行模型开发和验证(即,n–= –19,082 代表未接受治疗的患者数量和周期)。这是为了避免单个患者的连续周期之间的自相关(例如,临床医生的决策可能会受到先前治疗周期的影响),因为连续周期的纵向随机效应可能会影响排列重要性31。同样,呈现多重共线性的输入参数(例如,雌二醇和卵泡大小32)也可能导致排列重要性分析得出不可靠的见解。
观察者内部和观察者之间卵泡大小测量的差异一直是 ART 中记录的挑战33。我们观察到一些案例,取出的卵母细胞总数超过了触发时记录的卵泡数。这种差异强调了较小的卵泡通常无法一致记录的可能性,这种做法在与临床医生的轶事讨论中得到了呼应,他们经常将此归因于此类卵泡产生卵母细胞的可能性较低。先前的研究表明,在这种特定情况下,卵泡插补对增强模型性能的影响有限21。尽管不包括这样的治疗周期可以人为地改善模型误差,但不可能构建模型,这些模型对于将来的应用中的测量误差更为强大。我们的方法利用具有贝叶斯优化的基于合奏的ML模型,可以减轻由于生物学变化和/或测量误差极端而导致数据不一致的影响33。通过采用损失度量标准(MAE),对离群值不太敏感,该模型提供了在多个诊所进行验证的更强大的分析。需要通过自动化算法的整合而需要更客观的超声扫描方法,可能会进一步提高卵泡测量和相关算法的准确性和可靠性33。
我们的数据表明,一种新型的方法来决定何时管理卵母细胞的触发器可能是基于中等大小的卵泡(例如13 18毫米)的比例,而不是基于传统的阈值方法评估2何时2â3铅卵泡达到17或18毫米的尺寸(图。4)。此外,我们的数据还表明,平均卵泡大小可能会影响新鲜胚胎转移周期中的LBR(图。5),除了对产生卵母细胞的能力的直接影响,可能会通过较大的卵泡导致过早的孕酮高升高34,35。与当前基于阈值的方法相比,基于整个卵泡同类群体确定触发器的新方法,需要一项前瞻性随机对照试验来确定我们提出的新方法的好处。由于我们的数据表明了LBR和延迟触发器给药之间可能的权衡,因此在此基础上比较触发策略的试验对于确定触发时间对临床结果的影响而言可能更确定。应该注意的是,尽管一系列卵泡大小相对较大,但根据所考虑的患者分层而变化略有不同(图。 2)。最终,可以考虑将单个卵泡大小及其相对贡献的ML模型作为临床决策支持系统的一部分来利用2,28。
总之,我们确定触发当天中等大小的卵泡对成熟卵母细胞和随后的胚胎发育的贡献最大。利用所有卵泡的尺寸,而不仅仅是仅铅卵泡的大小,就可以为OS方案提供目标,并告知触发给药的时间以优化临床结果。这些数据突出了XAI技术提供数据驱动的IVF治疗优化以改善临床结果的潜力。
我们使用了来自19,082名女参与者的多民族队列的数据,这些数据在2005年至2023年之间在英国(9个)和波兰(二)中分布的11个诊所之一接受过治疗(Tableâ) 2)。我们选择了经阴道超声扫描的治疗患者,在与DOT给药的同一天,至少三个卵泡> 10 mm。该队列在接受中位体重指数(BMI)为24.17 kg/m时为18岁49岁2 - 肛门卵泡计数为15.00。在可用的地方,对卵母细胞成熟度等级的评估详细介绍了中期II卵母细胞(n= 14,140名患者)用作主要结果(即在ICSI治疗周期中)。下游结果,例如2pn zygotes的数量(n= 17,822例患者周期)和高质量的胚泡(n还评估了17,488例患者周期)。如果患者在电子健康记录中无法获得特定人口统计信息或临床结果的数据,则将这些数据排除在各自的分析之外,并在表格中指出 2。表2患者人口统计和治疗信息研究批准
所有艺术诊所均受到人类施肥和胚胎学局(英国)或卫生部(波兰)的许可。
这是一项回顾性队列研究,分析了来自IVF或ICSI周期的卵泡和卵母细胞数据。目的是确定最有可能产生成熟卵母细胞的卵泡大小,因此为卵巢刺激和预期的卵母细胞数提供了目标。
经常建议患有卵巢过度刺激综合征(OHS)或被认为具有早孕酮高升高的患者的胚胎冷冻保存,等待冷冻胚胎转移(称为冻结 - 所有)3。冻结策略可以减轻由于过早孕激素升高引起的植入风险,尽管以增加怀孕时间和围产期并发症的风险为代价14。为了分析本研究中的活产,女性接受了新鲜胚胎转移的IVF或ICSI,并进行了最终的超声扫描,以评估DOT给药的卵泡大小。使用含有FSH活性的每日制剂诱导卵泡生长。患者采用了抑制剂方案,以防止使用促性腺激素释放激素(GNRH)激动剂(长方案;n= 6990)或对手(简短协议;n= 7408)共同处理的协议。之后,任何人绒毛膜促性腺激素的触发因素(HCG;n= 13,473)或gnRH激动剂(n一旦两到三个卵泡的直径达到17毫米(临床医生的决定),通常会施用1675年)。在所有分析(即治疗患者)中,仅使用了患者的第一个记录的IVF周期。对DOT进行超声扫描的患者进行了主要分析。将实验室结果(包括评估卵母细胞成熟度,胚胎质量和胚泡质量)作为结果指标。
随后对仅接受ICSI治疗的患者进行了随后的分析,并在倒数第二名(dot-1; - n= 10,457)或盘问(dot-2; n= dot之前的9533)作为进一步的方法论验证。统计分析数据预处理
因此,将相同大小的卵泡直径分组,并以1 mm的速度从DOT上的6至26 mm计数。我们将单个卵泡大小用作输入变量:
$$ {{{{\ bf {x}}}} = {x} _ {6},...,{x} _ {26} _ {26} \\ \ \ \ \ \ \,{{{\ rm {where}}}}}}}}}}}}} \ quad{x} _ {6} = {{{{\ rm {nreams}}}}}} \,{{{{\ rm {of}}}}}}}}} \,{{{\ rm {\ rm {follacles}}}}}}}}}}}}}}}}}}}}}}}\ rm {sip}}}}} \,6 \,,{{{{\ rm {mm}}}}}},\,\\ {x} _ {7} = \,{{{{\ rm {nreams}}}}}}} \,{\,{{{{\ rm {follacles}}}}}} \,{{{{\ rm {siped}}}}}}}}} \,7 \,{{{\ rm {\ rm {mm {mm}}}}}}}}}}}}}}}}}}}{{{\ rm {and}}}}} \,{{{{\ rm {so}}}}} \,{{{\ rm {on}}}}}}}。$$
(1)
对于结果度量,所有卵母细胞的数量(y哦哦c)在回归模型中使用了更具体的MII卵母细胞(代表所有能够受精的卵母细胞的子集)。为了使正确的偏度正常化,使用自然对数转化了结果:$$ {y} _ {out} = \ ln({y} _ {ooc} +1)$$(2)在模型测试和评估过程中进行了反转换(3)。
在其他分析中,使用相同的转换策略,将2PN合子的数量和高质量胚泡的数量用作结果度量。
由于患者经常经常发生几个艺术周期,因此我们确保仅在数据集中包括每个患者的第一个记录周期,以防止通过纵向信息库的可用性引入的个体内部相关性,以便连续治疗中的决策信息
尝试31。
$$ {y} _ {ooc} = \ exp({y} _ {out}) - 1 $$
(3)
训练了几个基于直方图的梯度提升回归树模型15。这是一个受LightGBM(Microsoft)启发的开源库,使用直方图数据结构进行了更快的构建过程。我们采用了一个临界式交叉验证(Loco-CV)程序来训练,验证和测试模型(所谓的内部外部验证29)。使用带有贝叶斯优化的嵌套loco-CV优化了平均绝对误差(MAE)作为目标函数,以调整补充表中所示的搜索空间中相关的超参数 2。此过程是每个Loco-CV折叠的地方,第十一(诊所)折叠代表一个独立的测试集。在其他十倍之内,第十是用于调整超参数的验证集,其余9个被用作十倍交叉验证的训练集。选择MAE是因为它对离群值不太敏感,并且直观地证明了模型中的误差,因为绝对误差可以解释为单位损失卵母细胞。
实施了十个独立的模型管道,并采用各种输出度量,包括卵母细胞,MII卵母细胞,2pn Zygotes和高质量的胚泡。进一步的模型分层包括年龄和IVF方案类型(长期GNRH激动剂或短拮抗剂)。为了确保通过使用患者队列的一部分来分析收集的MII卵母细胞(如果有成熟度分级)不会影响结论性的卵泡尺寸范围,我们培训了模型以比较两种同类群中所有卵母细胞的结果(即19,092,即19,092其中14140例患者接受了ICSI治疗)。此外,为了研究离群值和潜在异常数据的影响,我们将数据集限制为单独的模型的数据集限制为检索1 30 mii卵母细胞的周期,而DOT上的卵泡数量至少等于MII的数量检索卵母细胞(n= 11,819名患者)。利用相同的Loco-CV程序,我们合并了感兴趣的进一步输入变量,例如年龄,BMI,刺激天数,IVF方案类型(长GnRH激动剂或短暂的GNRH拮抗剂),雌二醇
在点以及触发的类型上(HCG或GNRH激动剂),以观察成熟卵母细胞模型的预测能力是否得到改善。我们比较了MAE和右2值得注意的是仅使用点上的卵泡大小作为输入。同样,要观察模型复杂性和解释性之间的权衡取舍的任何显着影响,我们对MII卵母细胞的主要结果进行了建模(n
使用多层感知器模型(一种浅的人工神经网络),并报告了其MAE。识别最大的卵泡大小解释性是艺术的当前优先事项,临床医生通常更喜欢避免黑盒治疗建议
,36。因此,合奏方法在处理非线性和复杂的基本数据方面提供了有价值的权衡,并伴随着可解释的见解。仅一旦对每个模型进行训练和验证(总共最多使用十倍),则是使用Loco-CV协议中的第十一独立测试集的列出的五个运行中确定的均值和标准偏差37。在此范式中,特征随机调整以查看其对模型损失的影响(此处设置为MAE)。为了识别产生成熟卵母细胞的关键卵泡,我们使用了对模型的50%归一化贡献的阈值来表明相对重要性;如先前文献中所述,我们假设这个最大效用的卵泡大小范围是连续的5,10。为了从数据中建立进一步的见解,我们还分析了在倒数第二次进行最终超声扫描的患者(n= 10,457)和敌种(n= dot给药前9,533天。我们使用这些患者队列来确定是否观察到重要卵泡大小的逐步轨迹。预测能力和模型解释性
38,被用来提供进一步的解释观点,并从排列的重要性分析中加强了我们的发现。与观察模型丢失的变化相反,Shap范式考虑了特征联盟,以估计每个特征对预测值的贡献,该值可能是损失函数的单位(即MII卵母细胞单元)。Treeshap软件包已针对基于树的模型进行了优化,并近似于结果的边际期望和每个功能的贡献39。
另外,为了确定哪种单个卵泡范围最可预测成熟的卵母细胞,我们在整个11个诊所中使用单变量线性回归评估了特定尺寸范围的预测能力(n= 14,140)。然后,为了确定哪个范围是检索到的成熟卵母细胞数量的最终预测的,我们使用相同的方法比较了所有可能的卵泡大小范围,该方法对MAE优化了损耗函数。
我们考虑了患有ICSI的患者队列(n= 14,140)记录了MII卵母细胞的数量以比较当前在临床实践中使用的基于阈值的标准,以及基于最大化最佳尺寸范围内卵泡比例的建议方法。对于典型使用的基于阈值的标准的四个变化中的每一个,以确定DOT给药(即两个或三个卵泡大于17或18 mm),我们评估了每个患者周期是否满足此标准,并分组相应地。我们比较了这两组患者的成熟卵母细胞产率中位数的相对差异(成熟的卵母细胞数量除以DOT的总卵泡数量),并使用Mann-Whitney进行了比较U - 测试(图 4a)。
对于基于范围的标准,我们在卵泡大小范围内的卵泡百分比的不同最小截止量(例如,¥5%,¥10%等)中进行了相同的分析。,在最大化该范围内的卵泡大小时检查成熟卵母细胞的任何改善(图) 4b)。所有统计比较均使用两边的Mann-Whitney进行U-测试。
为了确定所提出的卵泡大小和活出生率(LBR)之间的任何关联,我们在所有数据中使用了Logistic回归,并记录了LBR和输入变量(n= 9843),包括拟议的卵泡大小范围内的卵泡百分比,对点的总卵泡数,治疗时的年龄以及触发的类型(HCG或GNRH激动剂)。然后,我们通过替换卵泡大小范围输入变量为点卵泡曲线上的平均卵泡大小来重复此操作。我们利用100个自举模拟来确定每个变量的部分依赖性(边际贡献)的95%置信区间(CI),突出了任何统计显着性及其与LBR的关联。
此外,我们绘制了成熟卵母细胞产量的平均值和95%CI(n= 646)和lbr(n= 427)根据1 nmol/l增量的DOT上的血清孕激素水平(NMOL/L)(图) 5c)。我们比较了点上的血清孕酮(n= 994)根据大小的卵泡数量大于所提出的最佳卵泡尺寸范围(图。 5天)。使用Dunnett的多重比较测试将孕酮水平与少于两个较大卵泡的孕酮水平进行比较p价值观。报告摘要
自然投资组合报告摘要链接到这篇文章。数据可用性
由于这些协议的性质,数据无法公开获得,研究人员与第三方无法共享。任何访问原始数据的请求均应通过TFP生育能力(bi-support@tfp-fertility.com)向商业智能团队。请求应指定主要研究者,对拟议研究的描述以及数据访问的原因。代码中公开可用的拟议的ML模型和统计管道不是本研究中使用的数据集的特定特定的。本文提供了源数据文件。 源数据随本文一起提供。
在此存储库中提供了用于培训模型和进一步统计分析的代码:https://github.com/hanassabio/xai_follicle_sizes。如果使用或重新使用代码,请引用手稿。
Cox,C。等。1990年至2021年不孕不育患病率及估计方法:系统评价和荟萃分析。哼。重现。打开 2022年,HOAC051(2022)。
Hanassab,S。等。人工智能个性化辅助生殖技术的前景。npj 数字医学。 7,55(2024)。
Abbara,A.,Clarke,S。A.&Dhillo,W。S.在体外受精治疗中诱导最终卵母细胞成熟的新颖概念。内分泌。牧师。 39,593 - 628(2018)。
ETORS,F。等。人卵泡直径与卵母细胞受精或体外受精后的发育或发育之间的关系。哼。重现。 12,2002年(1997)。
Shapiro,B。S.等。卵巢卵泡大小对卵母细胞和胚胎学结果的影响。施肥。无菌。 117,1170年1176(2022)。
McCulloh,D。H.等。卵泡尺寸表明卵母细胞的成熟度和胚泡形成,但在受控卵巢供体的卵巢过度刺激后,卵泡细胞的成熟度不足。哼。重现。 35,545 - 556(2020)。
Fatton,M.,Cho,J。H.,Baker,V。L.&Loewke,K。检索到的卵母细胞的数量较高,与受精的卵母细胞,胚泡和累积的活产生率的增加有关。施肥。无菌。 119,762 - 769(2023)。
Sunkara,S。K.等。卵子数量与IVF治疗中的活产之间的关联:400 135个治疗周期的分析。哼。重现。 26,1768年1774年(2011年)。
Duffy,J。等。未来不育研究的十大优先事项:国际共识发展研究。哼。重现。 35,2715 2724(2020)。
Abbara,A。等。触发当天的卵泡大小最有可能产生成熟的卵母细胞。正面。内分泌。 9,193(2018)。
Mohr-Sasson,A。等。卵泡大小与卵母细胞发育之间的关联是最终卵泡成熟触发的函数。重现。生物医学。在线的 40,887 A 893(2020)。
Nogueira,D。等。卵母细胞的成熟度和植入前的发展与促性腺激素释放激素激动剂或拮抗剂治疗的卵泡直径有关。施肥。无菌。 85,578年583(2006)。
关于卵巢刺激,T。E。G. G.等。ESHRE指南:IVF/ICSI的卵巢刺激。哼。重现。打开 2020年,HOAA009(2020)。
Garg,A。等。辅助生殖技术中的黄体期支持。大自然牧师内分泌。1 -19(2023)。
佩德雷戈萨,F.等人。Scikit-learn:Python 中的机器学习。J.马赫.学习。资源。 12,2825 2830(2011)。
Baerwald,A。R.,Walker,R。A.和Pierson,R。A.天然月经周期,口服避孕循环和卵巢刺激周期期间卵巢卵泡的生长速率。施肥。无菌。 91,440 A449(2009)。
威尼斯(C.哼。重现。更新 19,433 - 457(2013)。
Bosch,E。等。卵巢刺激周期中循环孕酮水平和持续的怀孕率用于体外受精:超过4000个周期的分析。哼。重现。 25,2092年2100(2010年)。
Hariton,E。等。机器学习算法可以优化触发日以改善体外受精结果。施肥。无菌。 116,1227年1235(2021)。
Reuvenny,S。等。一种基于人工智能的方法,用于选择触发拮抗剂协议周期的最佳日期。重现。生物医学。在线的 48,103423(2024)。
Fatton,M。等。一种可解释的机器学习模型,用于预测卵巢刺激期间触发的最佳日子。施肥。无菌。 118,101 - 108(2022)。
Lawrenz,B。等。经过改良的天然周期的卵巢储备严重减少的妇女是否会受益于较小的卵泡尺寸的早期触发因素?超声产科。妇科。 64,245 252(2024)。
Fleming,R。促性腺营养蛋白释放激素拮抗剂方案期间的监测。哼。施肥。 5,G19âG27(2002)。
Chen,Y.,Zhang,Y.,Hu,M.,Liu,X。&Qi,H。使用GNRH Agonist或Antagonists中的IVF/ICSI方案中人类绒毛膜促性腺激素(HCG)激素给药的时间:-分析。妇科。内分泌。 30,431 437(2014)。
Mochtar,M。等。GnRH激动剂中的定时卵母细胞收集下调的IVF和ICSI周期:一项随机临床试验。哼。重现。 26,1091年1096年(2011年)。
Kolibianakis,E。M.等。卵泡期体外受精的延长导致较低的妊娠率较低,而重组卵泡刺激激素和促性腺激素释放激素的激素拮抗剂刺激的周期持续率较低。施肥。无菌。 82,102 - 107(2004)。
Voliotis,M。等。临床生殖内分泌学中的定量方法。电流。意见。内分泌。代谢物。资源。 27,100421(2022)。
Letterie,G。&Mac Donald,A。体外受精的人工智能:用于日常管理卵巢刺激的计算机决策支持系统。施肥。无菌。 114,1026年1031(2020)。
Steyerberg,E。W.&Harrell,F。E.预测模型需要适当的内部,外部和外部验证。J.克林。流行病。 69,245 247(2016)。
Collins,G。S.等。评估临床预测模型(第1部分):从开发到外部验证。英国医学杂志 第384章,E074819(2024)。
Hu,J。&Szymczak,S。随机森林的纵向数据分析的综述。简短的。生物信息学。 24,BBAD002(2023)。
Abbara,A。等。FSH对受控卵巢刺激期间卵泡生长的要求。正面。内分泌。 10,579(2019)。
梁,X.等。基于CR-UNET的超声卵泡监测,以降低直径变异性并自动生成面积作为卵泡成熟度的新型生物标志物。超声医学。生物。 46,3125 3134(2020)。
Thierry Van Dessel,H。等。正常的人卵泡发育:评估与单个卵泡中雌二醇,雄性二酮和孕激素水平的相关性。临床。内分泌。 44,191年(1996)。
Teissier,M.,Chable,H.,Paulhac,S。&Aubard,Y。接受IVF的女性正常和多囊卵巢中卵泡类固醇生成的比较:类固醇浓度,卵泡大小,卵母细胞质量和可闻型性之间的关系。哼。重现。 15,2471 2477(2000)。
Afnan,M。A. M.等。可解释的,而不是黑盒,人工智能应用于胚胎选择。哼。重现。打开 2021年,Hoab040(2021)。
Breiman, L. 随机森林。马赫。学习。 45,5â32(2001)。
Lundberg,S.M。&Lee,S.-I。解释模型预测的统一方法。副词。神经信息。过程。系统。 30,4765 - 4774(2017)。
Lundberg,S。M.,Erion,G。G.&Lee,S.-I。树集成的一致个性化特征归因。arXiv 预印本 arXiv:1802.03888 https://doi.org/10.48550/arxiv.1802.03888(2018)。
代谢,消化和繁殖系由MRC和NIHR帝国生物医学研究中心的赠款资助。S.H.由ukri CDT在AI中为医疗保健提供支持http://ai4health.io(EP/S023283/1)。A.Ab。由NIHR临床医生奖(CS-2018-18-ST2-002)支持。W.S.D.得到NIHR高级研究员奖(NIHR202371)的支持。
S.H.为Impli Limited提供咨询服务。S.M.N.获得NIHR,CSO和妇女福祉的赠款;提供了用于获得生育能力,Ferring Pharmaceuticals,Roche,Ro和TFP的咨询服务;收到了Ferring Pharmaceuticals,Merck和Roche的酬金;获得了参加Ferring Pharmaceuticals,Merck和Gideon Richter的会议和/或旅行的支持;和领导角色在HFEA中。W.S.D.获得NIHR,MRC和Imperial Health Charity的赠款,是Myovant Sciences Ltd. A.A.的顾问。已获得BRC的赠款;为Myovant Sciences Ltd提供了咨询服务;并得到了默克旅行的支持。其余作者声明没有竞争利益。
自然通讯感谢匿名审稿人对这项工作的同行评审的贡献。同行评审文件可用。
出版商的注释施普林格·自然对于已出版的地图和机构隶属关系中的管辖权主张保持中立。
开放获取本文根据知识共享署名 4.0 国际许可证获得许可,该许可证允许以任何媒介或格式使用、共享、改编、分发和复制,只要您对原作者和来源给予适当的认可,并提供链接到知识共享许可证,并指出是否进行了更改。本文中的图像或其他第三方材料包含在文章的创意共享许可中,除非在材料的信用额度中另有说明。如果文章的创意共享许可中未包含材料,并且您的预期用途不允许法定法规或超过允许的用途,则需要直接从版权所有者那里获得许可。要查看此许可证的副本,请访问http://creativecommons.org/licenses/by/4.0/。转载和许可
等人。可解释的人工智能,以识别在辅助概念期间优化临床结果的卵泡。纳特·康姆16 ,296(2025)。https://doi.org/10.1038/s41467-024-55301-y
已收到:
公认:
已发表:
DOI:https://doi.org/10.1038/s41467-024-55301-y