作者:Tőkés, Anna Mária



乳腺癌复发可以以局部或局部复发的形式发生,也可以作为遥远的转移表现出来。疾病的不同形式与不同的结果有关,需要不同的治疗方法4,,,,5。LR可能发生在残留的乳房组织或胸壁或皮肤的组织中,也可能影响新形成的疤痕组织。基于Maastricht Delphi共识,所有复发性侵入性乳腺癌或同侧乳房中的原位(DCIS)或皮肤和皮下组织在同侧胸腔壁上被认为是局部事件6






患者的临床病理特征总结在表格中 1。我们研究中的所有154例患者均有一些局部复发(剩余的乳房实质,手术疤痕组织和胸壁皮肤的73、63和18例)。患者平均为133.16个月(范围13至429个月)。初次诊断后平均发生LR 71.63(范围3至278)。在46/154(29.9%)的病例中,LR在3到24个月之间(早期复发)之间检测到40/154病例(26%)25到60个月(中期复发),在68/154病例中(44.2%)经过60个月(晚期复发)。主要诊断后长达23年,检测到复发。在154名患者中,有33名无病的幸存者成为10年的无病幸存者,因为在10到23年后发现了这些晚期复发。在相对较长的随访时间内,在91/154(59.09%)的病例中观察到遥远的转移,而从LR诊断到第一次检测到远处转移的平均时间为28.45个月(范围为170个月)。


我们还为154 LR案例收集了PT的特征(表 1)。PT诊断时患者的中位年龄为54岁(范围30年91岁)。大多数患者(70%)患有I期或II期PT。在138例已知激素受体(HR)状态的病例中,有104例患者(75.3%)患有HR阳性,34例(24.7%)患有HR阴性疾病。详细的亚型分布显示在表中 1。在有据可查的HER2阳性病例中,有15例患者接受了HER2针对原发性乳腺癌的靶向疗法(直到2009年,在2009年才能在辅助或新辅助设置中使用HER2指导的治疗)。所有接受治疗手术的患者:89(58.2%)接受了乳房持乳房的手术,64(41.8%)的乳房切除术总共切除术,并且在一种情况下没有数据可用。在73例接受乳腺疗法手术治疗的患者中,有关应用放疗的已知数据已有73例:60/73(82.1%)接受辅助放射疗法。在接受乳房切除术且可用数据的一组患者中,有67.2%(39/58)接受了辅助放疗。术后病理学揭示了79.3%的病例IDC-NST,ILC为11.7%,其他组织型为9.0%。在73/154(47.4%)病例中记录了同侧乳房实质的复发,而在81/154(52.5%)病例中的CWR。在CWR病例中,63/81(77.7%)发生在乳房手术疤痕中,18/81(22.2%)作为乳房或胸壁中的皮肤复发。


我们使用ML方法仅基于PT特征来预测LRS的定位。我们随机选择了124例培训病例,并随机选择了30例测试方法。我们尝试了几种分类方案(XGBoost有和没有特征选择,以及随机森林),通过训练集的交叉验证(请参阅– the the –方法和补充表S2)。在训练集的优化过程之后,我们测试了独立测试集中的最佳模型。我们独立检查了不同的预测任务,并报告了具有出色表现的任务(在测试集上〜0.7 roc auc)。

预测剩余的乳腺实质作为LR定位的表现与剩余的定位(即手术疤痕组织和胸壁的皮肤)的表现为0.77(图。 1一个)。该模型使用了19个特征,预测的最重要特征是手术类型(乳房良好或激进),诊断时的年龄和切除余量(图。 1b)。将手术疤痕组织预测为LR定位的表现与剩余的定位(即剩余的乳房实质和胸壁的皮肤)的表现为0.69(图。 1c)。该模型仅使用了四个特征,预测的最重要特征再次是手术类型,但是在诊断时年龄,KI67阳性比和孕酮受体(PR)状态也很重要(图。 1D)。

乳腺癌的机器学习预测局部复发定位。((一个)使用原发性肿瘤(PT)特征,其余乳房实质的恢复性(即手术疤痕组织或皮肤)的预测性能(ROC AUC)。((b)最重要的特征及其对最佳模型的产量的影响,可预测LR的剩余乳腺实质定位。图的右侧或左侧的情况表明,给定特征分别对预测产生正面或负面影响(每个点代表一个测试案例)。距离越远,功能越重要。这些特征是按重要性排序的(即,在决定复发的定位时影响)。蓝点表示低,红点表示给定测试案例的给定变量的高值(灰点表示缺失值)。在二进制变量的情况下,我们指出了以0或1值标记的情况。((c)手术疤痕组织定位的预测性能与任何其他检查的位置(即剩余的乳房实质或胸壁皮肤)的预测性能。((d)最重要的特征及其对模型输出的影响最佳模型,以预测LR的手术疤痕组织定位。BCS乳房保存手术,类别,历史组织学,LR当地复发,num数字,太平洋标准时间主要的全身疗法,pt原发性肿瘤,rad根治性手术,TNM肿瘤/节点/转移。


我们还根据PT和LR特征预测了LR后DM的出现。我们使用了与上述相同的火车测试拆分和机器学习方法。LR后预测DM的性能为0.78(图 2一个)。该模型使用了32个特征,预测的最重要特征是PT检测与LR的发生之间的经过的时间,LR的定位(是否在其余的乳腺实质中)以及LR的治疗(是否趋化)。尽管PT和LR之间的较高时间以及LR在LR后剩余的乳腺实质中的定位降低了DM的机会,但LR的化学疗法增加了它的机会(图。 2b)。图2

((一个LR后DM的预测性能(ROC AUC)。((b)最重要的特征它们对最佳模型的模型输出的影响预测了LR后DM的出现。图的右侧或左侧的情况表明,给定特征分别对预测产生正面或负面影响(每个点代表一个测试案例)。距离越远,功能越重要。这些特征是通过预测的重要性来排序的。蓝点表示低,红点表示给定测试案例的给定变量的高值(灰点表示缺失值)。在二进制变量的情况下,我们指出了以0或1值标记的情况。BCS乳房保存手术,类别,历史组织学,LR当地复发,m几个月,负面num数字,pt原发性肿瘤,rad根治性手术,nst没有特殊类型,pos积极的,TNBC三重阴性乳腺癌,rec复发,TNM肿瘤/节点/转移。


卡普兰·梅尔(Kaplan)分析还基于几个因素,例如在原发性乳腺癌检测到复发的发生之间经过的时间,在远处转移的情况下也显示出显着差异。早期复发与差的DMF显着相关(p<0.001)(图 3a,b)。原发性乳腺癌(<20%)中的PR表达低也与较短的DMF有关(p= 0.021)(图 3c)。与在乳房实质中出现的LR相比,胸壁上局部复发的患者面临远处转移的发生率更高(p= 0.001)(图 3f)。然而,在亚型(初级乳腺癌与相应LR之间)和远处转移的发生之间未检测到切换之间的关联(p= 0.057)(图 3e)。在83例中,主要和复发对中的亚型定义都可以使用。在53/83病例中发生了PT和配对局部复发之间的这些亚型一致性。雌激素受体(ER),孕酮受体(PR)和Ki67原发性乳腺癌与相应的局部复发病例之间的一致性通过情况进行了分析。通过比较上述三个标记在初级与相应LR中的表达,未检测到统计学上的显着变化(图。 3D)。图3

在51/154(33.11%)病例中诊断出多个LRS。然而,第二或多个局部复发的发生与较短的DMF没有显着相关(p= 0.169)(图 3g)。与在乳房实质中检测到的第一次复发的患者相比,被诊断为手术疤痕复发(28/63例(44.44%))的患者组的第二或多重复发比率更高(28/63例(44.44%))(19/73例(19/73例)((26.02%))。在后来出现两种或多个局部复发的原发性乳腺癌的临床病理学特征中,LUMB1亚型的高比例(22/35(62%))与表现为单个复发性肿瘤的患者相比,很明显,其中只有26/其中85例(30.58%)提出了LUMB1亚型。


PIK3CA突变分析以34对(原发性乳腺癌和相应的LR)进行。在分析的PTS的14/34(41.1%)中检测到致病突变,在相应的复发性病变中检测到12/34(35.2%)。在外显子9(E542K/E545K)(10/14病例)中检测到原发性乳腺癌中最常见的PIK3CA突变,然后在外显子20(3/14病例)(H1047XR/H1047L)中进行突变,并通过Exon 7(1)突变(1)/14个案例)。在LR中,突变的频率为以下:在8/12病例中外显子9中的突变,3/12例外显子20中的突变以及1/12例外显子7中的突变。在某些情况下,PIK3CA突变体PTS患者复发是野生类型,反之亦然。在组合分析中,3例患者将基因型从野生型变为突变体,而4例复发中的突变却失去了突变(表 2)。在10/14例中诊断出具有PIK3CA突变的14个原发性乳腺肿瘤中,在野生型肿瘤中,该比率为11/20。表2与局部复发对相比,原发性乳腺癌中有不一致的PIK3CA突变的病例。













很少有有关非常晚期复发的数据可用。在我们的研究中,有20.77%的患者在初次诊断后患有LR 10年或更长时间。其中的大多数(83.33%)是HR+肿瘤。根据丹麦乳腺癌组的临床数据库,LR的12.77%发生在初次诊断后的10年以上23

部分尚不清楚PT和LR之间的生物标志物差异是否在预测肿瘤传播中起作用。根据我们的结果,肿瘤生物学的差异与全身复发没有显着相关,也没有与LR的位置相关。Okumura等。无法证明ER和HER2表达的变化与生存之间存在显着关联,但是Ki67表达的变化预测了远处转移38。肿瘤基因型分析可以在PT和LR之间建立相似性。尤其是在ER阳性BC中,评估最多的遗传改变是PIK3CA突变。PIK3CA突变的患病率根据乳腺癌的亚型和阶段而有所不同,大多数研究将PT PIK3CA突变状态与远处转移的状态进行了比较39,,,,40。Jensen等。检查了PTS及其配对转移的PIK3CA突变状态差异,并研究了这些差异是否可以预测生存。根据他们的研究,那些转移表现出PIK3CA突变的患者,最初不存在PT中的侵袭性疾病,但后来复发41。关于PTS和LR之间的PIK3CA突变差异的数据稀缺。Nakagomi等。分析了原发性乳腺癌和配对的LR病例。根据其组织病理学特征的比较以及针对乳腺癌驱动基因的靶向深层测序分析,创建了残留复发和双重类别。关于PIK3CA突变状态,残留复发的比例更高,表现出突变的基因型,与双重初次相比(85%vs. 25%),因此PIK3CA-AKT途径中突变的病例更可能患有复发性疾病11。我们发现41.1%的PT显示PIK3CA突变,而LR中的PTS突变为35.2%。在14例突变复发病例中,乳腺实质内发生了6例,其中8例是CWR。







我们的最初队列由448例乳腺癌病例组成,该病例被诊断出局部复发。这项研究的主要目的是分析同侧复发的定位和LR的其他几个方面的预后意义,我们重点介绍了在这些病例上,在这些病例中,对于原发性乳腺癌以及相应的LR,可以使用尽可能多的临床病理学参数。因此,从初始队列中排除了PT和/或复发的几个缺失病理和/或临床数据的病例。最后,我们的回顾性研究包括154次原发性乳腺癌和1984年至2018年间诊断的相应LR对。该研究是根据赫尔辛基宣言进行的。患者的临床病理数据是从病理学系,法医和保险医学,塞米尔威大学布达佩斯和匈牙利医学研究委员会批准的Semmelweis大学医疗保健数据库(ETT-TUKEB 14383/2017和17781和17781年的批准)获得的。-3/2024)。可以提到的是,从2000年开始,就模棱两可的HER2免疫组织化学结果(得分2+)进行了HER2鱼,而ER的免疫组织化学数据自1992年以来就可以进行。在1992年之前检测到38/154。

根据Maastricht Delphi在乳腺癌研究中复发的共识来定义LR6。无局部无复发的生存定义为从原发性乳腺癌诊断到首次LR诊断的时间。远处的无转移生存率(DMF)定义为从原发性乳腺癌诊断之日到第一个DM发生的时间。所有患者均经过随访,直到死亡日期或2022年11月30日。

最重要的临床病理数据记录在表中 1。Among them are the patient’s age at diagnosis, histological grade, pathologic tumor size (pT), nodal involvement (pN), LVI, resection margins, applied oncological treatment regimens and surrogate breast carcinoma subtype as defined based on four immunohistochemical markers (estrogen receptor (ER), progesterone receptor (PR), Ki67 index and HER2) according to the 2013 St. Gallen Consensus Conference recommendations44。Luminal A (LUMA) tumors are defined as ER and PR positive, HER2 negative, Ki-67 “low” (Ki-67 < 20%) tumors, Luminal B-HER2 negative (LUMB1) tumors as ER positive, HER2 negative and Ki-67 “high” (≥ 20%) and/or PR “negative or low” (PR cut-point = 20%), Luminal B-HER2 positive (LUMB2) as ER positive and HER2 overexpressed or amplified and HER2 positive/hormone receptor (HR) negative, and, triple negative breast carcinomas (TNBC) as HR and HER2 negative.

PIK3CA mutation analyses

PIK3CA mutation status was determined in 34 pairs of PTs and corresponding LR with the Cobas®PIK3CA Mutation Test (Roche, Basel, Switzerland), following the manufacturer’s instructions. The test can detect mutations in exon 1 (p.R88Q), exon 4 (p.N345K), exon 7 (p.C420R), exon 9 (p.E542K, p.E545A/G/K, p.E545D (only the nucleotide change c.1635G> T), p.Q546E/K/L/R) and exon 20 (p.M1043I (only the nucleotide change c.3129G> T), p.H1047R/L/Y, p.G1049R) of the PIK3CA gene when the mutant allele frequency is 5% or greater. 50 nanograms of template DNA was used in 25 µl volume in each PCR reaction. Amplification was carried out in the real-time PCR-based Cobas Z 480 analyzer (Roche, Basel, Switzerland). All samples were run in triplicates. Results were interpreted using Cobas®4800 System Software version 2.0 (Roche, Basel, Switzerland).

Data preparation for machine learning and statistics

We performed one-hot encoding for the categorical variables that had three or more distinct values. After this process, all of the categorical variables became binary with 0 (i.e., false) or 1 (i.e., true) values. This is a regular pre-processing method preceding training by machine learning algorithms in the case we have categorical variables with more than two distinct categories. The final data table contained 154 rows (patients) and 84 columns (training features and target variables).


Before training, we randomly split the feature table into ~ 80% training (n = 124) and ~ 20% test set (n = 30) to have enough patients for the training and the testing process. We experimented with several classification protocols (XGBoost33with and without feature selection, as well as random forest) and optimized the hyperparameters by 5-fold cross-validation (repeating 10 times) on the training set (Supplementary TableS2)。After the optimization process on the training set, we tested the best models on the independent testing set.We examined the different prediction tasks independently.In the prediction task of DM after LR, we considered only the cases when the metastasis was not the first recurrence.We used PT and LR features in the task of predicting DM after LR while in the remaining prediction tasks when the target variable was a recurrence feature, we used only the PT features.For each case, we performed a parameter optimization on the training set by 5-fold-cross-validation repeated 10 times.In the grid search, we considered 24 cases total with the parameter setting maximum depth = 1, 2, 3, 5, and the number of estimators (i.e., decision trees) = 1, 2, 5, 10, 20, 100. We used this process through four machine learning protocols: (i) using XGBoost classification and selecting the best model (the model with the highest mean ROC AUC) of the grid search, (ii) using XGBoost classification and selecting the best simple model (with maximum depth = 1) of the grid search, (iii) selection of the features by the best model of the XGBoost then re-train XGBoost only with the selected features, (iv) using random forest classification and selecting the best model of the gridsearch.Finally, we retrained a final model with the selected parameters on the entire training set.We examined the final models having remarkable performance (at least ~ 0.7 ROC AUC on the testing set).This criterion was satisfied in the prediction task of the remaining breast parenchyma (best XGBoost model; max depth = 3, number of estimators = 20), surgical scar tissue (best simple XGBoost model; max depth = 1, number of estimators = 10), and DM after LR (best XGBoost model; max depth = 3, number of estimators = 20) (Supplementary TableS2)。


The SHAP (SHapley Additive exPlanations) method2,,,,16was used to examine the importance of the input features of the machine learning models. SHAP values show how each feature affects the final predictions (impact on the model output) and the importance of each feature compared to others. The highest the sum of the absolute impacts of a feature the more important is the feature in the prediction45


While some clinicopathological data (localization of the LR, LR time from PT, multiple LR, DM, and age) are available for all the 154 examined patients, others may contain missing values (i.e., n/a). In most of the cases, the proportions of the missing values are lower than 20% (Table 1)。We did not use any missing value imputation techniques as the machine learning model implementations that we used can handle missing values as special values.RF and XGBoost build the missing values into the inferred models as rules of the decision trees.


When we examined the relationship of two variables, we performed a Fishers’s exact test when both variables were binary, or a two-sidedt-test when one variable was binary and the other one was continuous, or we calculated a Pearson’s correlation coefficient (‘r’) when both variables were continuous. P-values below 0.05 were interpreted as significant. For the statistical analysis, we used the fisher_exact, ttest_ind, pearsonr functions from the stats module of SciPy (v1.7.1). For all data analysis, we used Python (v3.9.7). Distant metastasis free survival (DMFS) was evaluated using Kaplan–Meier survival curves and the log-rank test was used to compare DMFS between the two groups.数据可用性

The authors declare that the data supporting the findings of the presented study are available within the article. Detailed clinical data of individual patients cannot be provided due to ethical restrictions but are available upon reasonable request from the corresponding author. The most important clinicopathological data are presented in Table 1.


  Kristóf Attila Kovács and Csaba Kerepesi contributed equally.


  Department of Pathology, Forensic and Insurance Medicine, Semmelweis University, Budapest, Hungary

    Kristóf Attila Kovács, Lilla Madaras, Anikó Takács, Janina Kulka & Anna Mária Tőkés

  HUN-REN Institute for Computer Science and Control (SZTAKI), Budapest, Hungary

    csaba kerepesi

  National Institute of Oncology, Budapest, Hungary

    Dalma Rapcsák

  Department of Pathology and Experimental Cancer Research, Semmelweis University, Budapest, Hungary

    Ákos Nagy

  Department of Internal Medicine and Oncology, Semmelweis University, Budapest, Hungary

    Magdolna Dank, Gyöngyvér Szentmártoni & Attila Marcell Szász


