四种机器学习方法确定的绝经后妇女三年随访期间骨矿物质密度变化的风险因素

2024-10-05 18:49:07 英文原文

作者:Liang, Yao-Jen

介绍

骨质疏松症被定义为一种系统性骨骼疾病,其特征为低骨量、骨组织微结构恶化、骨脆性增加以及易发生骨折。1这种情况由于其严重性、慢性以及进行性被视作21世纪的隐形流行病。2它是一个重大的全球公共卫生问题,主要原因是老年人群中由骨质疏松性骨折导致的高发病率。32010年,在欧洲联盟内,大约有550万男性和2200万女性患有骨质疏松症。4令人震惊的是,80%的受影响女性在被诊断前都未意识到自己的风险因素5患有骨质疏松症的个体骨折的风险更高。仅在英国,每年就有大约79,000人遭受髋部骨折,给患者和医疗体系带来了高达35亿英镑的巨大费用。预计到2025年,这一成本将上升至每年55亿英镑。6而且,在经历髋部骨折后,发病率和死亡率会有显著增加,每年有31,000人在骨折后的六个月内死亡。7因此,骨质疏松症的早期预防、诊断和管理已成为医疗提供者和政府共同关注的重要公共卫生问题。

世界卫生组织根据骨矿物质密度(BMD)的标准差建立了诊断标准,将其与年轻健康女性的峰值骨量进行比较。根据这些标准,当T值小于-2.5时定义为骨质疏松症,而T值介于-1和-2.5之间则被定义为骨量减少。这些诊断标准对于理解低BMD在脆性骨折发展中的意义做出了重要贡献,并为流行病学研究提供了评估骨质疏松症发病率的宝贵工具。8.

传统上,医学研究依赖于多元线性回归(MLR)来探究风险因素与结果(并发症)之间的关系。然而,随着人工智能和机器学习(Mach-L)的出现,数据分析的新方法也随之诞生,其中机器可以从过去的数据或经验中学习而无需显式编程。如今,Mach-L已经成为MLR的一个竞争替代品。9,10,11Mach-L的主要优势之一是它能够捕捉数据中的非线性关系,并理解多个预测因子之间的复杂交互作用,这使得它在疾病预测方面可能比传统的多元线性回归(MLR)更有效。12.

据我们所知,虽然过去进行了许多纵向研究,但只有少数研究专门关注骨质疏松症中最复杂和关键的指标之一——T分数(δ-T分数)之间的差异。因此,在这项研究中,我们采用了四种不同的机器学习(ML)方法,并旨在回答以下问题:在一个四年随访的糖尿病患者队列中:

  1. 1.

    比较Mach-L方法与传统多元线性回归(MLR)的预测准确性。

  2. 2.

    根据预测δ-T评分未来变化的重要性,对各种风险因素进行排序,包括人口统计学、生活方式和生物化学数据。

方法

参与者和研究设计

本研究的数据来自台湾MJ队列,这是一个由台湾MJ健康检查中心进行的持续性前瞻性健康检查队列。10,11,12,13,14这些全面的检查涵盖了超过100个基本生物指标,包括人体测量、血液检测和影像学检测等。此外,每位参与者完成了一份自填问卷,提供了个人及家族医疗史、当前健康状况、生活方式、体育锻炼、睡眠习惯和饮食习惯的信息。10,11,12,13,14,15只有提供了知情同意的参与者才被纳入MJ健康数据库,且研究方案已由高雄国防-general医院机构审查委员会批准(IRB编号:KAFGHIRB 109 − 041)。队列的描述此前已由我们小组发表。16在本研究中,所有方法均按照我们机构的相关指南和规定进行。最初共纳入了3,412名55岁及以上的健康女性,排除各种原因后的受试者为1,698人,如图所示。1支持本研究发现的数据可以从MJ诊所获得,但这些数据的可用性受到限制,因为它们是根据许可用于当前研究的,并且不公开提供。然而,在合理请求并获得MJ诊所许可的情况下,数据可从通讯作者处获取。

图1
figure 1

患者选择方案。

在研究当天,资深护理人员记录了每位受试者的医疗历史,包括任何当前用药的信息,并进行了体格检查。腰围水平测量位于自然腰部位置,体质指数(BMI)计算为受试者体重(kg)除以其身高的平方(m)。使用标准的汞血压计测量每位受试者在坐姿下右臂的收缩压(SBP)和舒张压(DBP)。

收集人口统计学和生化数据的程序与之前发表的方法一致。13禁食10小时后,采集血液样本进行生化分析。血浆在采血后的1小时内从血液中分离出来,并储存在-30°C下,直到分析空腹血浆葡萄糖(FPG)和脂质谱型。使用葡萄糖氧化酶法测量FPG(YSI 203 葡萄糖分析仪;Yellow Springs Instruments, Yellow Springs, OH, USA)。总胆固醇和甘油三酯(TG)水平采用干式多层分析片方法,通过Fuji Dri-Chem 3000 分析仪(富士胶卷,日本东京)进行测定。使用酶法胆固醇测定,在葡聚糖硫酸沉淀后测定血清高密度脂蛋白胆固醇(HDL-C)和低密度脂蛋白胆固醇(LDL-C)的浓度。此外,通过浊度法使用贝克曼库尔特AU 5800生化分析仪测定尿白蛋白与肌酐比值(ACR)。T 分数通过双能量X射线吸收测定法测量(Lunar, General Electric Company, USA)。

传统统计学

数据以均值±标准差的形式表示。为了评估男性和女性连续变量之间的差异,使用了Student t检验。此外,使用Pearson相关分析了δ-T评分与其他所有变量之间的关系。所有的统计检验均为双侧检验,并且p值小于0.05被认为具有统计学意义。统计分析使用的是SPSS 10.0 for Windows(SPSS, Chicago, IL, USA)。

提议的机器学习方案

本研究提出了一种基于四种不同的机器学习(Mach-L)方法的方案,即随机森林(RF)、极端梯度提升(XGBoost)、朴素贝叶斯(NB)和随机梯度提升(SGB),来构建预测模型以预测四年后δ-BMD的变化。这些Mach-L方法在各种医疗保健应用中得到了广泛的应用,并且不依赖于关于数据分布的先验假设。14,15,17,18,19,20,21,22,23,24这部分方法已由我们小组发表25.

随机森林(RF)是一种结合了自助法重抽样和装袋的决策树集成学习算法。26其原理涉及随机生成多个不同的未经修剪的CART决策树,其中使用吉尼不纯度的减少作为分裂准则。所有生成的树随后被组合成一个森林。最终模型是通过在森林中的所有树木之间进行平均或投票来生成输出概率并确保鲁棒性而获得的。27.

下一个方法SGB是一种基于树的梯度提升学习算法,结合了袋式法(bagging)和提升法(boosting)技术来最小化损失函数,并解决传统决策树的过拟合问题。28,29,30在SGB中,通过多次迭代顺序生成许多随机弱学习器(树)。每个树专注于纠正或解释前一轮树的错误,以前一轮树的残差作为新生成树的输入。这一迭代过程持续进行,直到达到停止标准,例如最大迭代次数或收敛条件。最终,使用多个树的累积结果来确定最终的鲁棒模型。

第三种方法是NB,这是一种流行的Mach-L分类模型。该算法可以根据特定的特征和变量对对象进行排序,并使用贝叶斯定理计算假设在假定群体中的概率。31与逻辑回归不同,像NB这样的Mach-L方法不需要强烈的前提假设,并且能够捕捉到经验数据中存在的微妙的非线性关系。14.

关于XGBoost,它是本研究中使用的最后一种方法,它是一种基于SGB优化扩展的梯度提升技术。32XGBoost的基本原理是顺序训练许多弱模型,并使用梯度提升方法将它们组合起来以实现更好的预测性能。为了加速模型构建的收敛过程,XGBoost采用泰勒二项式展开来近似目标函数,并利用任意可微的损失函数。33此外,XGBoost应用了正则化的提升技术来惩罚模型的复杂度,从而纠正过拟合并提高模型准确性。32.

2介绍了结合四种机器学习(ML)方法的预测和重要变量识别方案的流程图。最初,收集患者数据并通过提议的方法准备数据集。随后,将数据集随机分成80%用于模型构建的训练数据集和20%用于模型评估的测试数据集。在训练过程中,通过特定的超参数对每个机器学习方法进行微调以构建性能良好的模型。为此,采用10折交叉验证(CV)技术进行超参数调整。训练数据集进一步划分为具有不同超参数设置的训练子集和用于模型验证的验证子集。网格搜索探索了所有可能的超参数组合。对于每个ML方法而言,验证子集中根均方误差最低的模型被认为是最好的模型。因此,最佳调优后的随机森林(RF)、梯度提升树(SGB)、朴素贝叶斯(NB)和XGBoost模型被生成,并获得了相应的变量重要性排名信息。

图2
figure 2

proposed machine learning prediction scheme. (注意:这里的翻译实际上是英文短语到汉语拼音的直接转换,并没有提供一个标准的中文表达。根据上下文通常我们会说“提出的机器学习预测方案”)

对于测试过程,使用了测试数据集来评估最佳随机森林(RF)、梯度提升机(SGB)、朴素贝叶斯(NB)和XGBoost模型的预测性能。由于本研究中的目标变量是一个数值型变量,因此模型性能比较采用了对称平均绝对百分比误差(SMAPE)、相对绝对误差(RAE)、平方根相对误差(RRSE)和均方根误差(RMSE)等指标,这些指标在表中给出。1SMAPE 是一种有用且平衡的方法,用于验证预测结果的平均百分比误差。基础 MAPE 公式仅将实际值的绝对值放入分母中,这限制了任何实例的实际值不能为零或非常小的情况。作为替代方案,使用了 SMAPE。RAE 的计算方法是将预测值和实际值之间的绝对差值之和除以实际值与实际值平均值之间绝对差值之和。此指标提供了一种直观的方式来评估模型相对于简单基线的准确性,因此对于比较不同的预测方法很有用。RMSE 通过取预测值和实际值之间平方差异的平均值的平方根来计算,RMSE 对更大的误差惩罚更重,使其对异常值敏感,并清晰地表明了模型的准确性。RRSE 是通过将预测值与实际值之间的平方差之和除以实际值与实际值平均值之间的平方差之和,然后取结果的平方根来确定。SMAPE、RAE、RRSE 和 RMSE 的较低数值表示更好的预测性能,因为这意味着模型的预测值更接近于实际值。

表1 各最佳NB、RF、CART和XGBoost模型训练所用超参数值的摘要。

为了确保稳健的比较,上述训练和测试过程被随机重复了10次。然后利用RF、SGB、NB和XGBoost模型的平均指标来与基准MLR模型进行对比,该基准模型使用了相同的训练和测试数据集作为Mach-L方法。如果一个Mach-L模型的平均指标低于MLR,则认为这是一个令人信服的模型。

由于本研究中使用的所有Mach-L方法都可以生成每个预测变量的重要性排名,我们根据每个模型中的排名为每个变量分配优先级,排名第1的变量是最关键的风险因素,而排名第22的变量则最为不重要。然而,不同的Mach-L方法可能会因为其独特的建模特性而导致不同的变量重要性排名。为了增强重新排列风险因素重要性的稳定性和完整性,我们整合了来自令人信服的Mach-L模型的变量重要性排名。

在提议方案的最后阶段,我们根据令人信服的Mach-L模型的结果进行了总结和讨论。这一过程使我们能够识别出对四年随访后δ-T评分预测有显著贡献的重要变量。

在这项研究中,所有方法均使用安装了所需包的R软件版本4.0.5和RStudio版本1.1.453完成。34RF、SGB、NB 和 XGBoost 的实现是 R 包 "randomForest" 版本 4.6-1435"gbm" R包版本2.1.836"rpart" R包版本 4.1-1537以及“XGBoost” R包版本1.5.0.2 соответственно (注意:最后一词“соответственно”似乎是俄语,原文中没有对应的词汇,所以这部分可能是多余的或者翻译出现了偏差。根据上下文和要求,仅提供直接翻译部分,即: 以及“XGBoost” R包版本1.5.0.2)38此外,为了估计为开发的有效NB、RF、SGB和XGBoost方法确定的最佳超参数集合,使用了“caret”R包版本6.0–9039MLR使用“stats”R包版本4.0.5实现,并且使用默认设置构建模型。

结果

共有1698名参与者纳入研究。人口统计学数据见表2(均值±标准偏差)。在表中3皮尔森相关性的结果显示,可以注意到年龄、教育程度、

表2 性能指标方程式。
表3 参与者的 demographics、生化和生活方式数据。注:demographics直译为“人口统计学”,在此领域中常用以指代相关的人口统计数据,为了保持原文术语的准确性,此处保留英文原词。若需完全中文表述则可替换为“人口统计学特征”。

BMI、HDL-C 和 TSH 与 δ-T 分数呈正相关,而血浆钙水平和基线 T 分数与 δ-T 分数呈负相关。表 4展示了独立变量与δ-TS之间的简单相关性。可以注意到,年龄、教育水平、BMI、HDL-C和TSH与δ-TS呈正相关。相反,血浆钙、磷和基线BMD与δ-TS呈负相关。

表4 基线人口统计学、生化指标、生活方式与δ-T评分的皮尔逊相关性结果。

传统MLR与四种Mach-L方法预测δ-TS的结果如表所示。5从表中可以看出,所有的四种Mach-L方法都比MLR方法产生了更低的预测误差,并且都是令人信服的Mach-L模型。

表5 线性回归和四种机器学习方法的平均性能。

表格6展示了由RF、SGB、NB和XGBoost方法生成的每个因素的变量重要性和它们的排名。从图中可以看出,不同的Mach-L方法为每个因素生成了不同的相对变量重要性。右列给出了这些变量的排名。蓝色的深浅表示风险因素的重要性。最后,在图中。3,上述关系的图形说明如下:图中将最重要的变量置于顶部位置,最不重要的变量置于底部。从表格中可以看出,教育水平是δ-T评分最重要因素,其次是DBP(舒张压)、吸烟、SBP(收缩压)、UA(尿酸)、年龄和LDL-C。最后,使用基于RF(随机森林)、XGBoost、NB(朴素贝叶斯)和SGB的模型的SHAP值来可视化输入特征对输出的影响,如图所示。4.

表6 在Pubmed中关于“骨质疏松症”和“纵向”研究的类似研究。
图3
figure 3

三种不同机器学习方法得出的风险因素等级。

图4
figure 4

使用基于随机森林(RF)、极端梯度提升(XGBoost)、朴素贝叶斯(NB)和随机梯度提升(SGB)模型的SHAP值可视化输入特征对输出的影响。

讨论

在本研究中,我们采用了四种Mach-L方法来确定预测4年后δ-T评分的风险因素的重要性。值得注意的是,所有四种方法都表现出比LR更低的误差(如表所示)。4),表明在这一背景下Mach-L优于LR。根据它们的重要性,我们确定了六个因素,下面将详细讨论这些因素。重要的是要强调,我们的研究重点是将δ-T分数作为独立变量,这与其他主要考察随访期结束时T分数的常规研究区分开来。尽管过去曾有类似的研究发表,但那些研究样本量较小且未使用Mach-L(表 7).

表7 线性回归和机器学习方法得出的风险因素重要性排名

我们的结果显示,DBP和SBP分别是影响δ T-score的最重要和第二重要的因素。然而,需要注意的是,在皮尔逊相关分析中观察到的DBP和SBP与δ-T score之间的关联并不具有统计学意义。皮尔逊相关和Mach-L方法之间存在的差异可以归因于Mach-L的特点,即相比MLR更能捕捉非线性关系。尽管在皮尔逊相关分析中缺乏统计学意义,我们的研究结果与Lee等人进行的一项韩国研究所观察到的结果一致。18调整混杂因素后,他们发现股骨颈T值与DBP呈负相关关系,系数为0.391(95%置信区间:0.766至0.016)p= 0.041)。另一方面,腰椎骨密度和T值与收缩压呈正相关,系数为0.395(95%置信区间:0.058–7.752,p= 0.047) 和 0.458(95% 置信区间:0.005–0.911,p= 0.047) 分别。这些关联表明血压可能对不同骨骼部位的骨密度有不同的影响。重要的是要认识到,在 Lee 等人进行的研究中,根据血压或骨质疏松症的状态将队列分为两组,并且使用了与我们研究不同的逻辑回归分析方法。因此,在比较他们的发现与我们的发现时,必须谨慎对待由于研究设计和统计方法的不同而产生的差异。尽管收缩压的正相关和舒张压的负相关是出乎意料的,但这些结果有合理的解释。首先,正如之前的研究所报道的那样,不同骨骼部位的骨密度测量可能存在不一致。40,41,42,43,44这种骨密度(BMD)测量的差异可能会影响骨密度与血压之间的关系。其次,使用DEXA检查脊柱骨密度时出现的测量误差可能会导致观察到的不一致现象。软组织钙化、骨刺、严重的侧弯或由骨关节炎引起的椎体畸形可能是影响脊柱骨密度测量准确性的潜在错误来源,从而影响其与血压的相关性。最后,股骨和脊柱可能具有不同的生物力学特性,导致它们对各种因素(如身体活动)产生不同的反应。一项研究表明,身体活动可能会对脊柱和股骨颈的骨密度产生不同的影响。45这可能解释了我们在研究中观察到的不同关联。

在我们的研究中,UA水平根据Mach-L方法成为第三个重要的因素。尽管UA与δ-T分数呈正相关,但这种相关性没有统计学意义。这一发现符合尿酸具有抗氧化特性的观点,这可能有助于骨骼保护。假设是尿酸强大的抗氧化特性可能在保持骨健康方面发挥作用。全球范围内进行的许多相关研究探讨了血清尿酸和骨矿物质密度(BMD)以及骨质疏松症之间的关系。46,47,48,49此外,一篇综述文章阐明了尿酸(UA)与骨矿物质密度(BMD)之间的相互作用,并强调了其通过运行相关转录因子2(RUNX2)/核心结合因子亚基α-1(CBF-α-1)、Wnt-3a/β-catenin信号通路以及11β羟皮质类固醇脱氢酶类型1参与的作用。50.

据我们所知,我们的研究是首次尝试进一步确认尿酸(UA)在骨质疏松症中的作用。这支持了这样一个观点,即尿酸可能对骨骼健康有重要影响,值得在未来的研究和骨质疏松症的临床管理中进行更深入的调查和考虑。

在我们的研究中,我们观察到教育水平与δ-T分数之间存在正相关关系。这一发现与其他重要研究结果一致。例如,Piao等人报告了教育水平和T分数之间的正向关系(β=0.092,)p在一项涉及1905名绝经后中国女性的队列研究中,教育水平与骨质疏松症患病率呈负相关(P=0.032)。类似地,其他几项研究也发现了教育水平和骨质疏松症患病率之间的逆向关系。51,52,53,54教育在防治骨质疏松症中的潜在保护作用可归因于几个间接因素,包括社会经济地位、健康素养、生活方式选择以及早期医疗筛查的获取途径。生活方式因素如饮食摄入量、足够的微量元素摄取、身体活动水平、怀孕次数和吸烟习惯已被证实会影响骨密度和骨质疏松症的发生率。较高的教育程度通常与更高的家庭收入、更好的饮食习惯、充足的钙摄入量、定期进行医学检查以及对各种健康状况(包括骨质疏松症)的更大认识有关。55.

例如,先前的研究表明骨密度与营养状况、教育程度和参与体育锻炼有关。56因此,教育赋予的保护作用可能是由于营养状况改善、更遵守医疗建议、更加一致的身体活动以及增强的医疗卫生资源获取能力所致。56,57,58.

类似地,与血压和尿酸一样,甘油三酯水平与δ-T评分呈正相关但无统计学意义。这种关系已被各种研究人员报道过,但结论仍然存在一定的争议。例如,Kim等人发现甘油三酯在男性和女性中都与全身骨密度呈负相关。pP<0.05)。在65岁以上的女性中,调整后的对数TG水平与骨质疏松症的比值比为2.50(95% CI:1.13–5.51)。另一项针对老年 Chinese 人的研究也得出了类似的结论。59相反,有一些其他的研究报告了相反的结果。3,60这种不一致可能源于年龄、性别、骨密度测量方法和种族背景等方面的差异。甘油三酯水平与骨密度的正相关关系可以从几种生物学机制来解释。首先,核激素受体过氧化物酶增殖激活受体γ(PPAR γ)可能在脂质生物标志物与骨密度之间的关系中起作用。PPAR γ可以通过脂质代谢物被激活,并且其水平升高可能导致成骨细胞生成抑制,从而导致骨丢失增加。其次,较高的脂质水平与氧化脂质的增加和较高氧化应激水平相关联。升高的氧化应激可能会抑制成骨细胞分化而促进脂肪细胞分化。第三,血清甘油三酯水平越高,与骨髓脂肪增多呈正相关。61这反过来可能导致 trabecular 骨密度降低。

Mach-L 方法最终选定的变量是睡眠时间。在本研究中,我们观察到睡眠时间和 δ-T 分数之间存在负相关关系。这一发现并不完全令人惊讶,因为关于睡眠时长与骨健康之间的关系仍是一个有争议的话题。我们的研究结果与唐等人(Tang et al.)的工作一致,他们分析了来自 2007-2014 年全国健康和营养调查 (NHANES) 的 4,399 名受试者,并得出结论:不健康的睡眠时长,尤其是过长的睡眠时间,与骨矿物质密度(BMD)降低有关,尤其是在年龄大于60岁的个体、男性或绝经后女性中。然而需要注意的是,他们的研究将队列分为四组并比较了 BMD,这与我们的方法有所不同。62另一方面,李等人报告了相反的结果18他们还使用了NHANES数据,并招募了12,793名受试者。结果显示,与其它组相比,年龄大于50岁的女性每天睡眠时间少于5小时的患骨质疏松症的概率为7.35(置信区间:3.438–15.715)。同样,类似于TG和δ T-评分之间的关系,在不同研究中的差异可能源于正常睡眠时长、睡眠质量、选择的人群、种族以及用于测量骨密度的诊断工具等方面的定义不一。

睡眠对骨代谢和密度潜在影响的机理可能涉及多种机制,包括骨骼细胞正常节律的变化、激素水平(如生长激素、性类固醇、皮质醇)的改变、交感神经张力的增加、炎症、代谢紊乱或疲劳/身体不活跃。之前的证据表明,睡眠结构会随年龄变化。

尽管我们认为我们的研究已经全面完成,但仍存在一些限制。首先,仅测量了腰椎部位,因此我们的发现不能推广到身体的其他部位。其次,样本数量仍然不够大。第三,当应用于其他种族时,也应该考虑单一种族的情况。

结论

我们的研究证明,所有四种Mach-L方法都优于传统的MLR。通过使用Mach-L,我们确定了六项对绝经后中国女性δ-T评分最重要风险因素,按重要性从高到低排序为:舒张压(DBP)、收缩压(SBP)、尿酸(UA)、教育水平、甘油三酯(TG)和睡眠时间。这些发现有助于我们理解这些风险因素与绝经后妇女骨骼健康之间的复杂关系。

数据可用性

支撑本研究发现的数据可从MJ诊所获得,但由于这些数据是根据许可用于当前研究的,因此受到使用限制,并不公开提供。但在合理请求并获得MJ诊所许可的情况下,数据可以从通讯作者处获取。

参考文献

  1. Black, D. M. & Rosen, C. J. 临床实践。绝经后骨质疏松症。新英氏医学杂志 374(3), 254–262 (2016).

    文章  PubMed  谷歌学术 

  2. 阿尔特科恩,D. & 塞弗,A. S. 骨质疏松症的筛查。JAMA(美国医学会杂志). 313(14), 1467–1468 (2015).

    文章  PubMed  谷歌学术 

  3. 巴格尔,Y. Z. 等人.绝经后妇女心血管疾病与骨质疏松症之间的联系:血清脂质还是动脉粥样硬化本身?骨质疏松症。国际期刊。 18(4), 505–512 (2007).

    文章  PubMed  谷歌学术 

  4. 埃莱夫特里乌,F. 等。瘦素通过交感神经系统和CART调节骨吸收。自然. 434(7032), 514–520 (2005).

    文章  ADS  PubMed  谷歌学术 

  5. 山口,T. [脂质代谢异常和代谢综合征中的骨代谢]临床钙杂志. 21(5), 677–682 (2011).

    PubMed  谷歌学术 

  6. Sugihara, N. & Matsuzaki, M. 严重骨质流失对绝经后老年日本女性二尖瓣环钙化的影响在老年人骨质疏松症中的影响。 注:为了确保准确性和通顺性,建议稍微调整如下: Sugihara, N. & Matsuzaki, M. 严重骨丢失对绝经后老年日本妇女骨质疏松症中二尖瓣环钙化的影响。日本循环 journal 简写(或 日本循环杂志) 57(1), 14–26 (1993).

    文章  PubMed  谷歌学术 

  7. 大內愃等人。与年龄相关的骨质流失和主动脉/主动脉瓣钙化——重新评估老年人推荐的膳食钙摄入量。纽约科学院年鉴 676, 297–307 (1993).

    文章  ADS  PubMed  谷歌学术 

  8. 马吉德等。维生素D补充剂对20至50岁睡眠障碍患者的睡眠评分和睡眠质量的影响与对照组相比。营养神经科学 21(7), 511–519 (2018).

    文章  PubMed  谷歌学术 

  9. 马雷布 H.R. 等人。一种用于诊断2型糖尿病患者微量白蛋白尿的混合智能系统,无需测量尿液中的白蛋白。计算生物学与医学 45, 34–42 (2014).

    文章  PubMed  谷歌学术 

  10. 叶,Y. 等人。利用常规临床数据预测妊娠糖尿病的机器学习方法与传统逻辑回归对比:一项回顾性队列研究。糖尿病研究杂志 2020, 4168340 (2020).

    文章  PubMed  谷歌学术 

  11. Nusinovici, S. 等人。逻辑回归在预测重大慢性疾病方面与机器学习一样好。临床流行病学杂志 122, 56–69 (2020).

    文章  PubMed  谷歌学术 

  12. 米勒,D. D. & 布朗,E. W. 医学实践中的人工智能:从问题到答案?美国医学杂志 131(2), 129–133 (2018).

    文章  PubMed  谷歌学术 

  13. 吕 CH 等人. 2 型糖尿病患者铊心肌灌注扫描异常的预测因素。心血管. 36(2), 180–188 (2021).

    文章  MathSciNet  PubMed  谷歌学术 

  14. 曾俊杰等。集成数据挖掘分类技术和集成学习以识别风险因素和诊断卵巢癌复发。人工智能医学 78, 47–54 (2017).

    文章  PubMed  谷歌学术 

  15. 张楚楚和陈淑惠开发了一种基于机器学习的分类方案,用于预测乳腺癌幸存者的次级原发癌。遗传学前沿 10, 848 (2019).

    文章  PubMed  PubMed Central  谷歌学术 

  16. 吕CH等。第一时相和第二时相胰岛素分泌、胰岛素抵抗以及葡萄糖效应在非肥胖老年中国女性糖尿病前期的作用。(巴尔的摩)医学博士 99(12), e19562 (2020).

    文章  谷歌学术 

  17. 石CC,卢CJ,陈GD & 张CC. 早期慢性肾脏疾病的风险预测:来自一项包含19,270人的成人健康检查项目的成果。国际环境研究与公共卫生杂志, 17(14). (2020).

  18. 李 HT 等人。韩国老年人骨矿物质密度与血压的关系:2008-2011年韩国国民健康和营养调查。临床与实验高血压学杂誌 37(3), 212–217 (2015).

    文章  PubMed  谷歌学术 

  19. 张, C. C. 等人. 利用机器学习算法研究重症肌无力患者住院时间延长的临床预测因素.临床医学杂志 10(19). (2021).

  20. 张楚楚等。开发基于堆叠集成的分类方案以预测头颈部癌症幸存者中的第二原发癌。国际环境研究与公共健康杂志 18(23). (2021).

  21. 邱,Y. L. 等人. 基于健康数据的机器学习算法应用于慢性肾脏疾病风险评估指标。风险管理与卫生政策. 14, 4401–4412 (2021).

    文章  PubMed  PubMed Central  谷歌学术 

  22. 吴泰 Enhong 等。利用机器学习评估局部使用阿托品控制近视对眼内压的影响。临床医学杂志, 10(1), (2020).

  23. 吴 CW 等人。基于 Spectralis OCT 的不同机器学习分类器在青光眼诊断中的比较。诊断学(巴塞尔) 11(9) (2021).

  24. 张, C. C. 等人。利用决策树算法支持重症肌无力患者入住重症监护病房的预测:一种基于机器学习的方法。个体化医学杂志, 12(1). (2022).

  25. 吴,C. Z.等.利用机器学习预测2型糖尿病患者颈动脉内中膜厚度异常。诊断检测. 13(11), (2023).

  26. 布雷曼,L. 随机森林。机器学习 45, 5–32 (2001).

    文章  谷歌学术 

  27. 卡莱,M. & 乌雷亚,V. 给编辑的信:随机森林重要性度量的稳定性。简短的生物信息学摘要. 12, 86–89 (2011).

    文章  PubMed  谷歌学术 

  28. 弗里德曼,J.H. 渴望函数近似:一种梯度提升机器。_ann. stat._(这通常指的是《统计年鉴》或《统计学杂志》,具体需根据上下文确定) 29(5), 1189–1232 (2001).

    文章  MathSciNet  谷歌学术 

  29. 弗里德曼,J.H. 随机梯度提升算法。计算统计与数据挖掘期刊 38(4), 367–378 (2002).

    文章  MathSciNet  谷歌学术 

  30. Ester, M., Kriegel, H. P.及Xu, X. XGBoost:一个可扩展的树提升系统。在第22届ACM SIGKDD国际知识发现与数据挖掘会议 proceedings,第785页,地理分析,2022年. https://doi.org/10.1111/gean.12315 (2016).

  31. 黄YC等。使用综合机器学习方案分析服用达比加群的非瓣膜性房颤患者的重要风险因素——事后分析。个体化医学杂志, 12(5). (2022).

  32. 陈,T.及Guestrin,C.XGBoost:一个可扩展的树提升系统. 在KDD '16:第22届ACM SIGKDD国际知识发现与数据挖掘会议 proceedings,美国旧金山, 785–794.

  33. 托尔莱,L.,佩罗内-伯特罗蒂,M.,汤姆斯,E. & 巴奇乌,M. 利用机器学习-XGBoost分析语言网络来分类癫痫患者。脑信息 4, 159–169 (2017).

    文章  谷歌学术 

  34. http://www.R-project.org,https://www.rstudio.com/products/rstudio/.

  35. Breiman, L., Cutler, A., Liaw, A. & Wiener, M. 随机森林:用于分类和回归的Breiman和Cutler的随机森林。R软件包版本,4.6-14。https://CRAN.R-project.org/package/randomForest(访问于2022年1月1日) (2022).

  36. Greenwell, B., Boehmke, B. & Cunningham, J. Gbm: 通用提升回归模型。R 包版本,2.1.8.https://CRAN.R-project.org/package=gbm(访问于2022年1月1日)(2020).

  37. Therneau, T. & Atkinson, B. January, rpart: 递归划分和回归树. R 包版本, 4.1.15. 2022.https://CRAN.R-project.org/package=rpart(访问于1)(2022).

  38. 陈,T.等.Xgboost: 极端梯度提升。R软件包版本,1.5.0.2。(2022年1月1日访问)(2022).

  39. 库恩,M. caret:分类和回归训练。R包版本,6.0-90。https://CRAN.R-project.org/package=caret(访问于2022年1月1日)(2022).

  40. 阿布拉姆森 B. 等人。围绝经期女性不同骨骼部位骨矿物质密度变化的不一致——对骨质流失评估和治疗反应的影响:丹麦骨质疏松症预防研究。J. 骨矿物质研究杂志 16(7), 1212–1219 (2001).

    文章  PubMed  谷歌学术 

  41. 赖凯,伦肯马库斯,饮水特巴里昂,切斯纳特查尔斯H. 骨密度测量部位可能影响治疗决策。钙骨组织国际期刊 53(4), 225–228 (1993).

    文章  PubMed  谷歌学术 

  42. Pouilles, J. M., Tremollieres, F. & Ribot, C. 更年期脊柱和股骨密度测定:评估骨质疏松风险时两个部位都需要吗?钙化组织国际杂志 52(5), 344–347 (1993).

    文章  PubMed  谷歌学术 

  43. 阿布拉罕森 B. 等人。围绝经期妇女骨密度测定部位:解剖区域之间的相关性和一致性界限。J. 骨头 最小值 研究 12(9), 1471–1479 (1997).

    文章  谷歌学术 

  44. 福尔克纳,K. G., von 斯特滕,E. & 米勒,P. 使用T分数的患者分类不一致。临床密度学杂志. 2(3), 343–350 (1999).

    文章  PubMed  谷歌学术 

  45. _goto, S., Shigeta, H., Hyakutake, S. & Yamagata, M. 日本女性运动员绝经相关腰椎和股骨近端骨矿物质密度变化的比较:一项长期纵向双能X射线吸收测定研究。_钙化组织国际杂志 59(6), 461–465 (1996).

    文章  PubMed  谷歌学术 

  46. 张,D.等.血清尿酸与普通人群及实验性高尿酸血症大鼠骨矿密度的关系。J. 骨头 最小值 研究 30(6), 992–999 (2015).

    文章  谷歌学术 

  47. 徐MZ等. 血清尿酸水平与骨质疏松患者骨矿密度的相关性:一项横断面研究。骨科肌肉骨骼疾病期刊(英文原名未完全给出,此处根据缩写推测其含义) BMC Musculoskelet. Disord. 24(1), 306 (2023).

    文章  PubMed  PubMed Central  谷歌学术 

  48. 伊布拉希姆,W. N.,尤纳斯,N.,石,Z.及阿布-马迪,M. A. 血清尿酸水平与卡塔尔健康人群多个骨骼部位较高的骨矿物质密度呈正相关。前沿内分泌学(洛桑). 12, 653685 (2021).

    文章  PubMed  谷歌学术 

  49. 潘凯,姚晓,刘梅及朱哲。血清尿酸水平与12至19岁青少年骨矿物质密度的相关性。 Front. Med. (洛桑). 7, 255 (2020).

    文章  ADS  PubMed  谷歌学术 

  50. Kaushal, N., Vohora, D., Jalali, R. K. & Jha, S. 关于血清尿酸与骨质疏松症相关性的文献回顾及其对骨骼代谢影响的机制见解。内分泌、代谢和免疫疾病药物靶点. 19(3), 259–273 (2019).

    文章  PubMed  谷歌学术 

  51. 瓦雷纳,M. 等人。绝经后女性队列中不同教育水平的骨质疏松症患病率。骨质疏松症。国际期刊。 9(3), 236–241 (1999).

    文章  PubMed  谷歌学术 

  52. 马达赫,M.,沙拉米,S. H. & 卡兰迪什,M.绝经后妇女骨质疏松症患病率的教育差异:伊朗北部的一项研究。 BMC公共健康. 11, 845 (2011).

    文章  PubMed  PubMed Central  谷歌学术 

  53. 霍 SC,陈 YM & 梅 JL. 教育水平与绝经后华裔妇女骨质疏松风险的关系。美国流行病学杂志 161(7), 680–690 (2005).

    文章  PubMed  谷歌学术 

  54. 尼尔森等。等人。团体患者教育增加骨质疏松知识和治疗依从性的两年随机对照试验。患者教育与咨询 81(2), 155–160 (2010).

    文章  PubMed  谷歌学术 

  55. 特里奥,K. & 奥尔德,G. W. 不同年龄段女性的骨质疏松知识、钙摄入量和负重体力活动。J. 社区健康. 27(5), 307–320 (2002).

    文章  PubMed  谷歌学术 

  56. 库马尔,A. 等。饮食摄入、教育和体育活动对北印度女性骨矿物质密度的影响。J. 骨代谢杂志_mineral and metabolism(矿物和代谢) 28(2), 192–201 (2010).

    文章  谷歌学术 

  57. 古尔,A.,萨拉克,A. J.,纳斯,K.及塞维克,R.绝经后妇女教育水平与骨矿物质密度之间的关系。 BMC全科医学实践。注意:"Fam Pract"在这里指的是"FAMILY PRACTICE",即全科医学或家庭医学。 5, 18 (2004).

    文章  PubMed  PubMed中央库  谷歌学术 

  58. Keramat A.等。伊朗女性与印度女性骨质疏松风险因素的评估。骨科肌肉骨骼疾病杂志. 9, 28 (2008).

    文章  PubMed  PubMed Central  谷歌学术 

  59. Kan, B. 等人. 血脂生物标志物与骨质疏松症的相关性:一项横断面研究。骨科肌肉骨骼疾病杂志. 22(1), 759 (2021).

    文章  PubMed  PubMed Central  谷歌学术 

  60. 山口,T.等。绝经后妇女血浆脂质与骨质疏松症的关系。内分泌学杂志 49(2), 211–217 (2002).

    文章  PubMed  谷歌学术 

  61. 布雷德尔,M. A. 等人。异位和血清脂质水平与肥胖患者的骨髓脂肪呈正相关。放射学. 269(2), 534–541 (2013).

    文章  PubMed  PubMed Central  谷歌学术 

  62. 唐 Yadong 等人. 夜间睡眠时长与骨矿物质密度:基于2007-2014年全国健康和营养调查(NHANES)的横断面研究。 BMC内分泌疾病. 22(1), 333 (2022).

    文章  PubMed  PubMed中央数据库  谷歌学术 

下载参考文献

作者信息

作者和 affiliations(注:affiliations 一词通常保留不变,因为它在学术语境中有特定含义)

  1. 辅仁大学应用科学与工程学院,新北市,中华民国台湾地区

    张璥尧 & 梁瑶真

  2. 天主教辅仁大学天主医院泌尿外科,中国台湾地区新北市

    彭忠信

  3. 内分泌与代谢科,辅仁大学天主教医院内科部,台湾新北市,中华民国

    陈方宇

  4. 内分泌与代谢科,内科部,医学教育部门,辅仁大学天主教医院,医学院,医学院,辅仁大学,台湾新北市,中华民国

    黄礼英

  5. 内分泌与代谢科,辅仁大学医院内科部,辅仁大学医学院,新北市,中华台北地区ROC

    郭春兴

  6. 国立国防医学院三军总医院妇产科,院长办公室,MJ健康研究基金会,台湾台北市114区

    祝达威

  7. 辅仁大学生命科学系暨研究所,台湾新北市,中华民国

    梁耀任

贡献

张庆尧:研究概念和设计,调查,撰写-原始草稿。 彭中欣:数据管理,撰写-审阅及编辑。 陈方宇:数据分析与解读,正式分析。 黄莉颖:统计分析,方法论。 郭俊恒:提供研究材料,验证。 朱大威:软件开发,数据可视化。 梁耀任:对论文重要学术内容进行批判性修订,监督。 所有作者审查了结果并批准了最终版本的手稿。当前研究中没有利益冲突。

通讯作者

correspondence to梁耀任.

伦理声明

利益冲突

作者声明没有利益冲突。

附加信息

出版者 notes

施普林格·自然对于出版地图中的管辖权声明和机构归属保持中立。

关于本文'article'在此处可能是指某个特定文章的介绍或说明部分,如果指的是模板或者提示,直接翻译意义不大。因此保留原句:About this article

Check for updates. Verify currency and authenticity via CrossMark

引用这篇文章

张CY., 彭CH., 陈FY.等著四种机器学习方法确定的绝经后妇女三年随访期间骨矿物质密度变化的风险因素。 Sci 报告 14,23234 (2024). https://doi.org/10.1038/s41598-024-73799-6

下载引用文献

  • 收到:

  • 已接受:

  • 发布:

  • DOI: https://doi.org/10.1038/s41598-024-73799-6

关键字

关于《四种机器学习方法确定的绝经后妇女三年随访期间骨矿物质密度变化的风险因素》
暂无评论

摘要

Introduction骨质疏松症被定义为一种系统性骨骼疾病,其特征是低骨量、骨组织微结构的恶化、骨脆性的增加以及骨折的易感性。4使用基于随机森林(RF)、极端梯度提升(XGBoost)、朴素贝叶斯(NB)和随机梯度提升(SGB)模型的SHAP值来可视化输入特征对输出的影响。Discussion在本研究中,我们采用了四种Mach-L方法来确定预测δ-T评分4年后的重要性风险因素。然而值得注意的是他们的研究将队列分为四组并比较了BMD这与我们的方法不同62. 36(2), 180–188 (2021)。Article  MathSciNet  PubMed  Google Scholar  Tseng, C. J. et al. 不同骨骼部位骨矿物质密度变化的不一致在围绝经期妇女中的意义——对骨丢失和治疗反应评估的影响:丹麦骨质疏松症预防研究。

相关讨论