英语轻松读发新版了,欢迎下载、更新

基于机器学习的老年高血压患者心脏病发生风险预测研究

2025-01-11 08:37:10 英文原文

作者:Yu, Jing

  • 开放获取
  • 发表:
  • 2025 年 1 月 11 日

体积 25,商品编号: 27 号2025年引用这篇文章抽象的

客观的

构建老年高血压人群心脏病发生的预测模型,旨在提供早期风险识别。

方法

中国健康与养老追踪研究共纳入934名60岁及以上的参与者,并进行了7年的随访(2011年至2018年)。

采用机器学习方法(逻辑回归、XGBoost、DNN)建立预测高血压患者心脏病风险的模型。使用辨别、校准和临床决策曲线综合评估模型性能。

结果

对 934 名老年高血压患者进行 7 年随访后,243 名患者(26.03%)患上了心脏病。基线患有血脂异常、慢性肺部疾病、关节炎或风湿病的老年高血压患者未来患心脏病的风险更高。与原始变量集相比,特征选择显着提高了预测性能。逻辑回归、XGBoost 和 DNN 的 ROC-AUC 分别为 0.60 (95% CI: 0.53–0.68)、0.64 (95% CI: 0.57–0.71) 和 0.67 (95% CI: 0.60–0.60)0.73),逻辑回归实现了最佳校准。随着阈值的增加,XGBoost 表现出最明显的临床益处。

结论

机器学习根据 CHARLS 队列的数据有效识别老年高血压患者患心脏病的风险。结果表明,患有血脂异常、慢性肺部疾病、关节炎或风湿病的老年高血压患者患心脏病的风险较高。这些信息可以促进老年高血压患者未来患心脏病的早期风险识别。

同行评审报告

介绍

高血压仍然是全球突出的公共卫生问题,对人类健康构成重大威胁。据估计,2019年全球成人高血压患病人数达13亿,并呈持续上升趋势[1]。仅在中国,就有约 3.3 亿人患有心血管疾病,其中高血压患者高达 2.45 亿。2]。高血压是心脏病的主要危险因素,每年导致近 1080 万人死亡[3]。作为一种可改变的危险因素,高血压仍然是心血管疾病的主要原因。随着全球人口老龄化加速,高血压患病率稳步上升,尤其是老年高血压患者。值得注意的是,老年高血压患者的心脏病预后往往更差,导致疾病负担更重。鉴于老年高血压患者数量庞大,通过流行病学数据及早识别出心脏病高危人群可以促进个性化干预,从而改善这一弱势群体的预后。因此,构建老年高血压患者心脏病风险的预测模型至关重要,这对于早期识别高危人群以及随后实施个性化干预措施以改善结果具有重要意义。在疾病预测研究中,回归分析是常用的预测方法,如Cox回归[4,5]。然而,这些方法可能会遇到非线性问题,并且在处理大量预测变量时,可能无法辨别预测变量和结果之间的复杂关系。机器学习作为一类依赖于计算机的算法,近年来通过迭代地从输入数据中学习以有效地预测新数据集,在疾病风险预测中获得了广泛的应用。6]。

逻辑回归是最基本的机器学习模型,以其简单的模型设置和经常用作其他机器学习模型的基准而闻名。XGBoost(极端梯度提升)是属于提升系列的集成算法。它通过结合算法和工程增强来改进梯度提升决策树(GBDT)算法,从而进一步提高模型计算速度和效率[7,8]。深度学习也是机器学习领域的常见模型。深度神经网络(DNN)是一种包含多个隐藏层的神经网络,作为基础深度学习模型,在分类问题中拥有众多成功的应用[9,10]。

在这项研究中,利用流行病学信息(人口统计、生活方式行为和病史),XGBoost 和 DNN 用于预测老年高血压患者的心脏病。采用特征工程优化预测模型,并与传统逻辑回归(LR)模型进行比较。使用判别、校准和决策曲线综合进行预测模型的评估。本研究旨在为选择老年高血压患者心脏病早期筛查的最佳模型提供见解。

材料和方法

数据来源

本研究的数据来自中国健康与退休纵向研究(CHARLS),这是一项代表中国45岁及以上人群的高质量纵向队列研究。在本研究中,我们使用 2011 年的数据作为基线,并使用 2018 年的最新随访数据作为结果评估。研究参与者的纳入标准为:(1) 基线年龄≤60 岁,(2) 基线诊断为高血压(收缩压≤140 mmHg 和/或舒张压)血压——90毫米汞柱。)排除标准为:(1) 基线高血压状况和心脏病(包括心脏病发作、冠心病、心绞痛、充血性心力衰竭或其他心脏问题)的数据缺失,(2) 基线存在心脏病,以及 (3)缺少 2018 年心脏病状况数据。最终确定了总共 934 名符合条件的研究参与者,其中 243 人在 2018 年经历过心脏病事件。

变量选择和测量

基于文献综述和 CHARLS 数据库的结合,本研究纳入了基线时的四大类变量。其中包括年龄、性别和腰围身高比等人口统计变量;行为因素,包括吸烟、饮酒和体力活动;病史包括血脂异常(低密度脂蛋白、甘油三酯和总胆固醇升高,或高密度脂蛋白水平降低)、糖尿病、恶性肿瘤、慢性肺部疾病(例如慢性支气管炎、肺气肿,不包括肿瘤或癌症)、心脏和肝脏疾病、中风、肾脏疾病、消化系统疾病、情绪和心理健康问题、记忆相关疾病、关节炎或风湿性疾病以及哮喘。预测的结果是心脏病的发生,由老年人自我报告或由其家庭成员报告。具体来说,该研究对 2011 年基线时患有高血压的个体进行了追踪,以确定他们在 2018 年之前的持续随访期间是否患上了心脏病。

数据预处理

首先,对异常值进行分析。由于变量不服从正态分布,因此使用 Tukey 检验来识别异常值。具体来说,数据点低于 Q1-1.5*QR或以上Q3☀++☀1.5*QR(其中 Q1 和 Q3 是下四分位数和上四分位数,IQR 是四分位数范围)被视为异常值并被视为缺失值。在本研究中,检测到的异常值被作为缺失值处理。

此外,各种变量表现出不同程度的缺失,如表所示 1,缺失值的热图如图所示。 1。除腰高比外,其他变量的缺失比例均小于4.00%(其中腰高比缺失比例最高,为17.77%)。对于缺失值,使用随机森林算法进行插补。对于连续变量,插补是使用非缺失样本的加权平均值进行的,而对于分类变量,插补是基于具有最高平均接近度的类别。为了解决变量之间的尺度差异,应用最小-最大标准化方法,确保所有变量值都落在[0,1]范围内。

表 1 缺失数据概述示例
图 1
figure 1

缺失值热图

特征选择

预测变量的选择对最终模型的性能具有决定性影响。本研究采用信息增益结合逐步前向/后向选择的方法进行特征选择。具体来说,该过程涉及计算每个变量的信息增益并按降序排列它们。然后将具有最高信息增益(V1)的变量纳入随机森林(RF)模型,并计算其F1分数。随后,添加具有第二高信息增益的变量(V2),并计算包含V1和V2变量的模型的F1分数(表示为F1')。如果F1'→>→F1,则包含V2;否则,V2 被排除。对所有变量迭代重复此过程,直到探索完所有变量。

模型构建和验证

在本研究中,使用逻辑回归、集成学习的 XGBoost 和深度学习的 DNN 构建了预测模型。数据集按照70:30的比例分为训练集和测试集,训练集用于模型训练,测试集用于模型性能评估。在训练过程中,采用网格搜索来微调模型超参数。在测试阶段,使用准确度、精确度、召回率和 F1 分数来评估模型辨别力。使用 bootstrap 方法估计具有 95% 置信区间 (CI) 的曲线下面积 (AUC) 指标。使用 Hosmer 和 Lem 显示拟合优度检验评估模型校准。此外,利用决策曲线分析(DCA)来评估模型的临床效用。整个模型开发流程如图1所示 2

图 2
figure 2

模型开发工作流程

统计分析

使用中位数和四分位数范围描述连续变量,而使用百分比描述分类变量。本研究中的所有分析均使用 R 版本 3.6.0 进行。具体来说,XGBoost模型是使用XGBoost包实现的,深度神经网络的构建使用h2o包。使用 pROC 包进行模型 AUC 计算和 AUC 的成对比较。使用 PredictABEL 包进行模型校准分析,随机种子设置为 123。p-值≤<≤0.05被认为具有统计显着性。结果

研究参与者的基线特征

对934名基线高血压患者进行7年随访后,有243人出现心脏病,7年发病率为26.03%。

表中列出了心脏病组和非心脏病组之间基线特征的比较 2。研究人群的平均年龄为62.83岁,其中男性占47.20%。腰围与身高之比为0.52,平均睡眠时间为5小时。吸烟率高于饮酒率(38.12% vs. 27.62%)。在慢性疾病中,关节炎或风湿病、消化系统疾病、血脂异常、慢性肺病和糖尿病的患病率高于其他疾病。通过比较伴有和不伴有心脏病的高血压患者的基线特征,发现基线存在血脂异常、慢性肺部疾病、关节炎或风湿病的高血压患者患心脏病的风险较高。

表 2 研究人群的基线特征

特征选择

通过特征工程在整个数据集上进行特征选择,结果如图 1 所示。 3。图 3-A显示每个变量的重要性,前五名是腰围与身高的比例、年龄、睡眠时间、饮酒量、关节炎或风湿病。图 3-B 呈现特征选择的结果,总共识别了 7 个变量。其中包括人口统计变量年龄和腰围身高比;生活方式因素饮酒;病史变量包括糖尿病、慢性肺病、血脂异常、关节炎或风湿病。

图 3
figure 3

特征选择。控制板一个描述了每个变量的相对重要性,而面板说明了随机森林与前向和后向选择相结合的特征选择的结果

型号性能

该模型通过在训练集上进行十倍交叉验证和网格搜索来进行参数优化。逻辑回归使用默认参数;XGBoost 针对学习率 (eta)、特征采样率、采样率、最大深度、最小子权重和节点分裂的最小损失减少 (gamma) 进行了调整;对于 DNN,该研究配置了一个具有 4 个隐藏层的网络,并迭代每个隐藏层中的 1-20 个神经元。超参数调整的结果如表所示 3。桌子4显示模型对完整变量集和特征选择变量集的预测性能。在完整变量集上,LR 表现出最高的准确度(0.67)和特异性(0.81),其次是 DNN,而 XGBoost 的准确度(0.57)和特异性(0.62)相对较低。灵敏度从高到低依次为 DNN(0.50)、XGBoost(0.46)和 LR(0.32),F1 值也有类似的趋势,其中 DNN 最高(0.44),LR 最低(0.35)。LR、XGBoost 和 DNN 的 AUC 值分别为 0.60 (0.53–0.67)、0.55 (0.48–0.63) 和 0.57 (0.49–0.67),没有统计学上的显着差异 (≤>≤0.05,表 5)。表3 模型超参数调优

表 4 预测模型的性能指标
表 5 模型性能 AUC 的成对比较
特征选择后,准确率和特异度明显下降,但灵敏度和 F1 值大幅上升,尤其是 XGBoost 和 DNN,灵敏度达到 0.74 和 0.73,F1 值上升到 0.48。

LR、XGBoost 和 DNN 在特征选择集上的 AUC 值分别为 0.60 (0.53–0.68)、0.64 (0.57–0.71) 和 0.67 (0.60–0.73)。值得注意的是,DNN 在特征选择集上的 AUC 显着高于 LR(≤=≤0.037)。此外,比较特征选择前后模型的 AUC 显示 XGBoost 和 DNN 有了显着改进(值分别为 0.022 和 0.004)。

模型的校准结果如图所示。 4,其中 LR 表现出最佳校准(Ï2=10.378,�=�0.239),然后是 DNN (�2�=�18.082,�=�0.021) 和 XGBoost (�2�=�26.206,≤=≤0.001)。使用 DCA 的进一步分析如图 1 所示。 5。将阈值设置为≤0.21,DNN和LR优于XGBoost;对于 0.21-0.34 之间的阈值,XGBoost 的效用超过 LR,但仍低于 DNN;对于超过 0.34 的阈值,XGBoost 始终优于 DNN 和 LR。

图 4
figure 4

预测模型的校准图。图 A 代表逻辑回归,图 B 代表 XGBoost,图 C 代表 DNN(深度神经网络)

图 5
figure 5

预测模型对应的决策曲线

SHAP 可解释性分析

为了进一步阐明 XGBoost 模型的黑盒性质,我们利用 SHAP 方法来评估 XGBoost 模型的可解释性。SHAP 结果显示,最重要的三个预测因素是年龄、WHtR 和酒精消耗量,如图 1 所示。 6。y 轴代表从高到低排列的变量值,而 x 轴代表模型对预测结果的贡献。老年高血压患者心脏病发生概率的变量预测性能表现出复杂性。例如,在前三个关键变量中,年龄和WHtR对结果的影响相对随机,而就酒精消耗而言,在模型预测老年人中,酒精消耗的增加会增加心脏病发生的可能性。高血压人群。

图 6
figure 6

SHAP 概要图

讨论

近年来,机器学习模型被广泛应用于预测各种疾病的短期或长期风险、并发症风险、危险因素分析、死亡率分析等。11,12,13,14,15]。这证明了机器学习模型在预测各种疾病方面的优势。特别是,这些模型在预测心脏病风险方面的应用越来越多,这对于一级预防至关重要。它们在心脏病风险预防和临床决策中发挥着基础作用。许多基于机器学习的心脏病风险预测模型都表现出了良好的性能,但每项研究的侧重点各不相同,且各有其局限性。16,17 号]。多项关于心脏病风险预测模型的研究表明,高血压是预测心脏病和心血管事件风险的重要因素之一。18,19 号,20]。然而,缺乏专门针对高血压患者心脏病风险的机器学习预测模型,这是一个值得关注的方面。虽然该领域的一些预测模型已经证明了有希望的结果,但它们主要基于横断面研究。因此,这些模型仅限于高血压患者当前心脏病发生的短期风险预测,缺乏长期风险预测所需的纵向深度,因此存在显着的局限性。17 号,21]。我们的研究经过7年的随访,专门针对高血压患者,从而有助于预测长期心血管疾病风险,并为早期风险识别提供基础,具有明显的优势。此外,虽然当前许多基于机器学习的预测模型主要关注动脉粥样硬化和冠心病等心血管疾病,但它们往往忽视其他类型的心脏疾病(如心力衰竭、风湿性心脏病等)及其并发症。然而,很明显,高血压不仅仅是冠心病的重要危险因素。因此,我们的研究同时针对多种心脏疾病,包括冠心病、心力衰竭、风湿性心脏病等,从而使预测范围更广。最后,我们的重点是老年人口。在社会持续老龄化的时代,机器学习在老年疾病中的应用日益广泛[22]。然而,关于预测老年高血压患者长期心脏病风险的研究明显缺乏,特别是那些服务不足的社区的患者。本研究正是针对这些焦点问题。

血脂异常已成为老年人的常见病,对心血管疾病的发生和进展构成重大风险。总胆固醇 (TC)、甘油三酯 (TG) 和低密度脂蛋白胆固醇 (LDL-C) 水平升高是这些疾病的特征。2,23]。我们研究的预测结果表明,患有血脂异常的老年高血压患者患心脏病的风险更大。高血压、糖尿病、血脂异常等因素可介导血小板活化异常,有利于病理性血栓形成和心血管疾病,是心血管疾病发生的常见危险因素。24]。此外,高血压患者的生活方式因素和饮食习惯通常与血脂异常患者相似。25]。最近的研究表明,甘油三酯是最有可能增加收缩压和舒张压的主要脂质指标,其中小高密度脂蛋白(HDL)中甘油三酯升高与血压升高之间的相关性特别强。26]。由于血压、血脂和血糖水平通常是潜在的,因此在该人群中检测到血管疾病、心肌梗塞、中风和其他严重事件时很可能已经发生。因此,对于老年高血压患者来说,血脂异常是预测未来心脏病风险较高的有力因素。及时检测和管理血脂水平有助于降低心脏病发生的风险,预防严重的心血管事件。

患有慢性肺部疾病的患者可能会出现肺循环阻力增加,导致肺动脉高压并影响右心系统。高血压本身可以促进心脏重塑,从而进一步促进心力衰竭等疾病的发生。因此,对于老年高血压患者来说,及时预防、识别和治疗慢性肺部疾病有助于降低未来患心脏病的风险。风湿性心脏病 (RHD) 是一种获得性瓣膜病,始于未经治疗的链球菌咽部感染,其特征是瓣膜反流和/或狭窄,通常与心律失常、全身性栓塞、感染性心内膜炎、肺动脉高压、心力衰竭和死亡等并发症相关[27 号]。它仍然是发展中国家心血管疾病相关死亡的一个重要原因。28]。急性风湿热(ARF)和 RHD 是全球心血管疾病发病率和死亡率的重要决定因素。27 号]。此外,在以严重全身炎症为特征的风湿性疾病中,动脉粥样硬化和心血管疾病的发病率和死亡率往往增加。29]。

患有基线高血压的老年患者会对靶器官心脏造成长期损害。这使得各种心脏病的发生更有可能,而不仅仅是风湿性心脏病。根据我们的预测结果,患有高血压的老年人如果后来患上关节炎或风湿病,则更有可能患上心脏病。因此,对于老年高血压患者,特别是患有关节炎或风湿性疾病的患者,必须加强预防、识别和管理,降低心脏病发生的风险。

在使用全变量集的预测中,三种机器学习方法的预测能力都比较弱,LR的AUC最高为0.60。经过特征工程后,选择了更小的一组更有价值的变量,此时,XGBoost 和 DNN 模型的性能都出现了显着提升,分别达到了 0.64 和 0.67。这表明特征工程不仅降低了预测数据的维度,而且有助于提高模型的预测性能。值得注意的是,在特征选择过程中,所选特征与识别的风险因素(例如性别、吸烟和饮酒)之间存在不一致。这些因素是已知的心脏病危险因素,但没有进入特征选择结果。一些研究表明,影响疾病的因素不一定对其预测有显着贡献。30]。换句话说,对疾病有重大影响的因素可能对预测的贡献很小,这凸显了预测研究和因果推断之间的重要区别。

本研究还对预测模型进行了判别分析、校准分析和临床效用分析。一个好的区分模型应该能够区分未来疾病风险高和低的个体,通常使用 AUC 进行评估。校准反映了预测风险与实际风险之间的一致性。2015年对心血管疾病预测模型的系统回顾发现,63%的研究报告了预测模型的歧视,但只有36%报告了模型校准,导致预测模型质量存在差异。31]。目前,越来越多的预测研究建议同时报告歧视和校准,以实现更科学、客观的评估。此外,决策曲线分析可以通过根据增益确定适当的模型阈值来指导临床应用。32]。这项研究发现不同阈值范围内预测模型增益存在差异。

通过特征选择,本研究确定了七个重要的预测变量:年龄、腰围身高比、饮酒、糖尿病、血脂异常、肺部疾病和关节炎。除了年龄是不可改变的因素外,其他因素都可以通过改变饮食、增加体育锻炼、控制体重来改善。具体来说,利用流行病学数据可以帮助早期识别老年高血压患者的心脏病风险。对于低风险人群,建议保持健康的生活习惯。对于高危人群,建议改变不良生活习惯,定期检查,严重者及时就医。

这项研究的优势可能包括大规模社区队列调查,它提供了具有代表性和成本效益的数据。采用高危人群策略,结合流行病学数据,有利于早期筛查,提高干预效率。而且,特征工程技术的使用有助于降低预测变量的维数,选择更好的预测模型,有利于实际应用。最后,通过判别、校准和临床决策曲线分析对模型进行综合评估,从多个角度指导模型选择。但该研究仅包含人口统计学、生活方式和疾病史特征,样本量较小,无法充分展现机器学习算法在处理大数据和多维特征方面的优势。此外,该研究仅进行了内部验证,并未在更广泛的人群中进行外部验证,限制了研究的普遍性。总体而言,该研究结果为预测老年高血压人群未来患心脏病的风险和早期风险识别提供了有价值的见解。

数据可用性

本研究使用中国健康与退休追踪研究的公开数据。原始数据可通过以下链接获取:https://charls.pku.edu.cn/。

参考

  1. 1990年至2019年全球高血压患病率及治疗和控制进展趋势:1.04亿受试者的1201项人群代表性研究的汇总分析[J].《柳叶刀》(英国伦敦),2021 年,398(10304):957–980。 https://doi.org/10.1016/s0140-6736(21)01330-1。2021年中国心血管健康与疾病报告:更新摘要[J].

  2. 生物医学和环境科学:BES,2022,35(7):573–603。 https://doi.org/10.3967/bes2022.079。1990-2019年204个国家和地区87个危险因素的全球负担:2019年全球疾病负担研究的系统分析[J].

  3. 《柳叶刀》(英国伦敦),2020,396(10258):1223 - 1249。 https://doi.org/10.1016/s0140-6736(20)30752-2。柴X,陈Y,李Y,等。

  4. 老年营养风险指数较低与慢性阻塞性肺疾病患者全因死亡风险较高相关:2013-2018年全国健康与营养调查队列研究[J].BMJ 开放呼吸研究,2023 年,10(1)。 https://doi.org/10.1136/bmjresp-2022-001518。Paljårvi T、Tiihonen J、Lähteenvuo M 等。

  5. 精神病性抑郁症与自杀死亡[J].J 情感障碍。2023;321:28–32。https://doi.org/10.1016/j.jad.2022.10.035。文章

    一个 考研一个 谷歌学术一个 Greener JG、Kandathil SM、Moffat L 等。生物学家机器学习指南[J].

  6. Nat Rev Mol 细胞生物学。2022;23(1):40–55。https://doi.org/10.1038/s41580-021-00407-0。文章

    一个 中科院一个 考研一个 谷歌学术一个 范T,王J,李L,等。预测糖尿病酮症酸中毒相关急性肾损伤的危险因素:使用 XGBoost 的机器学习方法[J].

  7. 公共卫生前沿。2023;11:1087297。https://doi.org/10.3389/fpubh.2023.1087297。文章

    一个 考研一个 考研中心一个 谷歌学术一个 王R,张J,单B,等。关键词: 动脉瘤性蛛网膜下腔出血, XGBoost 机器学习算法

  8. 神经精神病学疾病治疗。2022 年;18:659–67。https://doi.org/10.2147/ndt.s349956。文章

    一个 考研一个 考研中心一个 谷歌学术一个 Egger J、Gsaxner C、Pepe A 等人。医学深度学习——系统元综述[J].

  9. 生物医学计算方法程序。2022;221:106874。https://doi.org/10.1016/j.cmpb.2022.106874。文章

    一个 考研一个 谷歌学术一个 Stahlschmidt SR, Ulfenborg B, Synnergren J. 用于生物医学数据融合的多模态深度学习:综述[J]。生物信息学简报,2022 年,23(2)。 

  10. https://doi.org/10.1093/bib/bbab569。Dong J,Feng T,Thapa-Chhetry B,等人。儿科重症监护中急性肾损伤(AKI)早期预测的机器学习模型[J].

  11. 重症监护(英国伦敦)。2021;25(1):288。https://doi.org/10.1186/s13054-021-03724-0。文章

    一个 考研一个 谷歌学术一个 黄刚, 金Q, 毛Y. 利用机器学习模型预测非酒精性脂肪肝的5年风险:前瞻性队列研究[J].医学互联网研究杂志。

  12. 2023;25:e46891。https://doi.org/10.2196/46891。文章

    一个 考研一个 考研中心一个 谷歌学术一个 Cho SY,Kim SH,Kang SH,等。现有的基于机器学习的心血管风险预测模型[J].

  13. 科学报告 2021;11(1):8886。https://doi.org/10.1038/s41598-021-88257-w。文章

    一个 中科院一个 考研一个 考研中心一个 谷歌学术一个 扎法尔 A、阿蒂亚 Z、特斯法耶 M 等。基于机器学习的肠道寄生虫感染危险因素分析及流行病学调查数据预测[J].

  14. PLoS Negl Trop Dis。2022;16(6):e0010517。https://doi.org/10.1371/journal.pntd.0010517。文章

    一个 考研一个 考研中心一个 谷歌学术一个 柯杰,陈Y,王X,等。基于机器学习的急性冠脉综合征患者院内死亡率预测模型[J].

  15. Am J Emerg Med。2022 年;53:127–34。https://doi.org/10.1016/j.ajem.2021.12.070。文章

    一个 考研一个 谷歌学术一个 Alaa AM、Bolton T、Di Angelantonio E 等。使用自动机器学习进行心血管疾病风险预测:一项针对 423,604 名英国生物银行参与者的前瞻性研究[J]。

  16. 公共科学图书馆一号。2019;14(5):e0213653。https://doi.org/10.1371/journal.pone.0213653。文章

    一个 中科院一个 考研一个 考研中心一个 谷歌学术一个 Xi Y, Wang H, Sun N. 机器学习优于传统Logistic回归,为心血管风险预测提供新的可能性:一项涉及143,043名中国高血压患者的研究[J].心血管医学前沿。

  17. 2022;9:1025705。https://doi.org/10.3389/fcvm.2022.1025705。文章

    一个 考研一个 考研中心一个 谷歌学术一个 Konstantonis G、Singh KV、Sfikakis PP 等人。使用机器学习和颈动脉/股动脉成像框架检测类风湿关节炎患者的心血管疾病[J].

  18. 风湿病国际。2022;42(2):215–39。https://doi.org/10.1007/s00296-021-05062-4。文章

    一个 考研一个 谷歌学术一个 庄XD,田T,廖LZ,等。关键词: 长期心血管疾病, 深度表型分析, 预测, 机器学习, 优化

  19. 可以 J Cardiol。2022;38(6):774–82。https://doi.org/10.1016/j.cjca.2022.02.008。文章

    一个 考研一个 谷歌学术一个 沉T,刘D,林Z,等。关键词: 冠心病, 运动评估, 预测心血管事件, 机器学习模型

  20. 临床医学杂志,2022,11(20)。https://doi.org/10.3390/jcm11206061

  21. 吴Y,辛B,万Q,等。机器学习老年人高血压心血管并发症的危险因素及预测模型:一项横断面研究[J].日光。2024;10(6):e27941。https://doi.org/10.1016/j.heliyon.2024.e27941。文章

    一个 中科院一个 考研一个 考研中心一个 谷歌学术一个 Das A, Dhillon P. 机器学习在衰老和老年疾病测量中的应用:系统评价[J].BMC 老年病。

  22. 2023;23(1):841。https://doi.org/10.1186/s12877-023-04477-x。文章

    一个 考研一个 考研中心一个 谷歌学术一个 Dybiec J、Baran W、Däbek B 等人。血脂异常治疗研究进展[J].

  23. 国际分子科学杂志,2023,24(17)。 https://doi.org/10.3390/ijms241713288。Sepúlveda C, Palomo I, Fuentes E. 用于高血压、血脂异常和糖尿病的药物的抗血小板活性:预防心血管疾病的额外益处[J]。

  24. 血管药理学。2017;91:10–7。https://doi.org/10.1016/j.vph.2017.03.004。文章

    一个 中科院一个 考研一个 谷歌学术一个 ESC/EAS 血脂异常管理指南。脂质修饰降低心血管风险[J].

  25. 动脉粥样硬化。2019;290:140–205。https://doi.org/10.1016/j.atherosclerosis.2019.08.014。文章

    一个 中科院一个 谷歌学术一个 刘文,杨春,雷峰,等。主要脂质和脂蛋白水平与血压升高的风险:孟德尔随机研究[J]。

  26. E生物医学。2024;100:104964。https://doi.org/10.1016/j.ebiom.2023.104964。文章

    一个 中科院一个 考研一个 考研中心一个 谷歌学术一个 Auala T、Zavale BG、Mbakwem A 等人。急性风湿热和风湿性心脏病:强调 A 族链球菌在全球心血管疾病负担中的作用[J]。

  27. 病原体(瑞士巴塞尔),2022,11(5)。 https://doi.org/10.3390/pathogens11050496。Franczyk B、Gluba-Brzózka A、Rysz-GórzyÅska M 等。

  28. 关键词: 风湿性心脏病, 炎症和氧化应激国际分子科学杂志,2022 年,23(24)。 https://doi.org/10.3390/ijms232415812。Melissaropoulos K、Bogdanos D、Dimitroulas T 等人。

  29. 原发性干燥综合征与心血管疾病[J].当前 Vasc Pharmacol。2020;18(5):447–54。https://doi.org/10.2174/1570161118666200129125320。文章

    一个 中科院一个 考研一个 谷歌学术一个 佩佩 MS,冯 Z,黄 Y,等。将标记的预测性与其分类器的性能相结合[J]。

  30. 《流行病学杂志》。2008;167(3):362–8。https://doi.org/10.1093/aje/kwm305。文章

    一个 考研一个 谷歌学术一个 Wessler BS、Lai YhL、Kramer W 等。关键词: 心血管疾病, 临床预测模型, Tufts, 预测分析, 有效性比较, 临床预测模型数据库

  31. Circ 心血管质量结果。2015;8(4):368–75。https://doi.org/10.1161/circoutcomes.115.001693。文章

    一个 考研一个 考研中心一个 谷歌学术一个 维克斯 AJ.诊断测试、预测模型和分子标记评估的决策分析[J].

  32. 上午统计。2008;62(4):314—20。https://doi.org/10.1198/000313008x370302。文章

    一个 考研一个 考研中心一个 谷歌学术一个 下载参考资料资金

该研究得到国家自然科学基金(NSFC 81960086,82160089)、甘肃省卫生科研项目(GSWSKY2017-02)、兰州大学第二医院翠英科技创新计划(CY2021-MS-A13)的资助

本研究得到兰州大学第二医院博士培养专项资金项目(YJS-BD-24)和国际科技合作基地(PR0124002)的资助。

作者信息

作者和单位

  1. 730000 兰州翠营门 82 号,兰州大学第二医院暨临床医学院心内科

    费斯、刘谦、靖宇

贡献

概念化:F.S.和 J.Y.方法论:F.S.、Q.L. 和 J.Y.正式分析和调查:F.S.、Q.L. 和 J.Y. 写作 – 审查和编辑:F.S.、Q.L. 和 J.Yu。人物1,2,3,45:F.S.表格1,2,3,45:F.S.

通讯作者

通讯至靖宇

道德声明

道德批准并同意参与

该研究经北京大学生物医学伦理委员会批准(批准号:IRB00001052-11015;IRB00001052-11014),并严格遵守赫尔辛基宣言中概述的伦理原则。所有参与者均提供了书面知情同意书,以确保数据收集过程的道德合规性和保护参与者权利的保护。

同意发表

不适用。

利益竞争

作者声明没有竞争利益。

临床试验号

这项研究是根据公开可用的纵向调查数据库,中国健康和退休纵向研究(CHARLS)完成的,因此不是临床试验,因此,没有获得临床试验注册号。

附加信息

出版商的注释

施普林格·自然对于已出版的地图和机构隶属关系中的管辖权主张保持中立。

引用这篇文章

Check for updates. Verify currency and authenticity via CrossMark

Si,F.,Liu,Q。&Yu,J。基于机器学习的老年高血压患者心脏病的发生风险的预测研究。

BMC老年病25 ,27(2025)。https://doi.org/10.1186/s12877-025-05679-1

下载引文

  • 已收到:

  • 公认:

  • 已发表:

  • DOI:https://doi.org/10.1186/s12877-025-05679-1

关键词

关于《基于机器学习的老年高血压患者心脏病发生风险预测研究》的评论


暂无评论

发表评论

摘要

这项研究是利用机器学习技术来估计老年高血压患者发生心脏病的风险的预测分析。该研究由兰州大学第二医院临床医学院心脏病科的费斯、刘谦和靖宇进行。以下是从提供的文本中提取的要点:### 研究背景和资助- **资助:**该研究得到国家自然科学基金委(NSFC)、甘肃省卫生健康科研项目、兰州大学第二医院翠英科技创新项目、兰州大学第二医院翠英科技创新项目、兰州大学第二医院翠英科技创新项目、兰州大学第二医院翠英科技创新项目、兰州大学第二医院翠英科技创新项目、兰州大学第二医院翠英科技创新项目、兰州大学第二医院翠英科技创新项目、兰州大学第二医院翠英科技创新项目、兰州大学第二医院翠英科技创新项目、兰州大学第二医院翠英科技创新项目、兰州大学第二医院翠英科技创新项目、兰州大学第二医院翠英科技创新项目等多方资助。博士培养、国际科技合作基地。### 研究设计- **伦理批准:** 该研究经北京大学生物医学伦理委员会批准(批准号:IRB00001052-11015;IRB00001052-11014),并遵守赫尔辛基宣言指南。- **同意:** 参与者提供了书面知情同意书。### 研究问题- 该研究旨在根据中国健康与退休纵向研究(CHARLS)的现有数据,使用机器学习技术开发一个预测模型,以识别老年高血压患者与心脏病相关的风险。### 方法论- 本节在这里没有明确详细说明,但通常涉及选择适当的机器学习算法、特征选择方法、数据预处理步骤、模型训练、验证过程和性能评估指标,例如准确度、精确度、召回率、F1 分数和 AUC。### 数据源- **中国健康与退休纵向研究(CHARLS):** 该研究利用公开的纵向调查数据库,提供有关中国老年人的全面健康相关信息。### 作者的贡献- **费斯:**概念化、方法论、形式分析、调查、写作评论和编辑、图形创作。- **刘谦:** 方法论、形式分析、调查、写作评论和编辑。- **靖宇:** 构思、监督。### 主要发现和出版物该研究结果发表在《BMC Geriatrics》杂志上,文章标题为“基于机器学习的老年高血压患者心脏病发生风险的预测研究”。论文2024年2月26日接收,2025年1月2日接受,2025年1月11日发表。### 学习机会该研究可根据 Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License 公开获取。这项预测研究旨在为医疗保健提供者提供有价值的见解,帮助他们识别更有可能患心脏病的高危高血压老年人,从而可以从有针对性的预防措施或干预措施中受益。研究