作者:Neuroscience News
摘要:最近的一项回顾性研究探讨了将机器学习与传统统计模型结合如何能提高疾病风险预测的准确性,这是临床决策中的一个关键工具。虽然像逻辑回归这样的传统模型受到某些假设的限制,但机器学习提供了灵活性,在一些情况下却会产生不一致的结果。
该研究揭示了组合模型,特别是堆叠方法,通过利用每种方法的优势并解决其弱点而优于单独的方法。通过评估多数投票、加权投票和堆叠等方法,研究人员展示了如何整合可以导致更可靠和精确的预测,可能有利于患者的预后。团队旨在为临床环境精炼这些方法,为稳健且适应性强的预测工具铺平道路。
关键事实:
来源:健康数据科学
北京大学的研究人员对机器学习与疾病风险预测模型中统计方法相结合的系统进行了全面回顾,揭示了此类集成模型在临床诊断和筛查实践中的潜在价值。
由北京大学公共卫生学院流行病学与生物统计学系冯_sun教授领导的研究发表在健康数据科学.
疾病风险预测对于早期诊断和有效临床决策至关重要。然而,传统的统计模型,如逻辑回归和Cox比例风险回归,在实际应用中常常会因为其假设条件可能不成立而面临局限性。
与此同时,尽管机器学习方法具有灵活性和处理复杂及非结构化数据的能力,在某些场景中并未始终表现出优于传统模型的性能。为应对这些挑战,将机器学习与传统统计方法相结合可能提供更稳健和准确的预测模型。
系统综述分析了分类和回归模型的各种集成策略,包括多数投票、加权投票、堆叠以及模型选择,这些策略基于统计方法和机器学习的预测是否存在分歧。
研究发现,集成模型通常在单独使用时优于统计和机器学习方法。例如,当涉及超过100个预测变量的模型时,堆叠特别有效,因为它允许结合不同模型的优点,同时最小化其缺点。
“我们的研究结果表明,将机器学习整合到传统的统计方法中可以为疾病风险预测提供更准确和更具通用性的模型,”首席研究员冯.sun教授说。注意:人名“Feng Sun”可能是个中文名字的拼音,翻译时保持原样或按实际情况处理名称部分。如果需要指定真实姓名,需额外信息确认。
这种方法有可能增强临床决策并改善患者预后。
展望未来,研究团队计划进一步验证和改进现有的集成方法,并开发全面的工具来评估这些模型在各种临床环境中的表现。最终目标是建立更高效、更具通用性的集成模型,以适应不同的场景,从而推动临床诊断和筛查实践的进步。
作者:迈旺
源:健康数据科学
联系人:梅旺 – 健康数据科学
图片:图片 courtesy of Neuroscience News
原创研究:开放访问。
“将机器学习集成到疾病风险预测模型的统计方法中的系统回顾冯_sun等人的作品健康数据科学
摘要
将机器学习集成到疾病风险预测模型的统计方法中:系统回顾
背景:疾病预测模型通常使用统计方法或机器学习,两者各有对应的适用场景,在单独使用时会增加错误的风险。将机器学习整合到统计方法中可能会产生稳健的预测模型。这项系统综述旨在全面评估全球疾病预测集成模型的当前发展情况。
方法:检索了PubMed、EMbase、Web of Science、CNKI、VIP、万方和Sinomed数据库,收集了从数据库建立到2023年5月1日将机器学习集成到统计方法中的预测模型的研究。提取了包括研究的基本特征、整合方法、应用场景、建模细节和模型性能在内的信息。
结果:共有20项符合条件的英文研究和1项中文研究被纳入。五项研究集中在诊断模型上,而十六项研究集中在预测疾病发生或预后上。分类模型整合策略包括多数投票、加权投票、堆叠以及模型选择(当统计方法与机器学习存在分歧时)。
回归模型采用的策略包括简单统计、加权统计和堆叠。集成模型的AUROC超过0.75,在大多数研究中表现优于统计方法和机器学习。当预测因子数量大于100时,使用堆叠,并且需要相对较多的训练数据。
结论:关于将机器学习整合到预测模型中统计方法的研究仍有限,但一些研究表明了集成模型优于单一模型的巨大潜力。本研究为不同场景下选择集成方法提供了见解。未来的研究可以侧重于改进和验证集成策略。