机器学习应用程序在人口层面解决非传染性疾病方面的偏差：范围界定审查

开放获取
发表：
2024 年 12 月 28 日罗克珊娜·拉贝特

1^,史蒂夫·杜兰特
1^,阿图什·帕特尔
1^,蒂娜·沃索吉
1^,马赫·谢尔吉尔
1^{,2,克里斯蒂·科斯坦尼安}1,
卡罗琳·齐格勒²⁵,
谢赫扎德·阿里⁶,
26^{,27,大卫·巴克里奇7,马尔兹耶·加塞米}8,
詹妮弗·吉布森⁹,
艾娃·约翰·巴蒂斯特¹⁰,
吉莉安·麦克林¹,
11^,梅丽莎·麦克拉登
5^,12,13,
夸梅·麦肯齐^{14,15,沙米斯塔·米什拉}16,
17 号^{,18,19 号},
20^{,帕里莎·纳莱伊21,阿夸西·奥乌苏-本帕22 号,劳拉·罗塞拉5,23},
28^,29,
詹姆斯·肖²⁴,
罗斯·厄普舒尔^{4,5,9&��}安德鲁·D·平托
1^,3,
4^{,5一个 BMC 公共卫生体积}24
，商品编号：
3599^{(2024年）引用这篇文章抽象的背景机器学习 (ML) 越来越多地应用于人口和公共卫生领域，以支持流行病学研究、监测和评估。}我们的目标是进行范围界定审查，以确定在人口健康中使用机器学习的研究，重点是其在非传染性疾病 (NCD) 中的使用。

我们还检查模型设计、训练和实现中潜在的算法偏差，以及减轻这些偏差的努力。 方法我们使用 Medline、Embase、Cochrane 对照试验中央注册库和 Cochrane 系统评价数据库、CINAHL、Scopus、ACM 数字图书馆、Inspec、Web of Science 科学引文索引、社会科学引文检索了同行评审的索引文献索引和新兴来源引文索引，截至 2022 年 3 月。结果检索确定了 27 310 项研究，其中 65 项被纳入。研究目标分为算法比较（n�=�13, 20%) 或人口健康相关输出的疾病模型 (

n

≤=≤52, 80%）。

我们提取了有关非传染性疾病类型、数据来源、技术方法、可能的算法偏差和管辖权的数据。

2 型糖尿病是研究最多的非传染性疾病。

机器学习最常见的用途是风险建模。

减轻偏见并未得到广泛解决，大多数方法都侧重于减轻与性别相关的偏见。

结论本综述探讨了机器学习在非传染性疾病中的当前应用，强调了潜在的偏见和缓解策略。未来的研究应重点关注传染病和机器学习模型在低收入和中等收入环境中的可移植性。我们的研究结果可以指导制定公平使用机器学习的指南，以改善人口健康结果。同行评审报告

背景

非传染性疾病（NCD）包括心血管疾病、糖尿病、癌症和慢性呼吸道疾病，是全球疾病负担和死亡的主要原因，低收入和中等收入国家的死亡率特别高。

国家（中低收入国家）[

1

,2]。加强筛查和检测的人群层面方法对于识别非传染性疾病高危人群并为早期干预措施提供信息至关重要[1]。简化这些干预措施并减轻非传染性疾病对全球人口造成的负担的一个潜在途径是通过人工智能 (AI) [3]。全球对人工智能，特别是机器学习（ML）的兴趣日益浓厚，源于大型数据集的可用性和不断增长的计算能力[4]。

凭借无需显式编程即可从经验中学习和适应的能力，机器学习已在各个领域变得至关重要，例如医疗保健 [5]。然而，除了其巨大的潜力之外，机器学习的广泛采用也存在一些重大问题，特别是算法偏差的可能性。算法偏差在人工智能和卫生系统的背景下，“不平等”被定义为：“算法的应用加剧了社会经济地位、种族、民族背景、宗教、性别、残疾或性取向方面现有的不平等，从而放大了这些不平等并对不平等产生了不利影响。”在卫生系统中… [6]。这些植根于历史和系统性不平等的偏见持续影响着边缘化群体，从而强化了偏见。边缘化群体是指经历社会、经济或政治不利和歧视的个人或社区，他们在获得医疗服务和结果方面往往首当其冲地受到这些扩大的不平等的影响。7]。在这种情况下强化偏见意味着预测模型在接受有偏见的数据训练或做出与历史差异相一致的决策时，会无意中放大这些不平等，导致社会经济、种族、性别和民族方面的医疗保健获取、诊断和治疗方面的更大差异行[8,9,10,11]。

这种算法偏差在不同类型的机器学习中表现得不同。例如，在使用标记数据集对数据进行分类或预测结果的监督学习中，偏差可能通过不完整的训练数据或不具有代表性的数据进入模型，并导致对不同人群的预测不准确。在无监督学习中，偏见可以采取社会偏见的形式，其中包括一系列植根于种族、性别和社会经济地位等社会因素的偏见态度。这些偏见可能在对未标记数据进行算法分析时无意中出现，可能导致不公平或歧视性结果，凸显了解决这些偏见以促进公平的机器学习实践的重要性[12,13,14]。

最近，机器学习在改善临床护理方面得到了认可，但对其在人口和公共卫生方面的应用以及模型设计和开发过程中可能出现偏差的关注却较少。我们的目标是进行范围界定审查，以 (1) 确定在人口和公共卫生背景下利用机器学习来解决非传染性疾病的研究，以及 (2) 评估在设计、培训、评估过程中可能表现出的任何算法偏差报告。机器学习模型的实现，以及模型开发人员如何减轻这些偏差。检查机器学习在非传染性疾病监测中的作用，可以为更有效的非传染性疾病管理和资源分配提供信息，同时还解决算法偏差检测问题，以减轻非传染性疾病研究中边缘化的结构性和系统性原因。12,13,14]。

方法

本次范围界定审查遵循系统评价的首选报告项目和范围界定审查的荟萃分析扩展 (PRISMA-ScR) 声明[15]。本次审查的协议已提交给开放科学框架（可从 osf.io/vkf24/ 获取）[16]。

数据库

由于我们感兴趣的领域具有多学科性质，我们考虑了涵盖机器学习和非传染性疾病的许多信息来源。我们使用以下数据库检索了同行评审的索引文献：医学界（奥维德）,大使馆（奥维德）,Cochrane 对照试验中央注册库和 Cochrane 系统评价数据库 (Ovid),CINAHL（EBSCO 主机）,斯科普斯,ACM数字图书馆,Inspec（爱思唯尔）,和 Web of Science 的科学引文索引,社会科学引文索引,和新兴来源引文索引。所有语言都包含在搜索中。评论、信件、社论、会议记录被排除在外。数据库检索时间为2000年至2022年3月4日至7日（含）。选择发布日期范围是为了识别使用最新计算方法和数据的机器学习模型。

搜索策略

多伦多 Unity Health 图书馆服务部的健康信息专家 (CZ) 使用针对每个数据库进行调整的主题标题和关键词组合进行了全面搜索，以了解 AI 和 ML 的广泛概念（例如人工神经网络、决策树），支持向量机）使用布尔运算符 AND 与以下五种非传染性疾病相结合：肺癌、气管癌和支气管癌、缺血性心脏病、2 型糖尿病、慢性阻塞性肺病、阿尔茨海默病疾病和其他痴呆症。特别选择肺癌、气管癌和支气管癌，因为它们代表着重大的公共卫生负担，且可预防性高，使它们成为探索机器学习应用的优先领域。我们将上述非传染性疾病 (NCD) 确定为 NCD 联盟指定的五个主要疾病群的一部分，这五个主要疾病群代表了 NCDs 造成的发病率和死亡率的最大负担：癌症、心血管疾病、糖尿病、慢性呼吸道疾病和神经系统疾病[17 号]。在进行重复数据删除之前，搜索产生了 48,701 个结果。在 EndNote 中去重后，剩余 27 310 篇参考文献。运行时的所有搜索策略均可在附加文件 1 中找到，并且也已公开发布在开放科学框架上 [18]。

资格标准

所有研究在标题/摘要和全文筛选时都必须符合以下有关研究重点的资格标准：（1）与人口层面的健康和/或公共卫生方法相关；(2) 至少患有下列疾病之一：肺癌、气管癌、支气管癌、缺血性心脏病、2型糖尿病、慢性阻塞性肺病、阿尔茨海默病和其他痴呆症；(3) 描述使用至少一种机器学习模型来解决现实世界的人口或公共卫生挑战。所审查的研究没有语言限制。所有研究设计都包括在内。

如果出现以下情况，研究将被排除：（1）它们与人口层面的健康和/或公共卫生方法无关（即研究重点关注机器学习的个人层面的临床应用）；(2) 重点不是纳入标准中提到的任何病症或关注并发症和与病症本身相关的病症的研究；(3) 未使用真实世界数据；(4) 评论、信件、社论、会议记录和论文（表 1）。表1 研究文章的纳入和排除标准

筛选流程

DistillerSR 用于管理引用。

我们培训研究助理审查引文并测试 50 个随机选择的引文的标准。使用随机选择的 50 次引用的块重复训练，直到满足评估者间的可靠性 (kappa->-0.9)。审稿人通过两个阶段的过程筛选研究：标题/摘要阶段（称为一级筛选）和全文阶段（称为二级筛选）。审稿人利用资格标准来评估和确定研究的纳入/排除，然后将其记录在 DistillerSR 中。

在一级筛选过程中，两名独立评审员筛选了所有导入研究的标题和摘要，以选择研究进行最终评审。如果完全符合资格标准，则研究被纳入。不符合审稿人同意的至少一项纳入标准的研究被排除。有关某些研究资格的冲突通过审稿人之间的讨论和共识得到解决。如果无法达成共识，则由研究员 (CC) 决定纳入/排除。二级筛选涉及审查所有通过标题和摘要筛选的研究的全文。该过程由唯一审稿人 (SB) 执行，他排除了任何不符合第一阶段相同纳入标准的研究。

数据采集处理与综合

四位独立评审员提取数据（AP、RR、SB、TV）。根据JBI证据合成手册开发了Excel数据提取表格[19 号]。两位评审员（SB、RR）在十项随机选择的研究中对该表格进行了初步测试。四名研究小组成员独立提取所有纳入研究的数据；然后，数据提取由一名研究小组成员 (SB) 进行审查。

提取了以下数据：作者、标题、期刊、年份、ML 应用类型、ML 的预期目的、研究设计、干预（如果适用）、结果、管辖权、数据源、单位分析、样本量、人口统计数据、机器学习模型中任何潜在算法偏差的识别（与性别、种族、社会经济地位相关的偏差）、中低收入国家可转移性、偏差缓解策略、针对的非传染性疾病、目标人群和环境、目标用户，以及报告的影响作者。我们还注意到文章中是否无法提供信息，或者是否讨论了任何其他算法偏差来源（例如与年龄相关的偏差）。对提取类别进行叙事综合。这些研究被总结成一个表格，概述了机器学习应用、机器学习应用目标、司法管辖区、数据源、研究的非传染性疾病、偏见的考虑因素及其缓解措施（表 2）。叙事综合与研究特征综合（表 3）呈现在结果部分。

表 2 使用机器学习解决非传染性疾病相关人口和公共卫生挑战的研究摘要（2000 年至今）

表3 纳入研究的特点

结果

学习选择

我们的初步搜索产生了 27,310 次引用。经过标题/摘要筛选后，剩下 275 篇摘要。经过SB的全文筛选，65篇文章符合资格标准并纳入最终评审（图1） 1）。图1

表

2总结了从每项纳入的研究中提取的数据。大多数研究（n‐=‐59, 90.77%) 于 2017 年至 2023 年期间发表；五项研究（n‐=‐5, 7.69%) 于 2011 年至 2016 年期间发表；和一项研究（n≤=≤1, 1.54%）发表于2005年至2010年间（图1） 2）。图2

3综合了所纳入研究的特征以及以下每个子类别的报告频率。申请目的

研究可以分为比较 ML 模型/方法（n

≤=≤13, 20.00%) [33,34,37,38,42,43,44,52,54,59,65,77,82] 或使用疾病模型来获得人口健康相关的输出（n≤=≤52, 80.00%) [20,21,22 号,23,24,25,26,27,28,29,30,31,32,35,36,39,40,41,45,46,47,48,49,50,51,53,55,56,57,58,60,61,62,63,64,66,67,68,69,70,71,72,73,74,75,76,78,79,80,81,83,84]。非传染性疾病的建模包括测量人群中的发病率（n≤=≤18, 34.62%) [24,25,28,36,39,40,47,53,60,61,62,63,68,69,70,79,81,83]，测量人群中的风险（n≤=≤32, 61.54%) [20,21,22 号,23,26,27,30,31,32,35,41,45,46,48,49,50,51,55,57,58,64,66,67,71,72,73,74,75,76,78,80,84] 并评估干预对研究作者定义的结果的有效性（n≤=≤2, 3.85%) [29,56]。数据来源研究使用的数据来源包括纵向调查数据（

n

≤=≤27, 41.54%) [20,27,28,29,30,31,33,34,38,39,40,41,43,44,45,49,51,54,55,57,63,64,71,74,75,78,82]，生物医学数据库（n≤=≤9, 13.85%) [21,24,26,36,50,53,56,59,80]、电子病历（n≤=≤16, 24.62%) [22 号,25,32,35,37,52,58,62,65,66,70,73,77,81,83,84]，社交媒体文本元素（n≤=≤1, 1.54%) [23]、行政索赔（n≤=≤8, 12.31%) [47,48,60,61,67,69,72,79,82]，实验室数据（n≤=≤1, 1.54%) [42]，蜂窝数据（n≤=≤1, 1.54%) [76]，搜索引擎查询（n≤=≤1, 1.54%) [68]，以及可穿戴传感器（n≤=≤1, 1.54%) [46]。非传染性疾病目标几乎 50%（n≤=≤32, 49.23%) [27,32,

33

,34,35,37,39,43,46,47,50,52,55,56,58,59,61,62,64,66,67,69,71,72,74,76,77,78,80,82,83,84] 纳入的研究集中于 2 型糖尿病。近四分之一的人检查了阿尔茨海默病和其他痴呆症（n≤=≤14, 21.54%) [25,28,29,30,31,36,40,41,44,48,53,60,63,75]。大约 30% 的纳入研究集中于心血管和呼吸系统疾病（n≤=≤19, 29.23%) [20,21,22 号,23,24,26,38,42,45,49,51,54,57,65,68,70,73,79,81]，特别是缺血性心脏病（n≤=≤10, 52.63%) [21,23,26,38,45,54,57,65,70,73]，慢性阻塞性肺疾病（n≤=≤4, 21.05%) [24,51,68,81]，以及肺癌、气管癌和支气管癌（n≤=≤5, 26.32%) [20,22 号,42,49,79]。技术途径研究的应用程序中最常用的方法是监督学习，旨在解决涉及分类和/或回归的问题或完成任务。该范式包括涉及决策树、集成（依次包括装袋、提升和随机森林构造）等构造、k 最近邻等算法以及人工神经网络和朴素贝叶斯网络等系统的方法。就具体技术而言，研究中使用的一些算法和结构是支持向量机（n≤=≤21, 32.31%) [21,

23

,28,33,35,36,42,44,48,52,59,62,63,65,72,73,74,75,76,77,78]，多层感知器（n≤=≤6, 9.23%) [35,44,48,54,59,77]，随机森林（n≤=≤27, 41.54%) [21,25,27,29,31,32,34,35,36,40,42,44,47,48,52,53,58,68,70,72,74,75,76,77,78,82,83]。某些研究中同时使用了多种机器学习方法。偏见的考虑及其缓解尽管所有评论的文章都建议在特定的非传染性疾病环境中应用他们的机器学习模型，但只有不到三分之一（n≤=≤16, 24.62%) [21

,

26,27,39,49,51,53,58,59,64,66,72,77,78,79,82] 解决了其 ML 模型的实现可能出现的算法偏差的可能性。在那些提到潜在偏差的研究中，只有 7 项（16 项中有 7 项，占 43.75%）[26,27,39,51,59,64,78] 概述了为减少偏见而采取的实际步骤。在大多数情况下，这些方法涉及减轻与性别相关的偏见和影响模型设计。代表国家和其他区域部门抽取样本的地区包括澳大利亚（n≤=≤5, 7.69%) [22 号,

28

,57,72,82]，孟加拉国（n≤=≤1, 1.54%) [35]，加拿大（n≤=≤3, 4.62%) [20,66,81]，中国（n≤=≤10, 15.38%) [40,50,51,70,73,74,75,77,78,84], 芬兰 (n≤=≤1, 1.54%) [63]，法国（n≤=≤1, 1.54%) [39]，德国（n≤=≤1, 1.54%) [25]，匈牙利（n≤=≤1, 1.54%) [64]，印度（n≤=≤4, 6.15%) [27,56,62,65]，伊朗（n≤=≤3, 4.62%) [32,33,37]，日本（n≤=≤1, 1.54%) [58]，新西兰（n≤=≤1, 1.54%) [26]，沙特阿拉伯（n≤=≤1, 1.54%) [71]、韩国（n≤=≤8, 12.31) [29,43,44,45,48,49,55,60]，西班牙（n≤=≤1, 1.54%) [53]，瑞典（n≤=≤1, 1.54%) [30]，台湾（n≤=≤2, 3.08%) [69,79]、英国（n≤=≤7, 10.77%) [21,31,34,36,46,59,80]，以及美国（n≤=≤13, 20.00%) [23,24,38,41,42,47,52,54,61,67,68,76,83]。大多数研究使用的数据集取自世界银行定义的高收入经济体地区（即 2023 年，人均国民总收入 (GNI) 为 13 205 美元或以上的经济体）（n= 15/19 个国家/地区；78.95%) [85]。其余的来自中低收入国家（即人均国民总收入为 1 086 美元至 4 255 美元的国家）85

]，这里特指孟加拉国、印度和伊朗）或中高收入国家（即人均 GNI 为 4 256 美元至 13 204 美元的人，这里为中国）[85]。讨论概括总之，我们确定了自 2005 年以来发表的 65 项同行评审研究，这些研究应用机器学习方法从人口健康角度评估非传染性疾病。27 310 篇参考文献中只有 65 篇符合我们研究的条件，这说明缺乏对 ML 在人口和公共卫生领域的应用（特别是非传染性疾病方面）进行评论的研究。最初的大参考收益可能是由于机器学习的新颖性，以及在 COVID-19 爆发后，人们对人口和公共卫生的兴趣日益浓厚。尽管文献充分讨论了数据源的类型，但要真正解决健康公平问题，还需要做更多的工作来解决机器学习中的算法偏差，这给研究人员留下了探索的空白。

研究选择和方法学考虑

我们采用了严格的选择流程来确定哪些研究将包含在我们的分析中。

这个过程涉及应用特定的标准，最终导致某些研究被排除。

表中全面概述了排除这些研究背后的原因

1。尽管最初符合我们的纳入标准，但一些研究后来因各种原因被排除在考虑之外。首先，一些研究样本的获取方式不能代表更广泛的人群。例如，穆罗等人的一项研究。(2021) 旨在利用来自许多同一个人 21 年来的年度体检信息的数据来识别慢性阻塞性肺病 (COPD) 诊断的预测因素，这些人都是日立有限公司的员工。86]，这可能会系统地影响数据收集的某些方面。其次，经过全文检查，其他研究的目标与我们在初步筛选中确定的目标不同。例如，一项题为“预测美国肺癌：公共卫生因素的多重模型检查”的研究最初似乎是为了模拟疾病发病率并明确风险因素，但最终关注的是哪些排放的化合物最有害，以及如何危害健康。旨在将美国从不可再生能源转变为可再生能源的举措可以改善人口健康[42]。由于这项研究最终并未概述参与者的数据（即没有提及样本量），因此它不符合我们的纳入标准。

非传染性疾病研究和公共卫生干预措施的未来方向

本次评价评估的疾病代表了非传染性疾病造成的全球死亡负担，重点关注糖尿病、缺血性心脏病、癌症和慢性呼吸道疾病。87]。研究重点分布也表明了各自疾病类别的负担。例如，49.23% 的研究集中在 T2D。糖尿病死亡率的增长速度高于其他非传染性疾病[88]。2000 年至 2019 年间，全球 30 至 70 岁人群的非传染性疾病年龄标准化死亡率总体下降了 22%，而同一群体的糖尿病年龄标准化死亡率在全球范围内增加了 3%。88]。与此同时，中低收入国家的 T2D 死亡率显着增加了 13% [88]。疾病负担与中低收入国家尤其相关，这些国家的传染病负担已经很重。然而，这并没有反映在本次审查中检查的机器学习应用程序中。与 48.48% 的研究主要关注 2 型糖尿病 (T2D) 相比，只有一小部分研究（约 16%）涉及心血管疾病 (CVD)。尽管 CVD 减少的同时，T2D 死亡率在增加，但 T2D 仍然直接导致死亡人数减少：大约 200 万人死于 CVD，而 CVD 死亡人数为 1,790 万人[87]。因此，考虑到可归类为 CVD 的广泛疾病，以 CVD 为中心的机器学习在健康领域的应用可能有助于优先考虑。89]。

机器学习方法的进步

从技术角度来看，监督学习是我们搜索中发现的最流行的算法。一些研究中也采用了无监督学习，例如 Lam 等人的研究。(2021) [46]。这些方法可以揭示数据模式并识别亚群，这使得它们对于探索性分析特别有用。具体来说，Lam 等人。证明了连续或定期自我监测对于早期发现和筛查有 T2D 风险的亚群（尤其是处于糖尿病前期状态的亚群）的疾病进展的潜力。46]。Kim 等人使用了主成分分析 (PCA)，这是一种流行的降维技术。(2021) [44] 使用包含有限输入变量的数据不仅可以预测未来的痴呆症患者，还可以预测其他类型的疾病，这使得它在资源有限的地方很有用。研究结果表明，即使输入变量有限，PCA 也可以作为预测未来痴呆症和其他疾病病例的经济有效的工具。44]。Alexander 等人使用了自然语言处理 (NLP) 和文本挖掘技术。（2020），郑等人。（2016）和 Baechle 等人。（2017）从电子健康记录中提取信息以识别疾病模式和风险因素[22 号,24,83]。这些研究的结果证明了自然语言处理和文本挖掘技术在从大规模电子健康记录中提取人口健康数据方面的潜力，这可能有助于制定更有针对性的公共卫生干预措施。

风险建模是机器学习最流行的应用。拉沃等人。（2021）和Barbieri 等人。(2022) 在人口层面建立了一个机器学习模型，可以使用最多提前 5 年的管理健康数据准确预测 T2D 和 CVD 的发病情况[26,66]。研究表明，使用机器学习和管理健康数据可以创建有效的人口健康规划工具，以区分糖尿病的高风险和低风险人群。这可以帮助引导投资和干预措施预防非传染性疾病，也可以帮助减轻个人层面的并发症。

机器学习应用程序可转移到资源有限的环境

高收入国家和中低收入国家之间机器学习应用频率存在显着差异。被世界银行归类为“低收入”的人群未包括在本次审查所考虑的研究中。机器学习模型在缺乏可靠健康记录的司法管辖区的应用可能会受到限制，因为这些方法依赖于大规模数据集来学习模式并做出预测。90]。然而，由美国研究人员领导的一项研究探索了在资源有限的环境中使用多种机器学习技术作为糖尿病前期筛查的低成本替代方案。27]。作者使用来自印度海得拉巴农村地区的个人完成的 FFQ 的调查数据来计算每个参与者的全球饮食质量评分 (GDQS) 并预测他们患 T2D 的风险。GDQS 与 ML 技术相结合的全球适用性成为一种低成本、易于使用的方法，用于识别糖尿病高风险人群，无需使用基于实验室的测试来筛查所有个体。27]。一个有前途的数据源的例子是社交媒体文本元素，例如 Facebook 帖子，可帮助预测非传染性疾病的风险。在 Andy 等人的一项研究中，将社交媒体帖子预测 CVD 10 年风险的辨别能力与汇总队列风险方程进行了比较。23]。研究结果提出了利用新兴数字数据源通过分析多个时间点记录的信息来识别潜在风险因素的新颖前景。23]。访问来自同意的个人在社交媒体平台上快速生成的数据（例如帖子）提供了收集和分析可能与标准调查评估不同的即兴信息的机会。

数据的地理代表性和普遍性

在国家内部，不同地区的代表性不足。例如，一项研究收集了一组不同的人口变量（即参与者的饮食和文化参与水平）[74]但其对更广泛的中国人口的普遍性有限，因为它只关注从山西地区收集的数据。同样，另一项以中国样本为中心的研究也集中在南京。虽然关注区域样本可以深入了解中国特定亚人群的健康状况，但它也凸显了其他亚人群数据的不足。这可能是因为人口健康数据和公共卫生举措似乎是由省级管理的。

这种趋势似乎适用于几个国家。其他研究集中在东阿塞拜疆等地区[37] 和伊朗马什哈德 [33]，以及印度泰米尔纳德邦的八个城市[65]。一项研究旨在预测韩国首尔尚未被诊断患有 MND 的老年人参与认知健康促进计划的情况。这项研究的重点是将参与意愿与各种人口因素（如教育水平、吸烟状况和同居状况）联系起来。29]。作者认识到认知健康复杂的生物心理社会性质，并采用了一种均衡城市一级代表性的方法，例如对首尔所有 25 个地区进行分层聚类抽样。29]。由于韩国大部分人口居住在城市地区[91]，对整个人群的普遍性可能不那么重要。

解决机器学习中的算法偏差

关于算法偏差，总体上缺乏关于识别、定义和减轻人口健康环境中偏差的讨论。陈等人。(2021) 探讨了机器学习可能会加剧现有的健康差距，特别是在模型开发过程中，这是一个需要更多关注的问题[92]。该文章强调了ML模型中健康数据的重要性，并指出了如何偏向收集的数据，其中大部分数据集倾向于特定的生物学性别或性别认同，例如[92]。在这种情况下，由于基线表示不平衡，该模型无法初始化[92]。Barbieri等人的研究。试图通过开发性别特异性ML模型来减轻与性别相关的偏见检测CVD，强调改进的校准和歧视，从而实现5年风险预测[26]。然而，它还强调需要在拥有较大行政健康数据集的国家进一步探索这些模型[26]。但是，即使使用较大的数据集，算法偏差仍然存在[92]。人们受到社会和经济政策的影响，包括跨性别者和性别不合格的个人，无证移民和种族化的人群通常不足以代表性，歪曲或从收集的健康数据中失踪[92]。在其国有健康数据库中未记录种族和种族的加拿大和法国等国家收集的人口数据，使基于种族的差异极为难以探索[92]。最终，代表性数据收集对于确保数据集反映公共人群很重要[92]。此外，如果ML被认为能够彻底改变全球医疗保健系统[92,93]。

优点和局限性

这篇综述是在研究如何通过一系列应用程序（例如预测，监视和评估干预措施的有效性）应用于人群和公共卫生的新综述。值得注意的是，我们确定了潜在的算法偏见和缓解策略。这篇评论有几个局限性。首先，没有进行灰色文献搜索，因此可能引入了选择偏见。接下来，我们没有在全文筛选阶段进行重复的筛选来遵守项目时间表和资源。同样，尽管数据提取是由主要作者审查的，但并未重复进行。这种方法可能会引入偏见的潜力，特别是在需要主观判断的领域，例如解释纳入标准并确定研究中讨论了哪些偏见以及如何减轻它们。尽管我们的评论者（SB）在主题领域拥有丰富的经验，但缺乏重复筛查可能会影响我们的发现的可靠性。此外，尽管我们没有对语言施加任何限制，但通过Google Translate翻译了非英语文章，该文章容易受到某种错误的影响。最后，术语人口健康和机器学习不是普遍定义的。尽管我们试图将机器学习的子类型纳入我们的搜索策略中，但我们可能排除了可能与该领域相关的文章。同样，对NCD-NCD相互作用的复杂性的越来越多，更广泛地说，关键字描述的更细微的方面将表征未来的工作。这包括结构不利的社区使用的首选术语，以描述其经验以及用于讨论ML以外的其他语言中ML应用的术语惯例。最后，这篇评论承认仅关注肺，气管和支气管癌的局限性。尽管这允许在此特定范围内进行深入分析，但必须将未来的研究纳入更广泛的癌症类型，以便对肿瘤学中的ML应用有更全面的了解。

结论

这篇综述概述了当前的ML应用程序以及偏见和缓解偏见策略的潜力。这是第一个侧重于研究NCD的应用程序的范围审查。此类ML模型的LMIC可传递性并没有太多讨论，为研究人员提供了研究数据透明度方法的差距，例如制作代码和协议开源。随着ML领域的不断发展，将有足够的机会利用技术来改善人口健康（例如，识别高风险亚组）；我们希望我们的结果将有助于指导未来的研究，例如制定公平使用机器学习的准则。

数据可用性

当前研究期间使用和/或分析的数据集可根据合理要求从相应作者处获得。

参考

世界卫生组织。非传染性疾病。世界卫生组织;2022. https://www.who.int/news-room/fact-sheets/detail/noncommunicable-diseases。Boutayeb A，BoutayebS。发展中国家非传染病的负担。
国际股权健康。2005; 4（1）：2。
文章一个考研一个考研中心一个谷歌学术一个
人工智能和数据技术提供了更明智的医疗保健 - 4种解决方案，这对非传染性疾病产生了影响。可从：https://www.who.int/europe/news/news/14-12-2021-Artelligence-anderligence-and-Data-data-tata-technology-provide-smarter-smarter-health-health-health-health-health-solutions-that-have-tat-have-made-tat-have-made-made-made-made-made-made-made-made-made-made-made-made-made-tata-差异 - 非通信性脱孔。引用2023年10月4日。
Thrall JH，Li X，Li Q，Cruz C，Do S，Dreyer K等。放射学中的人工智能和机器学习：成功，挑战，陷阱和成功标准。J Am Coll Radiol。2018; 15（3）：504 - 8。
文章一个考研一个谷歌学术一个
Berente N，Bin Gu，Recker J，Santhanam R.管理人工智能。管理Inform Syst Q. 2021; 45（3）：1433 50。
谷歌学术一个
Panch T，Mattie H，Atun R.人工智能和算法偏见：对卫生系统的影响。全球健康杂志。2019; 9（2）。可从：https://doi.org/10.7189/jogh.09.020318。引用2023年4月25日。
Sevelius JM，Luis G-M， - ，Zamudio-Haas S，McCree B，Ngo A，Jackson A等。与边缘化社区进行现场研究的注释：在19日大流行期间对连续性的挑战。艾滋病行为。2020; 24：2009 12。https://doi.org/10.1007/s10461-020-02920-3。引用2023年9月19日。
文章一个考研一个考研中心一个谷歌学术一个
巴克里奇DL。精度，公平以及公共卫生和流行病学信息学 - 范围审查。年度医学博士。2020; 29（1）：226 30。
文章一个谷歌学术一个
Chen IY，Szolovits P，Ghassemi M. AI可以帮助减少一般医疗和精神保健中的差异吗？AMA J 道德规范。2019; 21（2）：167 - 79。
文章一个谷歌学术一个
Ghassemi M，Naumann T，Schulam P，Beam AL，Chen IY，RanganathR。关于医疗保健数据的人工智能实践指南。柳叶刀数字健康。2019; 1（4）：E157-9。
文章一个考研一个谷歌学术一个
Topol EJ。高性能医学：人工智能的融合。纳特医学。2019; 25（1）：44 -56。可从：https://pubmed.ncbi.nlm.nih.gov/30617339/。引用2023年8月29日。
文章一个中科院一个考研一个谷歌学术一个
Rajkomar A、Dean J、Kohane I。医学中的机器学习。N 英格兰医学杂志。2019; 380（14）：1347年58。
文章一个考研一个谷歌学术一个
Gianfrancesco MA，Tamang S，Yazdany J，Schmajuk G.使用电子健康记录数据的机器学习算法中的潜在偏见。JAMA 实习医生。2018; 178（11）：1544â7。可从：https://pubmed.ncbi.nlm.nih.gov/30128552/。引用2023年8月29日。
文章一个考研一个考研中心一个谷歌学术一个
本杰明·R。评估风险，自动化种族主义。科学。1979; 366（6464）：421 2.可用来源：https://www.science.org/doi/10.1126/science.aaz3873。引用2023年8月29日。
文章一个谷歌学术一个
Tricco AC，Lillie E，Zarin W，OâBrienKK，Colquhoun H，Levac D等。用于范围界定审查的 PRISMA 扩展 (PRISMA-ScR)：清单和解释。安实习医生。2018; 169（7）：467 73.可从：https://annals.org。引用2023年4月17日。
文章一个考研一个谷歌学术一个
OSF。可从：https://osf.io/。引用2023年9月19日。
弥合NCD的差距：从全球承诺到本地进步 - 讨论文件|NCD联盟。可从：https://ncdalliance.org/resources/bridging-the-the-ph--gap-on-ncds-from-global-promises-to-local-progress-policy-policy-brief。引用2023年9月26日。
Ziegler，Carolyn P.文献搜索策略：机器学习应用程序，以解决人群级别的非传染性疾病：范围：开放科学框架（OSF）；2023。OSF.IO/J7P9H。
Aromatris E，Lockwood C，Porritt K，Pilla B，Jordan Z，编辑。JBI手册用于证据综合。jbi;2024。可从：https://synthesismanual.jbi.global。https://doi.org/10.46658/jbimes-24-01Adams SJ，Mondal P，Penz E，Tyan CC，Lim H，BabynP。结合了基线肺癌筛查的肺结核管理策略的开发和成本分析。
J Am Coll Radiol。2021; 18（5）：741 51。
文章一个考研一个谷歌学术一个
Alaa AM，Bolton T，Di Angelantonio E，Rudd JH，Van der Schaar M.使用自动机器学习的心血管疾病风险预测：423,604名英国生物库参与者的前瞻性研究。公共科学图书馆一号。2019; 14（5）：E0213653。
文章一个中科院一个考研一个考研中心一个谷歌学术一个
Alexander M，Solomon B，Ball DL，Sheerin M，Dankwa-Mullan I，Preininger AM等。评估澳大利亚肺癌患者中人工智能临床试验匹配系统。Jamia Open。2020; 3（2）：209 15。
文章一个考研一个考研中心一个谷歌学术一个
Andy Au，Guntuku SC，Adusumalli S，Asch DA，Groeneveld PW，Ungar LH等。使用社交媒体数据预测心血管风险：机器学习模型的绩效评估。JMIR有氧运动。2021; 5（1）：E24473。
文章一个考研一个考研中心一个谷歌学术一个
Baechle C，Agarwal A，Zhu X.慢性阻塞性肺部疾病患者的大数据驱动的共发生的证据发现。J大数据。2017; 4（1）：1 - 18。
Balaji C，Suresh DS。多级识别阿尔茨海默氏症和帕金森氏病的疾病，使用深度降低特征（BODRF）的袋子，以及改进的混乱多经文哈里斯·霍克斯（Harris Hawks）优化（CMVHHO）和基于随机森林（RF）的分类。计算方法生物技术生物元件成像。2022 年；11（3）：774 - 85。
Barbieri S，Mehta S，Wu B，Bharat C，Poppe K，Jorm L等。使用共同的生存分析和深度学习方法来预测国家行政数据库的心血管风险。Int J Epidemiol。2022; 51（3）：931 44。
文章一个考研一个谷歌学术一个
Birk N，Matsuzaki M，Fung TT，Li Y，Batis C，Stampfer MJ等。探索机器学习和统计技术在开发低成本筛查方法中，该方法具有全球饮食质量评分，用于检测印度农村的糖尿病前期。J 营养。2021; 151：110S-118S。
文章一个中科院一个考研一个考研中心一个谷歌学术一个
Burnham SC，Faux NG，Wilson W，Laws SM，Ames D，Bedo J等。阿尔茨海默氏病的新皮质Aî²负担的基于血液的预测因子：AIBL研究的结果。摩尔精神病学。2014; 19（4）：519 26。
Byeon H.随机森林模型能否提高社区中老年人参加认知健康促进计划的力量？伊朗公共卫生杂志。2021; 50：315http://ijph.tums.ac.ir。考研
一个考研中心一个谷歌学术一个 Dallora AL，Minku L，Mendes E，Rennemark M，Anderberg P，Berglund JS。多因素的痴呆症的10年前诊断预测模型。
国际环境研究公共卫生杂志。2020; 17（18）：1 - 18。
文章一个谷歌学术一个
Danso So，Zeng Z，Muniz-Terrera G，Ritchie CW。开发一种可解释的基于机器学习的个性化痴呆症风险预测模型：通过集合学习算法的转移学习方法。前沿大数据。2021; 4：613047。
文章一个考研一个考研中心一个谷歌学术一个
Esmaily H，Tayefi M，Doosti H，Ghayour-Mobarhan M，Nezami H，Amirabadizadeh A.决策树与随机森林之间的比较，以确定与2型糖尿病相关的风险因素。J 研究健康科学。2018; 18（2）：E00412。
Esmaeily H，Tayefi M，Ghayour-Mobarhan M，Amirabadizadeh A.比较三种数据挖掘算法，以识别2型糖尿病的相关风险因素。伊朗Biomed J. 2015; 22（5）：303 11。
谷歌学术一个
Fazakis N，Kocsis O，Dritsas E，Alexiou S，Fakotakis N，Moustakas K.长期2型糖尿病的机器学习工具风险预测。IEEE 访问。2021; 9：103737 57。
文章一个谷歌学术一个
Ferdousi R，Hossain MA，El Saddik A.使用机器学习在健康CPS中对非传染性疾病的早期风险预测。IEEE 访问。2021; 9：96823 37。
文章一个谷歌学术一个
福特E，Rooney P，Oliver S，Hoile R，Hurley P，Banerjee S等。在英国初级保健患者中识别未发现的痴呆症：比较机器学习和标准流行病学方法的回顾性病例对照研究。BMC Med Inf Decis Mak。2019; 19（1）：248。
文章一个谷歌学术一个
Gholipour K，Asghari-jafarabadi M，Iezadi S，Jannati A，KeshavarzS。基于人工神经网络和多重回归的糖尿病风险因素的糖尿病患病率。East Mediterr Health J. 2018; 24（8）：770-7。
Goldman O，Raphaeli O，Goldman E，LeshnoM。通过使用人工神经网络来改善冠心病风险的预测。质量管理医疗保健。2021; 30（4）：244 50。
文章一个考研一个谷歌学术一个
Haneef R，Kab S，Hrzic R，Fuentes S，Fosse-Edorh S，Cosson E等。使用人工智能进行公共卫生监视：一种案例研究，用于开发机器学习算法，以估计法国糖尿病的发生率。拱门公共卫生。2021; 79（1）：1。
文章一个谷歌学术一个
Hu M，Shu X，Yu G，Wu X，VoumékiM，Feng H.基于机器学习的风险预测模型，用于具有正常认知的中国社区居民老年人的认知障碍：发展和验证研究。医学互联网研究杂志。2021; 23（2）：E20298。
文章一个考研一个考研中心一个谷歌学术一个
Jia Y，Chang CCH，Hughes TF，Jacobsen E，Wang S，Berman SB等。最古老的新型机器学习方法中痴呆症的预测因素。2020 年。可从：http://links.lww.com/wad/a287。Kamis A，Cao R，He Y，Tian Y，WuC。预测美国的肺癌：对公共卫生因素的多次模型检查。
国际环境研究公共卫生杂志。2021; 18（11）：6127。
文章一个中科院一个考研一个考研中心一个谷歌学术一个
Kim H，Lim DH，Kim Y.对营养摄入量对超重/肥胖，血脂异常，高血压和2型糖尿病的分类和预测，使用深度学习模型：第4次韩国国家健康和营养考试调查。国际环境研究公共卫生杂志。2021; 18（11）：5597。
文章一个中科院一个考研一个考研中心一个谷歌学术一个
Kim J，Lim J.使用大数据预测痴呆症的一种深度神经网络方法。国际环境研究公共卫生杂志。2021; 18（10）：5386。
文章一个考研一个考研中心一个谷歌学术一个
Kim JK，KangS。使用特征相关分析，基于神经网络的冠状动脉心脏病风险预测。J Healthc Eng。2017; 2017：2780501。
文章一个考研一个考研中心一个谷歌学术一个
Lam B，Catt M，Cassidy S，Bacardit J，Darke P，Butterfield S等。使用可穿戴的活动追踪器预测2型糖尿病：基于机器学习的英国生物库加速度计的横断面研究。JMIR糖尿病。2021; 6（1）：E23364。
文章一个考研一个考研中心一个谷歌学术一个
Liao X，Kerr D，Morales J，DuncanI。机器学习在美国成年人中识别心脏代谢风险因素的聚类的应用。糖尿病技术治疗。2019; 21（5）：245 53。
文章一个考研一个谷歌学术一个
Lim SJ，Lee Z，Kwon LN，Chun HW。基于医疗记录的轻度认知障碍（MCI）预测有效痴呆症护理。国际环境研究公共卫生杂志。2021; 18（17）：9223。
文章一个考研一个考研中心一个谷歌学术一个
Lim K，Lee BM，Kang U，Lee Y，Lim K，Lee BM等。优化的基于DBN的冠状动脉疾病风险预测。Int J Comput Commun控制。2018; 13：492。
文章一个谷歌学术一个
Liu Y，Ye S，Xiao X，Sun C，Wang G，Wang G等。用于调整，选择和合奏的机器学习多个风险评分，用于预测2型糖尿病。风险管理健康政策。2019; 12：189 98。
文章一个考研一个考研中心一个谷歌学术一个
Shangguan C，Yu L，Liu G，Song Y，Chen J.使用基于省级调查的贝叶斯网络对慢性阻塞性肺部疾病的风险评估。波尔拱实习医生。2021; 131（4）：345 55。
考研一个谷歌学术一个
Mani S，Chen Y，Elasy T，Clayton W，DennyJ。使用机器学习从EMR数据预测2型糖尿病风险。AMIA 年度症状程序。2012; 2012：606。
考研一个考研中心一个谷歌学术一个
Mar J，Gorostiza A，Arospide A，Larraã±Aga I，Alberdi A，Cernuda C等。通过将机器学习应用于现实世界数据来估计痴呆症和相关神经精神症状的流行病学。牧师psiquiatr salud。2022; 15（3）：167 - 75。
文章一个谷歌学术一个
Masih N，Naz H，Ahuja S.基于多层感知的深神经网络，用于早期发现冠心病。健康技术（Berl）。2021; 11（1）：127 38。
文章一个谷歌学术一个
Moon S，Jang Jy，Kim Y，OH CM。新糖尿病指数的开发和验证，用于当前和新的糖尿病的风险分类：多胡肠研究。SciRep。2021; 11（1）：15748。
文章一个中科院一个考研一个考研中心一个谷歌学术一个
Nayak M，Das S，Bhanja U，Senapati MR。使用基于单纯形方法的社会蜘蛛优化算法对癌症和糖尿病进行预测分析。IETE J Res。2022 年；69（10）：7342 - 56。https://doi.org/10.1080/03772063.2022.2027276。Neumann JT，Thao LTP，Callander E，Chowdhury E，Williamson JD，Nelson MR等。
健康老年人的心血管风险预测。老年科学。2022; 44（1）：403 13。
文章一个中科院一个考研一个谷歌学术一个
Ooka T，Johno H，Nakamoto K，Yoda Y，Yokomichi H，Yamagata Z.确定2型糖尿病风险预测和预测因素的随机森林方法：日本的大规模健康检查数据。BMJ Nutr Prev Health。2021; 4（1）：140â8。
文章一个考研一个考研中心一个谷歌学术一个
Owusu Adjah ES，Montvida O，Agbeve J，Paul SK。从初级保健电子病历中识别疾病队列的数据挖掘方法：糖尿病病例。Open Bioinforma J. 2017; 10（1）：16â27。
文章一个谷歌学术一个
Park JH，Cho He，Kim JH，Wall MM，Stern Y，Lim H等。使用大规模行政健康数据，机器学习预测了阿尔茨海默氏病的发生率。NPJ 数字医学。2020; 3（1）：46。
文章一个考研一个考研中心一个谷歌学术一个
Park J，Edington DW。糖尿病预测的顺序神经网络模型。Artif Intell Med。2001; 23（3）：277 93。
Patil R，Tamane S，Rawandale SA，Patil K.一种改良的Mayfly-SVM方法，用于早期检测2型糖尿病。Int J Electr Comput Eng。2022; 12（1）：524 33。
谷歌学术一个
Pekkala T，A Hall A，Lã¶tjã¶NenJ，Mattila J，Soininen H，Ngandu T等。在基于人群的CAIDE研究中，通过有监督的机器学习的后期痴呆预测指数的开发。阿尔茨海默氏病。2017; 55（3）：1055 - 67。
文章一个谷歌学术一个
Piko P，Werissa NA，Fiatal S，Sandor J，AdanyR。除了传统的危险因素外，遗传因素对2型糖尿病的发病年龄的影响。J Pers Med。2021; 11（1）：1 17。
谷歌学术一个
Priyanga P，Pattankar VV，SrideviS。基于电子健康记录的杂种复发性神经网络混乱的基于心脏病预测的鲸鱼优化框架。计算Intell。2021; 37（1）：315 43。
文章一个谷歌学术一个
Ravaut M，Harish V，Sadeghi H，Leung KK，Volkovs M，Kornas K等。使用行政健康数据来开发和验证机器学习模型，以预测2型糖尿病的发作。JAMA 网络公开赛。2021; 4：E2111315。
文章一个考研一个考研中心一个谷歌学术一个
Razavian N，Blecker S，Schmidt AM，Smith-McLallen A，Nigam S，SontagD。从索赔数据和风险因素分析中对2型糖尿病的人口级预测。大数据。2015; 3（4）：277 87。
文章一个考研一个谷歌学术一个
Rehman NA，计算S.使用搜索查询数据估算邻里水平慢性呼吸道疾病患病率。公共科学图书馆一号。2021; 16（6月6日）：E0252383。
文章一个谷歌学术一个
Su TJ，Lee FC，Pan TS，Wang SM。与2型糖尿病风险因素的混合模糊神经网络分析。国际。J.莫德。物理。B，凝结物理学，统计物理，应用物理学。2021; 35（14N16）：2140035-。
Su X，Xu Y，Tan Z，Wang X，Yang P，Su Y等。基于实验室数据的心血管疾病的预测：随机森林模型的分析。J 临床实验室分析。2020; 34（9）：E23421。
文章一个中科院一个考研一个考研中心一个谷歌学术一个
Syed AH，KhanT。基于机器学习的应用程序，用于预测沙特阿拉伯2型糖尿病（T2DM）的风险：回顾性的横断面研究。IEEE 访问。2020; 8：199539 61。
文章一个谷歌学术一个
Uddin S，Imam T，Hossain ME，Gide E，Sianaki OA，Moni MA等。智能类型2糖尿病风险从管理索赔数据中预测。INF Health Soc护理。2022; 47（3）：243 57。
文章一个谷歌学术一个
Wang C，Zhao Y，Jin B，Gan X，Liang B，Xiang Y等。使用机器学习对冠状动脉疾病的预测模型的开发和验证。前心血管医学。2021; 8：8。
谷歌学术一个
Wang X，Zhai M，Ren Z，Ren H，Li M，Quan D等。通过合并的随机森林分类器对糖尿病分类的探索性研究。BMC Med Inf Decis Mak。2021; 21（1）：105。
文章一个中科院一个谷歌学术一个
Wu Y，Jia M，Xiang C，Lin S，Jiang Z，Fang Y.使用机器学习方法预测长期认知轨迹：中国全国范围的纵向数据库。精神病学研究中心。2022; 310：114434。
文章一个考研一个谷歌学术一个
Xie Z，Nikolayeva O，Luo J，LiD。使用机器学习技术的2型糖尿病的构建风险预测模型。上一篇慢性疾病。2019; 16（9）：E130。
考研一个考研中心一个谷歌学术一个
Xiong XL，Zhang RX，Bi Y，Zhou WH，Yu Y，Zhu dl。2型糖尿病风险预测中的机器学习模型：中国成年人的横断面回顾性研究结果。当前医学科学。2019; 39（4）：582 - 8。
文章一个考研一个谷歌学术一个
Yang T，Zhang L，Yi L，Feng H，Li S，Chen H等。基于2型糖尿病筛查的非侵入性特征的集合学习模型：模型开发和验证。Jmir Med Inf。2020; 8（6）：E15431。
文章一个谷歌学术一个
Yeh MCH，Wang YH，Yang HC，Bai KJ，Wang HH，Li YCJ。人工智能使用非成像电子病历：深度学习方法基于肺癌风险的预测。医学互联网研究杂志。2021; 23：e26256 JMIR Publications Inc.
文章一个考研一个考研中心一个谷歌学术一个
Yun JS，Kim J，Jung SH，Cha SA，Ko SH，Ahn YB等。从视网膜照片中筛查2型糖尿病的深度学习模型。Nutr代谢心脏疾病。2022; 32（5）：1218 26。
文章一个谷歌学术一个
Zafari H，Langlois S，Zulkernine F，Kosowan L，Singer A. AI预测加拿大人口的COPD。生物系统。2022; 211：104585。
文章一个中科院一个考研一个谷歌学术一个
Zhang L，Shang X，Sreedharan S，Yan X，Liu J，Keel S等。使用机器学习技术预测大型澳大利亚队列中2型糖尿病的发展：纵向调查研究。Jmir Med Inf。2020; 8（7）：E16850。
文章一个谷歌学术一个
Zheng L，Wang Y，Hao S，Shin AY，Jin B，Ngo AD等。基于Web的糖尿病患者人口健康管理的实时病例查找：对基于自然语言处理的算法的前瞻性验证，并具有全州范围的电子病历。Jmir Med Inf。2016; 4（4）：E6328。
谷歌学术一个
Liu S，Gao Y，Shen Y，Zhang M，Li J，SunP。应用三个统计模型来预测糖尿病风险。BMC 内分泌失调。2019; 19（1）：126。
文章一个中科院一个考研一个考研中心一个谷歌学术一个
WDI-按收入和地区划分的世界。可从：https://datatopics.worldbank.org/world-development-indicators/the-world-by-income-and-gregion.html。引用2023年4月24日。
Muro S，Ishida M，Horie Y，Takeuchi W，Nakagawa S，Ban H等。用于诊断健康受试者慢性阻塞性肺疾病的机器学习方法：回顾性观察队列研究。Jmir Med Infels 2021; 9（7）：E24796。https://medinform.jmir.org/2021/7/e24796。2021年7月6日； 9（7）：E24796。引用2023年4月18日。
文章一个考研一个考研中心一个谷歌学术一个
世界卫生组织。他独立的非传染性疾病高级委员会：最终报告：是时候进行演讲了。2019 年。可从：https://apps.who.int/iris/handle/10665/330023。引用2023年4月24日。
美洲糖尿病预防和控制的国家快照-Paho/Who |泛美卫生组织。可从：https://www.paho.org/en/node/84821。引用2023年4月24日。
Roth GA，Johnson C，Abajobir A，Abd-Allah F，Abera SF，Abyu G等。1990年至2015年，全球，地区和国家心血管疾病负担。2017; 70（1）：1 25.可从：https://pubmed.ncbi.nlm.nih.gov/28527533/。引用2023年12月10日。
文章一个考研一个考研中心一个谷歌学术一个
Morgenstern JD，Buajitti E，OâNeillM，Piggott T，Goel V，Fridman D等。通过机器学习预测人口健康：范围审查。英国医学杂志公开赛。2020; 10：E037860http://bmjopen.bmj.com/。文章
一个考研一个考研中心一个谷歌学术一个首尔的统计数据|码确实ig或首尔解决方案。
可从：https://www.seoulsolution.kr/en/content/statistis-seoul。引用2023年4月25日。
Chen IY，Pierson E，Rose S，Joshi S，Ferryman K，Ghassemi M.医疗保健中的道德机器学习。Annu Rev BioMed Data Sci。2021; 4（1）：123â44。
文章一个考研一个考研中心一个谷歌学术一个
Goldenberg SL，Nir G，Salcudean SE。一个新时代：前列腺癌中的人工智能和机器学习。纳特·乌罗尔。2019; 16（7）：391 403。
文章一个考研一个谷歌学术一个

下载参考资料

致谢

作者感谢Pruthuvie Chandrahas审查和评估文章的资格。

资金

该项目得到了加拿大卫生研究机构（＃460906）的部分支持。ADP，SA，DB，LR，SM（CRC赠款号950-23264）和JS得到加拿大研究椅的支持。ADP受到家庭与社区医学系，多伦多大学医学系和圣迈克尔医院的临床医生的支持。以及上游预防的CIHR应用公共卫生主席。本文报道的意见，结果和结论是作者的观点，并且独立于任何资金来源。

作者信息

作者和单位

上游实验室，地图城市卫生解决方案中心，李卡·史明知识研究所，统一健康多伦多，多伦多邦德街30号，多伦多，安大略省，M5B 1W8，加拿大
Sharon Birdi，Roxana Rabet，史蒂夫·杜兰特（Steve Durant）
迈克尔·G·德格鲁特医学院，加拿大汉密尔顿麦克马斯特大学
Mahek Shergill
加拿大多伦多的圣迈克尔医院家庭和社区医学系
安德鲁·Pinto
加拿大多伦多多伦多大学医学院家庭和社区医学系
RossUpshurâ＆Andrew D. Pinto
加拿大多伦多市多伦多大学达拉·拉娜公共卫生学院临床公共卫生部
梅利莎·麦克拉德登（Melissa McCradden），劳拉·罗塞拉（Laura Rosella）
加拿大伦敦西部大学西部公共卫生与家庭医学中心流行病学与生物统计学系
Shehzad Ali
加拿大QC蒙特利尔，麦吉尔大学人口与全球健康学院流行病学，生物统计学和职业健康系
大卫·巴克里奇
电气工程与计算机科学系（EECS）和医学工程与科学研究所（IMES），麻省理工学院，美国马萨诸塞州剑桥市
马尔兹耶·加塞米
加拿大多伦多多伦多大学生物伦理联合中心
珍妮弗·吉布森（Jennifer Gibson）和罗斯·Upshur（Ross Upshur）
流行病学与生物统计学部门，麻醉和围手术医学，舒利希跨学科计划，公共卫生计划，西部大学，伦敦，加拿大，
Ava John-Baptiste
加拿大多伦多市多伦多大学医学院医学学院本科医学教育
吉利安·麦克林
加拿大多伦多的生病儿童医院生物伦理学系
梅利莎·麦克拉登（Melissa McCradden）
遗传学和基因组生物学，Sickkids研究所，加拿大安大略省多伦多
梅利莎·麦克拉登（Melissa McCradden）
加拿大安大略省多伦多的韦尔斯利研究所
夸梅·麦肯齐
卡姆，多伦多，安大略省，加拿大
夸梅·麦肯齐
加拿大多伦多大学多伦多大学医学院医学系传染病系
Sharmistha Mishra
地图城市健康解决方案中心，李卡·斯舍（Li Ka Shing）知识研究所，加拿大多伦多市多伦多统一健康研究所
Sharmistha Mishra
多伦多多伦多大学医学院医学院医学院
Sharmistha Mishra
卫生政策，管理与评估研究所，加拿大多伦多多伦多大学达拉·拉娜公共卫生学院流行病学科
Sharmistha Mishra
ICES，多伦多，安大略省，加拿大
Sharmistha Mishra
加拿大多伦多市多伦多大学计算机科学系
Parisa Naraei
加拿大多伦多市多伦多大学艺术与科学学院社会学系
Akwasi Owusu-Bempah
加拿大安大略省多伦多的Trillium Health Partners Better Health研究所
劳拉·罗塞拉（Laura Rosella）
加拿大多伦多多伦多大学医学院物理治疗系
詹姆斯·肖
图书馆服务，多伦多统一健康，圣迈克尔医院，加拿大安大略省多伦多
卡罗琳·齐格勒（Carolyn P. Ziegler）
加拿大多伦多市达拉·拉娜公共卫生学院流行病学系
Shehzad Ali
加拿大多伦多市特米蒂医学学院实验室医学和病理学系
Shehzad Ali
约克大学，约克大学卫生科学系
劳拉·罗塞拉（Laura Rosella）
WHO在加拿大安大略省渥太华渥太华卫生公平中心卫生公平中的知识翻译和卫生技术评估中心合作
劳拉·罗塞拉（Laura Rosella）

贡献

ADP，SD，CZ概念化和方法论。SB，RR，AP，电视数据收集。SB正式分析。SB，RR，AP，TV撰写原始草稿。所有作者（SB，RR，SD，AP，TV，MS，CC，CZ，SA，SA，DB，MG，JG，JG，AJP，JM，JM，MM，KM，SM，SM，PN，PN，AOB，AOB，LR，JS，JS，RU，RU，ADP）â写作评论和编辑。所有作者都为修改重要智力内容的手稿做出了贡献，并最终批准了要发布的版本，并同意对工作的各个方面负责。

通讯作者

通讯至安德鲁·Pinto。道德声明

道德批准并同意参与

不适用。

同意发表不适用。

利益竞争

作者声明没有竞争利益。

附加信息

出版商的注释

施普林格·自然对于已出版的地图和机构隶属关系中的管辖权主张保持中立。

补充信息

权利和权限

开放获取

本文根据知识共享署名 4.0 国际许可证获得许可，该许可证允许以任何媒介或格式使用、共享、改编、分发和复制，只要您对原作者和来源给予适当的认可，并提供

关于本文

引用这篇文章

Birdi，S.，Rabet，R.，Durant，S。

等人。机器学习应用程序中的偏见是在人群级别上解决非传染性疾病的偏见：范围审查。BMC 公共卫生24 ，3599（2024）。https://doi.org/10.1186/s12889-024-21081-9

下载引文

已收到:2024 年 3 月 21 日
公认:2024 年 12 月 12 日
已发表:2024 年 12 月 28 日
DOI:https://doi.org/10.1186/s12889-024-21081-9