作者:Gemma Conroy, Nature magazine
2025年9月18日
3分钟阅读
一个称为Delphi-200万的大型语言模型分析了一个人的病历和生活方式,以提供1,000多种疾病的风险估计
Boris Zhitkov/Getty Images
一种新的人工智能(AI)工具可以预测一个人患有1000多种疾病的风险,在某些情况下,预测提前几十年提供了预测。
该模型称为Delphi-200m,使用健康记录和生活方式因素,以估计一个人患癌症等疾病的可能性,皮肤疾病和免疫条件提前20年。尽管Delphi-200M仅在英国的一个数据集中接受了培训,但其多疾病模型有一天可以帮助临床医生识别高风险人员,从而可以尽早采取预防措施。该模型在今天发表在自然。
该工具可以一次对多种疾病进行建模的能力令人惊讶。他说,它可以产生整个未来的健康轨迹。
如果您喜欢这篇文章,请考虑支持我们屡获殊荣的新闻业订阅。通过购买订阅,您可以帮助确保有关当今世界的发现和想法有影响力的故事的未来。
研究人员已经发展基于人工智能的工具,以预测一个人发展某些条件的风险,包括一些癌症和心血管疾病。Heidelberg德国癌症研究中心的数据科学家Moritz Gerstung说,但是大多数这些工具估计只有一种疾病的风险。他说,卫生保健专业人员将不得不运行数十个以提供全面的答案。”
为了解决这个问题,Gerstung及其同事修改了一种称为生成预训练的变压器(GPT)的大型语言模型(LLM),该模型形成了AI聊天机器人(例如Chatgpt)的基础。当被问及一个问题时,GPT提供了根据统计学上可能的大量数据培训的输出。
作者设计了修改后的LLM,以预测一个人在过去的病史的基础上患有1,258种疾病的可能性。该模型还结合了人的年龄,性别,体重指数以及与健康有关的习惯,例如烟草使用和饮酒。研究人员培训了Delphi-i-200亿,该数据是一项长期生物医学监测研究的英国生物银行参与者的数据。
对于大多数疾病而言,Delphi-200 M的预测匹配或超过了当前模型的准确性,这些模型估计了出现单一疾病的风险。该工具的性能比使用的机器学习算法要好生物标志物的特定分子或体内化合物的水平预测几种疾病的风险。Gerstung说:''
当预测遵循可预测的进展模式(例如某些类型的癌症)的条件轨迹时,Delphi-i-200 m效果最好。该模型根据其病历中所包含的信息计算了一个人最多二十年的时间的人的可能性。
Gerstung和他的同事对Delphi-200万人的健康数据进行了测试,该数据来自丹麦国家患者登记处的190万人,这是一个国家数据库,该数据库已追踪了近半个世纪的医院入院。作者发现,该模型对注册表中的人的预测仅比英国生物库的参与者的精度要少一些。Gerstung说,这表明,当模型应用于培训的模型以外的国家卫生系统的数据集时,该模型仍然可以做出一些可靠的预测。
DeLphi-200M是一次对多种疾病建模的新兴领域的贡献,但它具有局限性。例如,英国生物银行数据仅捕获了参与者的第一个疾病刷。Zhi说,某人患病的次数对于建模个人健康轨迹很重要。
Gerstung及其同事将评估来自几个国家 /地区数据集的Delphi-200 M的准确性,以扩大其范围。他说,考虑如何将这些信息组合起来以开发更精确的算法将很重要。”他说。
本文经许可复制,是首次出版2025年9月17日。
如果您喜欢这篇文章,我想寻求您的支持。科学美国人一直担任科学和工业的倡导者已有180年了,目前可能是这两个世纪历史中最关键的时刻。
我一直是一个科学美国人从我12岁起,订户就可以塑造我对世界的看法。Sciam总是教育和高兴我,并激发我们广阔,美丽的宇宙的敬畏感。我希望它也能为您做。
如果你订阅科学美国人,您有助于确保我们的覆盖范围以有意义的研究和发现为中心;我们有资源报告威胁美国各地实验室的决定;而且,在科学本身经常无法认识到的时候,我们支持萌芽和工作科学家。
作为回报,您将获得基本新闻,迷人的播客,出色的信息图表,不能错过通讯,必须观看视频,具有挑战性的游戏,以及科学界最好的写作和报告。你甚至可以礼物某人订阅。
我们从来没有更重要的时间站起来,展示科学为什么重要。希望您能支持我们执行这一任务。