科技 · 2026-06-22 · 阅读 6

AI 帮 18 个罕见病孩子找到病因，但最值得问的是：为什么是 o3？

据 Yahoo News / AOL 报道，波士顿儿童医院使用 OpenAI 的 o3 模型分析 376 份未确诊患者的基因组，帮助 18 名患有罕见疾病的儿童找到可能病因。这些病例包括罕见神经发育疾病、神经肌肉障碍等。

作者

沈南乔

相关编辑

林岚

这是一条很容易让人激动的 AI 医疗新闻：18 个孩子，长期找不到答案，AI 模型帮助医生从复杂基因数据里发现线索。对任何一个家庭来说，这都不是“模型能力展示”，而是一次可能改变生活的诊断。

但读者看到这里，应该会有几个疑问：AI 是直接给孩子看病了吗？医生还做了什么？为什么用的是 OpenAI 的 o3？如果 o3 已经不是最新模型，这件事还说明 AI 医疗有多先进吗？

先说第一个问题：不是 AI 单独完成诊断。

罕见病诊断常常像在一堆噪音里找一个很小的信号。患者可能做过基因测序，但基因数据里有大量变异，并不是每个变异都和疾病有关。医生要把症状、家族史、检查结果、基因数据库和已有医学文献放在一起看。AI 在这里更像一个特别快的线索筛选器：它可以从 376 份基因组里找出值得医生重新审视的候选解释，但最后仍然要由医生结合临床信息确认。

AI 辅助罕见病诊断流程示意图

所以这条新闻不能写成“AI 医生来了”。更准确的说法是：AI 帮医生把一些可能被埋在数据里的线索提前捞出来。

接下来是 o3 这个细节。对熟悉 OpenAI 模型的人来说，o3 这个名字会让人停一下：如果现在已经有更新的模型，为什么医疗研究还在用 o3？这不是小问题，反而是这篇新闻最值得思考的地方。

一种可能是时间差。医学研究、医院试验和媒体报道不是产品发布会。一个研究项目从设计、伦理审查、数据准备、模型测试、医生复核到论文或报道出来，通常会经历很长周期。新闻里出现的模型，往往不是“今天最新模型”，而是研究当时已经可用、可记录、可复现的模型。

另一种可能更重要：医疗场景未必永远追求最新模型。

在消费产品里，大家喜欢问“是不是最新”。但在医院里，一个模型是否适合使用，不只看能力榜单。医院更关心它的稳定性、可追踪性、是否能记录输入输出、是否能被医生复核、是否符合当时的伦理审批和数据流程。一个旧一点但经过验证的模型，可能比一个刚发布但还没建立完整审计流程的新模型更适合进入研究。

这个区别对 OC 读者很重要。我们平时讨论 AI 工具，很容易默认“新模型就是更好”。但在医疗、金融、法律这类高责任场景里，“更强”不等于“更可用”。真正的问题是：出了错谁负责？医生如何知道模型为什么提出这个候选病因？患者数据如何保护？模型版本换了以后，之前的结果还能不能复现？

本站编辑林岚从技术侧提醒，这类应用最重要的不是模型会不会聊天，而是整条工程链路：数据怎么进来，模型怎么处理，候选结果怎么排序，医生怎么复核，错误怎么记录，版本怎么固定。Demo 很好，审计链呢？错误处理呢？医疗场景不能只看准确率，还要看责任边界。

沈南乔更关心的是另一个问题：这类报道会给患者家庭带来希望，也可能带来误解。对长期找不到病因的家庭来说，AI 像是一束光。但如果媒体把它写成“模型替医生诊断”，就会让人误以为只要把病历丢给 AI，答案就会出现。现实没那么简单。AI 找到的是线索，医生确认的是诊断，家庭需要的是可以被解释、可以被相信、可以指导后续治疗的答案。

这条新闻真正有价值的地方，不是证明 o3 有多神，也不是证明 AI 可以替代医生。它说明，在信息特别复杂、医生时间特别有限、传统流程容易漏掉线索的地方，AI 可能成为一个有用的第二双眼睛。

短期看，AI 在罕见病诊断里更像专家系统和检索工具的升级版。长期看，如果医院能建立稳定的数据流程、模型版本管理、医生复核机制和责任边界，这类工具可能真的会改变很多家庭的命运。

它值得乐观，但不能神化。医疗 AI 最好的样子，不是让医生下线，而是让医生更快找到该看的地方；不是永远追最新模型，而是在正确的场景里使用可验证、可复核、可承担责任的模型。