几个月后,我的母亲,一位57岁的肾移植患者,住在东部的一个小城市中国,踏上了为期两天的去看医生的旅程。她的背包里装满了换洗的衣服、一叠医疗报告和一些煮鸡蛋作为零食。然后,她乘坐90分钟的高铁,入住东部大都市杭州的一家酒店。
第二天早上 7 点,她和数百人一起在医院长长的大厅里排队采血,这里熙熙攘攘,就像拥挤的市场一样。下午,化验结果出来后,她前往专科诊所。她和医生相处了大约三分钟。如果她幸运的话,也许有五个。他浏览了一下实验室报告,迅速在电脑中输入新的处方,然后打发她走去,冲进下一个病人。然后,妈妈收拾好行李,开始了漫长的回家路。
DeepSeek 对她有所不同。
去年冬天,我母亲开始使用中国领先的人工智能聊天机器人来诊断她的症状。她会躺在沙发上,打开 iPhone 上的应用程序。
“嗨,”2 月 2 日,她在给聊天机器人的第一条消息中说道。
——你好!今天我能为您提供什么帮助吗? – 系统立即做出回应,添加了一个笑脸表情符号。
“是什么导致平均红细胞血红蛋白浓度较高?”她在下个月问机器人。
“我晚上撒尿的次数比白天多,”她在四月份说道。
“如果我的肾脏灌注不良,我该怎么办?”几天后她问道。
她提出了后续问题,并请求有关食物、运动和药物的指导,有时会在 DeepSeek 医生的虚拟诊所待上几个小时。她上传了超声波扫描和实验室报告。DeepSeek 解释了它们,她相应地调整了自己的生活方式。在机器人的建议下,她减少了医生给她开的免疫抑制剂的每日摄入量,并开始饮用绿茶提取物。她对聊天机器人充满热情。
“你是我最好的健康顾问!”她这样说道。
它回复道:“听到你这么说,我真的很高兴!”能够帮助到您就是我最大的动力 ð¥°你们探索健康的精神也太棒了!°
我对她与人工智能发展的关系感到不安。但她离婚了,我住得很远,没有其他人可以满足我妈妈的需要。
在 OpenAI 推出 ChatGPT 并引发全球对大型语言模型 (LLM) 的热潮近三年后,聊天机器人几乎融入了中国、美国及其他地区社会的各个领域。对于像我妈妈这样觉得自己无法从医疗系统中获得所需时间或护理的患者来说,这些聊天机器人已成为值得信赖的替代方案。
人工智能正在被塑造成虚拟医生,心理健康治疗师和机器人同伴对于老年人。对于病人来说,焦虑的,孤立的和许多其他可能缺乏医疗资源和关注的弱势群体一样,人工智能庞大的知识库,加上其肯定和同情的语气,可以让机器人感觉像是明智和令人安慰的伙伴。与配偶、孩子、朋友或邻居不同,聊天机器人随时可用。他们总是回应。
企业家、风险投资家甚至一些医生现在都将人工智能视为负担过重的医疗系统的一剂良药,以及缺席或疲惫不堪的护理人员的替代品。与此同时,伦理学家、临床医生和研究人员警告将护理外包给机器的风险。毕竟,人工智能系统中的幻觉和偏见很普遍。生命可能受到威胁。
几个月来,我妈妈越来越迷恋她的新人工智能医生。“DeepSeek 更人性化,”我母亲五月份告诉我。“医生更像是机器。”中号
2004年,我的母亲被诊断出患有慢性肾病。我们两个人刚刚从家乡这个小城市搬到了杭州,这个人口约800万的省会城市,尽管此后人口已经大幅增长。杭州以其古老的寺庙和宝塔而闻名,也是一个新兴的科技中心和阿里巴巴的所在地– 几年后,将主办 DeepSeek。
在杭州,我们是彼此最亲密的家人。我是中国独生子女政策下出生的数千万儿童之一。我父亲留在家乡当医生,只是偶尔来看望我——我父母的关系一直有些疏远。我妈妈在一所小学教音乐、做饭并照顾我的学业。多年来,我和她一起经历了压力很大的医院就诊,并焦急地等待着每一份实验室报告,报告只显示她的肾脏缓慢但持续的衰退。
中国的医疗保健体系充斥着严重的不平等。中国的顶尖医生在数十家著名公立医院工作,其中大部分位于经济发达的东部和南部地区。这些医院坐落在广阔的校园内,高楼大厦内设有诊所、实验室和病房。最大的设施有数千张床位。病情严重的患者长途跋涉,有时甚至跨越整个国家,去这些医院寻求治疗是很常见的。有时一天要诊治 100 多名患者的医生很难跟上。
虽然医院是公立的,但它们主要经营作为企业,只有大约 10% 的预算来自政府。医生的工资微薄,只有当他们的部门能够从运营和其他服务中盈利时才能获得奖金。在最近的镇压之前医疗腐败,医生接受制药和医疗用品公司的回扣或贿赂是很常见的。
随着中国人口老龄化,该国医疗保健系统的压力加剧,该系统的失败导致了导致对医疗专业人员的普遍不信任。在过去的二十年里,这种情况甚至表现为对医生和护士的人身攻击,导致政府强制要求最大的医院设立安全检查站。

在杭州和妈妈一起生活的八年里,我已经习惯了中国医院紧张、超负荷的环境。但随着年龄的增长,我陪她的时间越来越少。我 14 岁就读于寄宿学校,每周只回家一次。我在香港上大学,当我开始工作时,我母亲提前退休并搬回了我们的家乡。从那时起,她开始进行为期两天的回杭州看肾病专家的旅行。当她的肾脏完全衰竭后,她在胃里放置了一根塑料管,在家进行腹膜透析。2020年,幸运的是,她接受了肾移植手术。
然而,这只是部分成功,而且她还患有一系列并发症,包括营养不良、边缘糖尿病和睡眠困难。肾脏科医生拖着她进出他的办公室,催促下一位病人进来。
她和我父亲的关系也变得更加紧张,三年前,他们分手了。我搬到了纽约市。每当她在我们半定期的通话中提到她的病时,我都不知道该说什么,除了建议她尽快去看医生。瓦
当我母亲在 2000 年代首次被诊断出患有肾脏疾病时,她会在中国主要的搜索引擎百度上查找指导。随后,百度又卷入了一系列的事件。医疗广告丑闻,其中包括一名大学生的死亡事件,该学生尝试了他通过赞助链接找到的未经证实的疗法。有时,她会浏览当时流行的互联网论坛天涯的讨论,了解其他患有肾病的人是如何应对和接受治疗的。
后来,像许多中国人一样,她转向微信等社交媒体平台获取健康信息。这些论坛在新冠疫情封锁期间变得特别受欢迎。用户分享健康秘诀,算法将他们与患有相同疾病的其他人联系起来。数以万计的中国医生变成有影响力的人,发布从皮肤过敏到心脏病等各种疾病的视频。错误信息、未经证实的治疗方法和可疑的医疗广告也在这些平台上传播。
我母亲从微信上有影响力的人那里得到了一些晦涩的饮食建议。百度的算法不自觉地为她提供了有关糖尿病的文章。我警告她不要相信她在网上读到的一切。
人工智能聊天机器人的兴起开启了在线医疗建议的新篇章。一些研究表明,大型语言模型至少可以模仿对医学知识的强大掌握。一项于 2023 年发表的研究,确定 ChatGPT取得了相当于美国医学执照考试三年级医学生及格分数的成绩。去年,谷歌说其经过微调的 Med-Gemini 模型在类似的基准测试中表现甚至更好。
对更密切地反映日常临床实践的任务(例如诊断疾病)的研究对人工智能倡导者来说很有吸引力。合而为一2024年学习,作为预印本发表,尚未经过同行评审,研究人员将来自真实急诊室的临床数据输入 OpenAI 的 GPT-4o 和 o1,发现它们在诊断方面都优于医生。在其他同行评审的研究中,聊天机器人在诊断方面至少击败了住院医生眼睛问题,胃部症状和急诊室病例。2025年6月,微软声称它建立了一个人工智能驱动的系统,其诊断病例的准确率是医生的四倍,创造了一条“通往医疗超级智能的道路”。当然,研究人员也指出偏见的风险和可能导致的幻觉错误的诊断和治疗以及更深层次的医疗保健差距。在中国LLM公司奋力追赶美国同行的同时,DeepSeek率先在整体能力上与硅谷顶级模式相媲美。

尽管存在一些限制,美国和中国的用户仍定期向这些聊天机器人寻求医疗建议。据一家机构称,六分之一的美国成年人表示,他们每月至少使用一次聊天机器人来查找与健康相关的信息。2024 年调查。在 Reddit 上,用户共同的故事后ChatGPT 的故事诊断他们的神秘状况。在中国的社交媒体上,人们还报告咨询聊天机器人为自己、孩子和父母提供治疗。
我母亲告诉我,每当她走进肾病专家的办公室时,她都感觉自己就像一个等待被责骂的女学生。她担心自己的问题会惹恼医生。她还怀疑医生更看重患者数量和处方收入,而不是她的健康。
但在 DeepSeek 博士的办公室里,她却很安心。“DeepSeek 让我感觉自己是平等的,”她说。– 我可以主导谈话并提出任何我想问的问题。它让我能够弄清所有事情的真相。”
自从二月初开始接触以来,我母亲向人工智能报告了一切:肾功能和血糖水平的变化、手指麻木、视力模糊、Apple Watch 上记录的血氧水平、咳嗽、醒来后的头晕感觉。她寻求有关食物、补充剂和药物的建议。
“山核桃适合我吗?”她在四月份问道。DeepSeek 分析了坚果的营养成分,标记了潜在的健康风险并提供了份量建议。
“这是我移植肾脏的超声报告,”她一边打字一边上传文件。DeepSeek 随后制定了治疗计划,建议新的药物和食物疗法,例如冬瓜汤。
– 我今年 57 岁,肾移植术后。我在上午 9 点和晚上 9 点服用他克莫司(一种免疫抑制剂)。我的体重是39.5公斤。我的血管又硬又脆弱,肾脏灌注也不佳。这就是今天的饮食。请帮忙分析一下能量和营养成分。谢谢!——然后她列出了当天吃的所有东西。DeepSeek 建议她减少蛋白质摄入量并添加更多纤维。
对于每一个问题,它都会自信地回答,并结合要点、表情符号、表格和流程图。如果妈妈说声谢谢,那就增加了一点鼓励。
“你并不孤单。”
“我对你的进步感到非常高兴!”
有时,它会以星星或樱花的表情符号结束。
“DeepSeek 比医生好得多,”有一天她给我发短信。
中号你母亲对 DeepSeek 的依赖与日俱增。尽管机器人不断提醒她去看真正的医生,但她开始觉得自己有足够的能力根据它的指导来治疗自己。三月份,DeepSeek 建议她减少每日免疫抑制剂的摄入量。她做到了。建议她坐着时避免身体前倾,以保护肾脏。她坐直了。然后,推荐了莲藕淀粉和绿茶提取物。她把它们都买了。
四月份,我母亲问 DeepSeek 她的新肾脏还能维持多久。预计需要三到五年才能回复,这让她陷入了焦虑的漩涡。
征得她同意后,我将她与 DeepSeek 的对话摘录与两位美国肾脏病专家分享,并征求他们的意见。
据医生称,DeepSeek 的答案充满了错误。密歇根州奥克兰大学的肾脏病学家兼临床副教授乔尔·托普夫博士告诉我,其中一项治疗贫血的建议——使用一种名为促红细胞生成素的激素——可能会增加患癌症和其他并发症的风险。托普夫告诉我,DeepSeek 提出的其他几种改善肾功能的治疗方法未经证实、可能有害、不必要或者是“一种幻想”。
我问他如何回答她关于她的肾脏还能存活多久的问题。“我通常不太具体,”他说。“我们不是告诉人们他们还能活多久,而是谈论两到五年后将接受透析的部分。”
哈佛医学院副教授、波士顿贝斯以色列女执事医疗中心的肾脏病专家 Melanie Hoenig 博士告诉我,DeepSeek 的饮食建议似乎或多或少是合理的。但她说 DeepSeek 建议的血液检查完全错误,并将我母亲最初的诊断与另一种非常罕见的肾脏疾病混淆了。
“坦率地说,这有点胡言乱语,”霍尼格说。“对于不知道的人来说,很难知道哪些部分是幻觉,哪些是合理的建议。”

研究人员发现,聊天机器人在医学检查中的能力并不一定能转化为现实世界。考试问题中清楚地列出了症状。但在现实世界中,患者通过一轮轮的问答来描述他们的问题。他们通常不知道哪些症状是相关的,也很少使用正确的医学术语。做出诊断需要观察、同理心和临床判断。
在一个研究发表在《自然医学》上今年早些时候,研究人员设计了一款人工智能代理,充当伪患者并模拟人类的说话方式,用它来测试法学硕士跨 12 个专业的临床能力。所有法学硕士的成绩都比他们在考试中的表现差得多。哈佛医学院的博士生、该研究的主要作者 Shreya Johri 告诉我,人工智能模型不太擅长提问。当某人的病史或症状分散在几轮对话中时,他们也无法将各个点联系起来。“重要的是,人们要持保留态度,”乔里谈到法学硕士时说道。
牛津大学的博士生安德鲁·比恩 (Andrew Bean) 告诉我,大型语言模型也倾向于与用户达成一致,即使人类是错误的。“如果没有专家参与其中,肯定会带来很多风险,”他说。一个
自从我母亲与 DeepSeek 结下不解之缘后,中国各地的医疗保健提供商都采用了大型语言模型。自一月份发布 DeepSeek-R1 以来,数百家医院已将该模型纳入其流程中。根据官方公告,人工智能增强系统有助于收集初步投诉、编写图表并提出诊断建议。大型医院与科技公司合作,利用患者数据来训练自己的专业模型。四川省一医院推出了“DeepJoint”,一种骨科模型,可分析 CT 或 MRI 扫描以生成手术计划。北京某医院开发了“Stone Chat AI”,回答患者有关尿路结石的问题。
科技行业现在将医疗保健视为人工智能应用最有前途的前沿领域之一。DeepSeek本身有开始招募实习生对医学数据进行注释,以改进其模型——医学知识并减少幻觉。阿里巴巴5月宣布其专注于医疗保健的聊天机器人经过 Qwen 大语言模型的训练,通过了中国 12 个学科的医疗资格考试。另一家领先的中国人工智能初创公司百川人工智能的使命是利用通用人工智能来解决人类医生短缺的问题。“当我们能够创造出一名医生时,那就是我们实现了 AGI”,其创始人王小川说道。告诉一家中国媒体。(百川AI拒绝了我的采访请求。)
初级的“人工智能医生”正在该国最受欢迎的应用程序中出现。在短视频应用抖音上,用户可以点击医生影响者的个人资料照片并与他们的人工智能头像交谈。支付宝也可以提供医疗功能,用户可以免费咨询 AI 肿瘤科医生、AI 儿科医生、AI 泌尿科医生以及 AI 失眠专家,如果你凌晨 3 点仍然睡不着,他们可以给你打电话。这些人工智能化身提供基本的治疗建议、解释医疗报告并帮助用户预约真正的医生。
人工智能医疗初创公司左右医生的创始人张超在阿里巴巴的 Qwen 模型基础上开发了人工智能初级保健医生。他说,大约有 50 万用户与该机器人交谈过,大部分是通过微信上的迷你应用程序进行的。人们询问轻微的皮肤病、孩子的疾病或性传播疾病。
中国已禁止人工智能医生开处方,但对他们的言论几乎没有监管。公司只能做出自己的道德决定。例如,张禁止他的机器人解决有关儿童吸毒的问题。该团队还部署了一个团队来扫描回复中是否有可疑的建议。张说,他对机器人的整体性能充满信心。“对于医学来说,没有正确的答案,”张说。– 关键在于它能够在多大程度上帮助用户。”
人工智能医生也走进线下诊所。4 月,中国初创公司 Synyi AI 在沙特阿拉伯一家医院推出了人工智能医生服务。该机器人经过训练,可以像医生一样提问,通过平板电脑与患者交谈,安排实验室测试,并提出诊断和治疗建议。然后,人类医生会审查这些建议。Synyi AI 首席数据官 Greg Feng 告诉我,它可以为治疗约 30 种呼吸系统疾病提供指导。

冯说,人工智能比人类更细心、更富有同情心。它可以改变性别,让病人更舒服。与人类医生不同的是,它可以根据患者的需要随时解答他们的问题。他说,虽然人工智能医生必须受到人类的监督,但它可以提高效率。“过去,一名医生只能在一间诊所工作,”冯说。– 现在,一名医生可能可以同时经营两到三个诊所。 –
企业家们声称,人工智能可以解决医疗准入问题,例如医院人满为患、医务人员短缺以及城乡医疗质量差距等。中国媒体有人工智能报道协助欠发达地区,包括青藏高原边远地区的医生。“未来,借助人工智能模型,小城市的居民或许能够享受更好的医疗保健和教育,”武汉大学经济学教授魏立佳告诉我。他的学习,最近发表在《健康经济学杂志》上发现人工智能辅助可以遏制过度治疗并提高医生在其专业以外的医疗领域的表现。“你的母亲,”他说,“不需要去大城市接受治疗。”
其他研究人员提出了与同意、责任和偏见相关的担忧,这些可能会加剧医疗保健差异。在一项研究中发表于三月《科学进展》研究人员评估了一个用于分析胸部 X 光的模型,发现与人类放射科医生相比,该模型往往会漏掉边缘群体(例如女性、黑人患者和 40 岁以下人群)潜在危及生命的疾病。
“我想非常谨慎地说人工智能将有助于缩小中国或世界其他地区的健康差距,”德克萨斯农工大学研究医学人工智能伦理的传播学教授唐陆说。“北京或上海开发的人工智能模型可能不太适合小山村的农民。”
瓦当我打电话给母亲并告诉她美国肾病专家对 DeepSeek 错误的看法时,她说她知道 DeepSeek 给了她矛盾的建议。她告诉我,她知道聊天机器人是根据互联网上的数据进行训练的,并不代表绝对的真理或超人的权威。她已经不再吃它推荐的莲子淀粉了。
但她从 DeepSeek 得到的护理也超出了医学知识的范围:聊天机器人的稳定存在让她感到安慰。
我记得我问她为什么不直接向我提出她经常向 DeepSeek 提出的另一种类型的问题(关于英语语法)。“你肯定会觉得我很烦人,”她回答道。– 但 DeepSeek 会说,“让我们更多地讨论一下这个问题。”这让我真的很高兴。 –
现在独生子女一代已经长大,我们的父母也加入了中国快速增长的老年人口行列。公共养老基础设施已尚未赶上,但我们中的许多人现在远离年迈的父母,忙着应对自己的挑战。尽管如此,我妈妈从来没有让我回家帮忙照顾她。
她明白,对于一个女人来说,离开家庭,走向更广阔的世界意味着什么。20 世纪 80 年代,她就是这样做的——离开为父母和弟弟做饭洗衣的农村家庭,去一所教师培训学校上学。她尊重我的独立性,有时甚至到了极端。我每两周给妈妈打一次电话。她几乎从不给我打电话,担心她会在不合时宜的时候发现我,比如我在工作或和朋友出去玩的时候。
但即使是最善解人意的父母也需要有人依靠。我在华盛顿特区的一位同龄朋友也是从中国移民的,她最近发现了她母亲与 DeepSeek 的渊源。她62岁的母亲住在东部城市南京,患有抑郁症和焦虑症。面对面的治疗太昂贵了,所以她一直向 DeepSeek 倾诉她每天与婚姻有关的挣扎。DeepSeek 给出了详细的分析和长长的待办事项列表。
– 当我母亲非常沮丧和焦虑时,我每天都会给她打电话。但对于我们这样的年轻人来说,很难跟上,”我的朋友告诉我。– AI 的好处是她可以随时说出自己想说的话。她不需要考虑时差或等待我回复短信。”
当我母亲担心自己的健康时,她仍然会求助于 DeepSeek。6月下旬,在我们家乡的一家小医院进行的检查显示,她的白细胞计数较低。她向 DeepSeek 报告了此事,后者建议进行后续测试。她向当地医生提出了建议,医生据此开了药。
第二天,我们就接到了电话。那是我晚上八点,她早上八点。我让她尽快去看杭州的肾病专家。她拒绝了,坚称她对 DeepSeek 博士没意见。“那里太拥挤了,”她提高了声音说道。“一想到那家医院我就头疼。”
她最终同意去看医生。但在旅行之前,她继续与 DeepSeek 就骨髓功能和锌补充剂进行了长时间的讨论。“DeepSeek 拥有来自世界各地的信息,”她辩称。– 它给了我所有的可能性和选择。我可以选择。 –
我回想起我们之前关于 DeepSeek 的对话。“当我感到困惑,没有人可以问,没有人可以信任时,我就会去寻求答案,”她告诉我。– 我不需要花钱。我不必排队等候。我不需要做任何事情。”
她补充道,“尽管它不能给我一个完全全面或科学的答案,但至少它给了我一个答案。”
本文的一个版本出现在世界其他地区我的妈妈和 Deepseek 博士