英语轻松读发新版了,欢迎下载、更新

改善健康,一次一个机器学习系统

2024-11-25 22:10:00 英文原文

作者:Michaela Jarvis | Laboratory for Information and Decision Systems

Marzyeh Ghassemi 小时候就对电子游戏和拼图着迷,从小就对健康着迷。幸运的是,她找到了一条可以将这两种兴趣结合起来的道路。 

“虽然我曾考虑过从事医疗保健行业,但计算机科学和工程的吸引力更大,”麻省理工学院电气工程和计算机科学系以及医学工程研究所的副教授 Ghassemi 说道和科学(IMES)和信息与决策系统实验室(LIDS)的首席研究员。“当我发现广泛的计算机科学,特别是人工智能/机器学习,可以应用于医疗保健时,这是利益的融合。”

如今,Ghassemi 和她在 LIDS 的健康 ML 研究小组致力于深入研究如何使机器学习 (ML) 变得更加强大,并随后应用于提高健康领域的安全性和公平性。

Ghassemi 在德克萨斯州和新墨西哥州的一个以工程为导向的伊朗裔美国家庭中长大,在 STEM 职业生涯中拥有可以效仿的榜样。虽然她喜欢基于谜题的视频游戏 — — 解决谜题以解锁其他关卡或进一步进步是一项非常有吸引力的挑战 — — 她的母亲也很早就让她学习更高级的数学,吸引她接触数学不仅仅是算术。

加塞米说:“加法或乘法是强调基本技能,这是有充分理由的,但这种强调可能会掩盖这样一个想法,即许多高级数学和科学更多地是关于逻辑和谜题的。”“因为妈妈的鼓励,我知道前面会有有趣的事情。”

加塞米说,除了她的母亲之外,还有许多其他人支持她的智力发展。当她在新墨西哥州立大学获得本科学位时,荣誉学院院长、前马歇尔学者杰森·阿克尔森(现任美国国土安全部高级顾问)帮助她申请了马歇尔奖学金凭借奖学金,她进入了牛津大学,并于 2011 年获得了硕士学位,并首先对快速发展的机器学习这一新兴领域产生了兴趣。加塞米说,在麻省理工学院攻读博士学位期间,她得到了“来自教授和同行的支持”,并补充道,“我试图为我的学生复制这种开放和接受的环境。”

在攻读博士学位期间,Ghassemi 还发现了她的第一个线索:健康数据的偏差可能隐藏在机器学习模型中。

她训练了模型来使用健康数据来预测结果,当时的心态是使用所有可用的数据。在图像神经网络中,我们已经看到,学习正确的特征将获得良好的性能,从而消除了需要手工设计特定的功能。 –

在与麻省理工学院计算生理学和 IMES 实验室首席研究科学家、Ghassemi 论文委员会成员 Leo Celi 会面时,Celi 询问 Ghassemi 是否检查过模型在不同性别、保险类型、和自我报告的比赛。

加塞米确实检查了,发现有漏洞。– 我们近十年的工作表明,这些模型差距很难解决 – 它们源于健康数据和默认技术实践中现有的偏见。除非你仔细思考,否则模型会天真地再现并扩大偏见,”她说。

从那时起,加塞米就一直在探索此类问题。

她在工作中最喜欢的突破来自于几个部分。首先,她和她的研究小组表明,学习模型可以从胸部 X 光片等医学图像中识别患者的种族,而放射科医生却无法做到这一点。然后,该小组发现,经过优化以表现良好的模型(平均而言)对于女性和少数族裔的表现并不好。去年夏天,她的小组结合了这些发现,表明模型学会预测患者的能力越强。从医学图像中看出种族或性别,这些人口统计数据中的子群体的表现差距就越大。Ghassemi 和她的团队发现,如果对模型进行训练以考虑人口统计差异,而不是专注于总体平均性能,则可以缓解这个问题 - 但此过程必须在部署模型的每个站点执行。

– 我们强调,在一个医院环境中经过训练以优化性能(平衡整体性能与最低公平差距)的模型在其他环境中并不是最佳的。这对于如何开发供人类使用的模型具有重要影响,”Ghassemi 说。– 一家医院可能拥有训练模型的资源,然后能够证明其表现良好,甚至可能存在特定的公平性约束。然而,我们的研究表明,这些性能保证在新的环境中并不成立。在一个站点中保持良好平衡的模型可能无法在不同的环境中有效运行。这会影响模型在实践中的实用性,我们必须努力为开发和部署模型的人员解决这个问题。

Ghassemi 的作品源于她的身份。

“我是一名明显的穆斯林女性,也是一名母亲,两者都帮助塑造了我看待世界的方式,这也影响了我的研究兴趣,”她说。– 我致力于研究机器学习模型的稳健性,以及缺乏稳健性如何与现有偏见相结合。这种兴趣并非巧合。”

关于她的思考过程,加塞米说,当她在户外时,灵感常常会突然出现——本科时在新墨西哥州骑自行车,在牛津划船,作为麻省理工学院的博士生跑步,最近在剑桥滨海艺术中心散步。她还表示,她发现在处理复杂问题时,思考更大问题的各个部分并尝试理解她对每个部分的假设可能是错误的,这很有帮助。

“根据我的经验,新解决方案的最大限制因素是你认为自己知道什么,”她说。“有时,很难超越你自己对某件事的(部分)知识,除非你真正深入研究模型、系统等,并意识到你没有正确或完全理解某个子部分。”¤

尽管 Ghassemi 对工作充满热情,但她也有意识地关注生活的大局。

“当你热爱你的研究时,就很难阻止它成为你的身份——我认为很多学者都必须意识到这一点,”她说。– 我努力确保我的兴趣(和知识)超出了我自己的技术专长。

– 帮助确定平衡优先顺序的最佳方法之一是与优秀的人合作。如果您的家人、朋友或同事鼓励您成为一个完整的人,请坚持住他们! –

加塞米的工作涵盖了计算机科学和健康这两个早期爱好,赢得了许多奖项和广泛认可,他坚信将生活视为一段旅程。

“波斯诗人鲁米有一句话被翻译为:“你就是你所寻找的,”她说。“在人生的每个阶段,你都必须重新投入,寻找自己是谁,并推动它朝着你想成为的人发展。”

关于《改善健康,一次一个机器学习系统》的评论


暂无评论

发表评论

摘要

Marzyeh Ghassemi 是麻省理工学院的副教授,她通过旨在改善健康公平和安全的机器学习 (ML) 研究将她对计算机科学和医疗保健的兴趣结合起来。她在德克萨斯州和新墨西哥州长大,父母都是以工程学为导向的伊朗裔美国人,她的母亲很早就开始研究高等数学,并受到杰森·阿克尔森等导师的支持,她帮助她获得了牛津大学的马歇尔奖学金。在麻省理工学院攻读博士学位期间,Ghassemi 发现了影响机器学习模型的健康数据偏差,这促使她专注于使这些模型对不同人群更加稳健和公平。她的研究强调了在训练模型时考虑人口差异的重要性,以确保它们在不同环境中表现良好,这反映了她对身份与科学探究和个人成长交叉的信念。