医疗保健越来越拥抱AI,以改善工作流程管理,患者沟通以及诊断和治疗支持。至关重要的是,这些基于AI的系统不仅表现出色,而且具有高效和隐私性。考虑到这些考虑因素,我们建立并最近发布了健康AI开发人员基金会(hai-def)。HAI-DEF是一系列轻巧的开放模型,旨在为开发人员提供自身的健康研究和应用程序开发的强大起点。由于HAI-DEF模型是开放的,因此开发人员保留对隐私,基础架构和对模型进行修改的完全控制。在可能今年,我们扩展了Hai-def系列Medgemma,基于生成模型的集合Gemma 3旨在加速医疗保健和Lifesciences AI开发。
今天,我们很自豪地宣布该系列中的两个新型号。第一个是Medgemma 27B多模式,它通过增加对复杂的多模式和纵向电子健康记录解释的支持来补充先前发布的4B多模式和27B文本模型。第二个新模型是Medsiglip,这是一个轻巧的图像和文本编码器,用于分类,搜索和相关任务。Medsiglip基于为4B和27B Medgemma模型提供动力的相同图像编码器。
Medgemma和Medsiglip是医学研究和产品开发的强大起点。Medgemma对需要生成免费文本的医学文本或成像任务有用,例如报告生成或视觉问题回答。建议将Medsiglip用于成像任务,涉及分类或检索等结构化输出。以上所有型号都可以在单个GPU上运行,并且Medgemma 4B和Medsiglip甚至可以适应移动硬件上运行。
可以在Medgemma和Medsiglip开发和评估的全部详细信息中找到Medgemma技术报告。
Medgemma集合包括4B和27B尺寸的变体,现在都接受图像和文本输入并产生文本输出。
我们通过训练医学优化的图像编码器开发了这些模型(如下所述,独立发行为Medsiglip),然后训练相应的4B和27B版本Gemma 3模型关于医疗数据。在此过程中,我们小心翼翼地保留了Gemma的一般(非医学)功能。这使Medgemma可以在混合医学和非医学信息并保留非英语语言的指导跟踪和能力的任务上表现良好。
这些模型的一个关键方面是它们的适应性。例如,经过微调后,Medgemma 4B能够在胸部X射线报告中实现最先进的性能,并具有radgraph f1得分为30.3。开发人员在目标应用程序上提高性能的直接能力突出了Medgemma的价值,作为希望为医疗保健建立AI的开发人员的起点。
Medsiglip是仅使用400m参数的轻巧图像编码器语言图像预训练的sigmoid损失(siglip)体系结构。Medsiglip通过使用多种医学成像数据进行调整,包括胸部X射线,组织病理学补丁,皮肤病学图像和眼底图像,允许该模型学习特定于这些模式的细微特征。重要的是,我们还要注意确保Medsiglip在对原始Siglip模型的自然图像上保留强大的性能,并保持其多功能性。
Medsiglip旨在通过将它们编码为常见的嵌入空间来弥合医学图像和医学文本之间的差距。与特定于任务的视觉嵌入模型相比,Medsiglip的分类性能相似或改进了分类性能,同时在医学成像域中的用途更广泛。
Medsiglip是:
由于Medgemma集合已经开放,因此可以下载,构建和微调以支持开发人员的特定需求。特别是在医疗领域,这种开放方法比基于API的模型具有多种不同的优势:
研究人员和开发人员一直在探索其用例的Medgemma模型,并发现该模型擅长解决一些关键问题。开发人员在深处在美国马萨诸塞州,美国一直在探索Medsiglip,以改善其胸部X射线分盘和结节检测。研究人员在Chang Gung纪念医院台湾指出,Medgemma与传统的中文医学文献合作,可以很好地回答医务人员的问题。开发人员在Tap Health在印度古尔冈(Gurgaon),关于Medgemma的卓越医疗基础的评论,指出了其对需要对临床环境敏感的任务的可靠性,例如总结进度注释或建议指导指南的轻推。
我们很高兴能继续从开发人员那里了解这些和其他用例,因为他们创建了使用Medgemma和Medsiglip的下一代健康AI工具。
请参阅下表,以了解Medgemma家族的哪种模型非常适合您的用例。
模型经过了公共和私人去识别数据集的培训。Google及其合作伙伴利用已被严格匿名化或取消识别的数据集,以确保保护单个研究参与者和患者隐私。
Medgemma和Medsiglip旨在用作起点,以有效地开发涉及医学文本和图像的下游医疗保健应用程序。如果没有适当的验证,适应和/或对开发人员进行特定用例的有意义的修改,则无意使用Medgemma和Medsiglip。这些模型产生的输出并非旨在直接为临床诊断,患者管理决策,治疗建议或任何其他直接临床实践应用提供信息。性能基准测试强调了相关基准上的基线功能,但是即使对于构成培训数据中很大一部分的图像和文本域,也可以使用不准确的模型输出。所有模型输出均应被视为初步,并需要通过既定的研发方法进行独立验证,临床相关性以及进一步研究。