作者:Tage Kene-Okafor
去年一月,德国生物技术公司BioNTech以超过5.5亿美元的价格收购了非洲人工智能初创公司Instadeep,该交易于同年七月完成。Instadeep的退出目前来自非洲的最大之一在过去的一年里,它一直在德国制药公司的旗下运营。现在是回顾收购以来其表现如何的好时机。
Instadeep利用先进的机器学习技术将AI引入企业应用。其产品从GPU加速的洞察到自学习决策系统不等。在去年被收购之前,这家诞生于突尼斯、总部位于巴黎和伦敦的企业AI初创公司筹集了超过1亿零8百万美元来自包括谷歌、德铁和拜恩泰科在内的多家全球投资者。这三家战略投资者也是这家初创公司最大的合作伙伴和客户。
值得注意的是,这家成立十年的初创公司与BioNTech合作开发了一个预警系统,在疫情期间可以提前几个月检测出高风险的COVID-19变种。Instadeep还与Google DeepMind合作,在非洲创建了一种早期沙漠蝗虫爆发的检测系统。此外,该公司还参与了一个雄心勃勃的项目,为欧洲最大的铁路运营商德国国家铁路公司自动化铁路调度。
这些合作伙伴关系表明Instadeep解决方案的各种应用场合它的收购方有一个明确的应用场景:利用人工智能开发针对各种癌症和传染病的治疗药物和疫苗——如今在新东家的支持下,该公司正在加倍努力推进这一目标。
完成对BioNTech的收购后十五个月,联合创始人兼首席执行官Karim Beguir在接受TechCrunch采访时透露,尽管这家继续独立运营的人工智能公司仍在为生物技术领域以外的客户提供解决方案,Instadeep在该方面已经取得了显著进展。
“我们在与BioNTech的战略合作中,目标是在生物学和生物人工智能能力方面取得一致,”Instadeep首席执行官说道。“但我们也有空间进行调整,并继续在非洲乃至全球范围内成为人工智能领域的一支重要力量,同时继续开发推动其他垂直行业(如工业优化)创新边界的科技。”
贝圭尔指出,在过去的一年里,自从被收购以来,Instadeep的目标是将人工智能部署在BioNTech整个流程的每一步,以改进现有的过程。
他举了一个组织学的例子,这涉及到组织分析和对不同组织进行视觉标记的任务,例如识别肿瘤细胞或健康细胞。据他说,BioNTech的传统做法是由专家手动完成这项工作。然而,Instadeep的技术通过部署视觉AI和分割系统,将这一标记组织的工作流程加速了5倍。
另一个是其RiboMab项目的完成,该项目涉及mRNA编码的抗体,现在已成为BioNTech这家免疫疗法公司用于抗击癌症和其他疾病的工具箱的一部分。InstaDeep在其DeepChain平台上介绍了这个项目,该平台设计蛋白质并分析生物数据,在双方于2020年的首次合作中提出。
生物技术涉及大量敏感的健康数据。收集和分析这些数据是一回事,保护它们的安全是另一回事。只需问问23andMe这家公司,它曾被誉为生物技术领域的颠覆者,但在遭受大规模数据泄露后就变成了受害者。暴露了近700万人的数据,其一半的客户基数。
有趣的是,BioNTech 对此类事件并不陌生。2020年,黑客们非法获取的文件与辉瑞合作开发的新冠疫苗有关,通过攻击欧洲药品管理局(EMA),即负责评估药物和疫苗的欧洲药品监管机构,来发起攻击。虽然辉瑞和BioNTech确认他们的系统和试验数据仍然安全,但该事件凸显了组织甚至监管机构易受网络攻击的影响。
正如任何首席执行官都会说的那样,Beguir 告诉我,Instadeep 和 BioNTech 在处理医疗数据时非常谨慎,尤其是在目前的合作中使用人工智能来增加数据资产,使他们能够识别精确的蛋白质序列,并有可能解锁新的癌症和其他免疫疗法的应用目标。
但是两家公司使用的数据有所不同。BioNTech处理个人的真实患者数据,而Instadeep通常基于公开可用的数据开发和训练模型。例如,它就是这样训练了其Nucleotide Transformer,这是一个AI基因组学系列模型,如今它是全球下载量最大、最受欢迎的AI基因组学模型。[部分原因在于这一点开源协议(如果指的是交易或协定,可能是"开源交易/协定",但通常"deal"在此上下文更常指协议或安排)原文较为笼统,建议根据具体语境调整。若坚持原意直接翻译,则为:"开源交易".]
“Instadeep是在公共数据上开发和训练了核苷酸模型,”Beguir指出。“然而,当我们要将该模型部署到特定应用场景和真实患者数据时,我们是在BioNTech层面进行的,在那里作为生物制药领域领先企业之一,它在严格的监管要求下运作,并遵循严格的质量协议。”
当被问及Instadeep在BioNTech的下一个里程碑是什么时,Beguir提到了该公司的“最新突破”:贝叶斯流网络(BFN),这是一种新的用于蛋白质的生成式AI模型,据公司称,其性能远远超过了自回归和扩散模型。BioNTech首席执行官Ugur Sahin在一份声明中将其描述为“最先进的技术”。
根据Beguir的说法,该模型通过允许系统在抗体的重链上搜索特定属性(包括化学特性、疏水性或序列长度)来生成市场上最自然和行为最佳的蛋白质。这样的模型对于理解复杂的蛋白质功能以及工程新型治疗性蛋白质至关重要。
“我们对我们这样的AI创新能够识别真实用例、与BioNTech密切合作以及在实验室和诊所中进行测试的产品的潜力感到兴奋,这些产品最终将拯救患者的生命,”贝吉尔说。“如果你考虑我们现在在生物学和人工智能领域的地位,这类似于我们在2020年使用GPT-3时自然语言处理领域的情况。系统开始发挥作用,并且它们的能力令人印象深刻,但仍有许多改进的空间。”
Instadeep上周发布了新的AI模型,并推出了一台新的接近艾级(近exascale)的超级计算机,据称这使得该合作项目在全球计算能力和基础设施方面跻身前100名,在H100 GPU集群方面进入全球前20名。
这两项发展都凸显了在BioNTech的领导下,Instadeep如何在多个生命科学应用场景中部署人工智能。另一方面,它独立处理其另一业务线,该业务线涉及工业优化的人工智能和深度强化学习。
一个例子是它持续了12年的自动化铁路规划和调度项目,该项目与德国铁路公司(德铁)这一长期合作伙伴以及欧洲最大的铁路运营商合作。同样地,这家总部位于突尼斯和伦敦的AI公司在开发其他工业优化应用场景方面也加大了努力,例如与德国法兰克福机场集团(Fraport)合作,利用人工智能优化复杂的机场运营。
“总体而言,我们也看到了AI代理在未来具有非常吸引人的潜力。我们认为工业优化和基于代理的系统与人类同事密切合作,将彻底变革工业效率。因此,这也是我们多年来一直在从事并将继续投资的一个领域,”Beguir指出。
与此同时,Instadeep公司在本月早些时候在旧金山推出了其DeepPCB(深度印刷电路板)产品的专业版,这是一款完全由强化学习驱动的自主AI辅助设计的硬件或印刷电路板。Beguir表示,该公司的竞争对手是在其运营领域内规模较小的人工智能初创公司,例如利雅得-basedIntelmatix.
Instadeep首席执行官为其公司在解决更复杂的AI应用场景方面的工作感到自豪,例如用于DNA或蛋白质组学的生成AI,以及用于组合优化的代理工作流程,并且避开像自然语言处理这样的简单应用。他声称,在BioNTech收购之外,这种创新在很大程度上推动了来自美国客户的兴趣(该公司现在在美国拥有两个办事处),以及整个欧洲的兴趣:特别是柏林、巴黎和英国。
尽管BioNTech花费了5亿美元收购Instadeep以增强其生物技术能力,但它为了这样的原因保持该人工智能公司的运营独立性,并资助其为生物技术行业以外的客户提供服务。
“因为我们通过在人工智能领域的领导地位为公司创造价值,而且人工智能技能可以在多个领域得到提升,”当被问及为什么BioNTech仍然允许这家AI公司在非生物科技项目上工作时,Beguir回答说。“技术栈是相同的,所以花在生物科技之外的AI工作时间根本不是浪费的时间。BioNTech还将在运营优化等领域部署InstaDeep,而这些领域不属于生物科技研发。”
Beguir解释说,虽然InstaDeep并不是被迫出售的,但自2019年以来与BioNTech共享的愿景和成功项目,在收购之前很久就已经说服了这家AI公司推进这笔交易。他认为多年合作建立的信任是为什么InstaDeep在BioNTech旗下仍将保持独立的原因。现在对于InstaDeep来说,关键是继续保持其发展势头,维持高质量的结果,并尽可能长时间地不断创新。
自收购以来,InstaDeep 的员工总数已超过 400 人,遍布全球。这包括位于非洲的团队,在基加利的新办公室工作,该团队负责公司的地理空间智能工作。
最初,这项工作是与谷歌合作的一项实地项目,旨在检测非洲的蝗虫繁殖地。如今,Instadeep利用过去的数据标签和卫星图像以80-85%的准确率预测未来30天内可能出现的蝗虫繁殖地。Beguir表示,该公司开发的框架InstaGeo使用了来自NASA或欧洲航天局(ESA)的多光谱卫星图像,并且是开源的,可供其他公司用于在整个大陆范围内开发可扩展解决方案。
这是一个真实例子,展示了人工智能技术对实际影响。通过卫星而不是在地面收集样本或依赖地面基础设施,我们可以大规模提供这些洞察,并通知多个政府和行动方来应对粮食安全日益增长的挑战,尤其是在考虑到该大陆气候问题的情况下。