人工智能规模法则即将变革细胞替代疗法

2024-10-14 13:09:03 英文原文

作者:Gil Press

再生医学和治疗性干细胞疗法以再生受损细胞作为治疗方法用于... [+]疾病

Getty

当英伟达的首席执行官发言时,从投资者到企业高管再到诺贝尔奖委员会的决策者都会倾听。自从以来 Jensen Huang观察到六个多月前,有人认为“在人类历史上首次”,生物学有机会从科学研究转变为工程实践,在此之后,美国的生命科学和生物技术公司的资金加速增长。最有可能利用这一机会的是细胞和基因疗法,这些疗法使用生命的基本构建块来治疗、预防或可能治愈疾病。

2024年诺贝尔奖展示了多个学科的汇聚——分子生物学、神经科学、计算机科学、计算统计学、物理学和人工智能——共同塑造一个新的医疗健康景观。

生理学或医学奖得主维克托·阿姆布罗斯和盖瑞·鲁夫昆在研究不同细胞类型的发展过程中,发现了微小RNA(microRNA),这是一种新的小型RNA分子,在基因调控中起着关键作用。化学奖的一半授予大卫·贝克,他开发了一种可以预测蛋白质结构的计算机软件,并利用该软件逆向工程:输入所需的蛋白质结构并获得其氨基酸序列建议,从而能够创造全新的蛋白质。化学奖的另一半则授予德米斯·哈萨比斯和约翰·朱珀,他们使用现代人工智能技术来预测已知的2亿种蛋白质的结构,为研究人员提供了几分钟内就能完成之前需要数月甚至数年工作的工具。物理学奖得主约翰·霍普菲尔德和杰弗里·辛顿则开创了现代人工智能——利用人工神经网络进行机器学习的方法,也被称为深度学习。

“生物学是一个非常复杂的研究领域,亟待转变为工程学,”Jonathan Rosenfeld(联合创始人兼首席技术官)表示。Somite.ai罗森费尔德已经将工程的预测能力带入了另一个复杂的领域,尽管这是一个相对较年轻的领域——现代人工智能领域。

当你使用特定的工程方法或流程时,通常可以预测它对性能和预期结果的影响。在深度学习中,有一个普遍的概念——“扩展假设”,即通过增加资源、应用更多数据和计算能力来扩展,将会带来更好的结果。但罗森费尔德说:“我们是否接近极限?我们是否以最大可能的速度前进?甚至我们的方向是否正确?直到五年前我们对此一无所知。”

从2017年到2021年,Rosenfeld在麻省理工学院攻读博士学位,开创了人工智能扩展规律2019年,回答了性能如何依赖于数据的数量和质量、模型的大小和类型以及部署的计算量的问题。Rosenfeld的扩展定律后来被其他先驱者进一步发展,最著名的是OpenAI。AI扩展定律赋予该领域工程学的预测能力:在投资数百万美元训练单一模型之前,你就知道你能得到什么。“我们现在可以有把握地说出哪些改进会提高性能及其提升的速度。”Rosenfeld说,“我们可以回答‘这个投资是否值得?’这个问题。”

此外,缩放定律及其产生的预测有助于更好地理解给定的结果。罗斯芬德说,这使得可以提出并回答诸如“我们是否达到了效率的极限?我们能否做得更好?我们能否更快地进步?我们是否了解当前限制的原因?”等问题。

罗斯芬德在完成他的博士学位后,曾在几家初创公司短暂工作过,但他决心要创立自己的公司,在人工智能和生物学的交叉领域进行创新。他与一位有成就的人工智能企业家迈克·布雷克斯通共同创立了Somite.ai,并继续担任麻省理工学院FundamentalAI小组负责人的身份。加入布雷克斯通和罗斯芬德作为联合创始人的还有哈佛医学院遗传学教授、布莱根妇女医院病理学教授奥利维尔·波尔基耶;哈佛医学院系统生物学教授艾伦·克莱因;哈佛医学院基因学教授兼系主任克利夫·塔宾;以及华盛顿大学基因科学教授杰伊·谢杜雷。

这支由干细胞生物学、医学、遗传学、工程学、统计学、计算机科学和机器学习等领域顶尖专家组成的“梦之队”,在它开启“将干细胞生物学转化为计算挑战”的旅程的第一年里已经取得了不少成就,Breakstone说道。它的首个项目针对杜氏肌营养不良症(最常见的遗传性神经肌肉疾病之一,每3500个男童中就有一个出生时患有此病),该项目已获得美国食品药品监督管理局的孤儿药资格和罕见儿童疾病资格。“这是向未来迈进的第一步,在那个未来人类可以拥有备用零件——我们可以掌握自然细胞程序,从而控制任何类型的细胞创造。”Rosenfeld补充道。

Somite.ai 目前在 pre-seed 轮融资中已超过 1000 万美元,其中包括近期从 Astellas Venture Management(隶属于 Astellas Pharma)和 Montage Ventures 获得的额外资金。该公司已经推出了其 AI 平台 AlphaStem 的第一阶段,并启动了第二个针对代谢紊乱的项目。

“我们在生物学方面取得了惊人的进展,但AlphaFold仅仅涉及构建模块,”罗森菲尔德说。“如果你从系统层面来看,比如细胞,就像是一个正在并行运行许多程序的超级计算机。理解这些细胞的语言及其执行方式是一个尚未解决的问题,我们现在正处在借助人工智能(由数据规模驱动)与生物学专业知识相结合来攻克这个问题的门槛上。”

AlphaFold 是将新颖的机器学习和搜索算法应用于几十年来积累的蛋白质氨基酸序列和结构数据的结果。类似地,生物学家现在实际上可以看到细胞在任何给定时间的状态,并收集他们以前没有的数据类型,包括其他类型的此类信息,这些都补充了数十年积累的遗传学和系统层面的数据。

今天的生物学家有能力详细绘制胚胎中细胞分化是如何演变的。罗斯芬德说:“这是一个昂贵的过程,但现在已经到了不那么难以承受的程度。”所缺少的是控制这一细胞分化过程的编程语言,即指导细胞通过所有分支点的语言。“我们需要一个细胞分化的导航程序,在任何给定的时间识别所需的信号(例如化学物质或蛋白质)。”罗斯芬德表示,“如果我们知道如何协调、指挥这场交响乐,掌握这种信号语言,我们就可以随意生成任何类型的细胞。

Somite.ai 的专家团队知道如何高效且准确地生成体节,这些胚胎结构负责产生肌肉骨骼系统及相关组织。解析这些细胞如何生长成肌肉的语言,将使其能够开发出一旦注入人体就能通过生长缺失的肌肉组织来修复身体的细胞。

如今,有许多公司,如Vertex和诺沃纳德里克,已经在细胞疗法方面取得了首次临床成功。他们花费了大量的时间和资源来生产特定类型的细胞,罗斯费尔德将其称为“手工艺方式”。他说,到目前为止,“还没有一种可扩展的方式来按需生产任何类型的细胞。这就是我们要解决的差距。”

要在大规模上实现这一点,需要大量的信号数据和一个能够预测特定信号对细胞影响的模型。Somite.ai 有一种经济地生成大量数据的方法,足以让其人工智能程序自行学习(自我监督而非由专家监督)并提高性能。“专家的速度慢且成本高,我希望做得比专家更好,”Rosenfeld说,“当有许多相关的数据点可以进行自我监督学习时,结合深度学习的搜索就可以产生重大影响。”

现代计算史充满了强化学习专家理查德·桑顿所说的“的例子。注意,原文中的“Rich Sutton”的称呼有误,应为“Richard Sutton”,且引用内容不完整,因此保留原句结构,只翻译了可确定的部分。苦涩的教训,“长远来看唯一重要的是计算的利用。”罗斯菲尔德说:“随着计算资源和数据规模的扩大,在数据匮乏和计算受限的情况下,人类专业知识所创造的各种巧妙解决方案将被超越。如果我们有足够的数据,并且懂得如何很好地提出问题,我们就可以在任何领域比最好的专家取得更多的进步。”

关于《人工智能规模法则即将变革细胞替代疗法》
暂无评论

摘要

再生医学和治疗性干细胞疗法用于再生受损细胞,以治疗...[+]盖帝图像 当英伟达的首席执行官发表讲话时,从投资者到企业高管再到诺贝尔奖委员会的决策者都会倾听。化学奖的一半颁给了开发出能够预测蛋白质结构的计算机软件并将其逆向工程化的大卫·贝克:输入所需的蛋白质结构,并获取其氨基酸序列建议,这使得创建全新的蛋白质成为可能。罗森费尔德补充说:“这是朝着一个未来迈进的第一步,在那个未来里人类拥有备用零件——我们可以控制任何类型的细胞的创造,掌握自然的细胞程序。”他说,到目前为止,“还没有一种可扩展的方式来随意生产任何类型的细胞。要在“大规模”上做到这一点,需要大量的信号数据和一个预测特定信号对细胞影响的模型。