英语轻松读发新版了,欢迎下载、更新

人工智能领域的新星使用机器人和自动化来加速他们的工作

2025-01-10 13:14:33 英文原文

作者:Nelson, Felicity

Composite image of portrait photographs of Aditya Nandy, Lauren Takahashi and David Kelley.

从左到右:阿迪亚·南迪、劳伦·高桥和大卫·凯利。图片来源:Aparna P. Sivakumar、Lauren Takahashi、Calico/Richard Morgenstein

David Kelley、Lauren Takahashi 和 Aditya Nandy 表示,人工智能 (AI) 并不是要取代科学家,而只是一种可以用来增强科学家工作的强大工具。

这些冉冉升起的新星是自然指数中最多产的早期职业研究人员之一AI相关输出。在这里,他们讨论了如何利用新的算法和模型来推进基因调控、材料开发和蛋白质动力学的研究。

大卫·凯利:基因调控解码器

当生物信息学科学家 David Kelley 于 2016 年从学术界转向工业界时,他感觉自己似乎正在步入一种竞争较少、协作性更强的文化。“这里的每个人实际上都在同一个团队中,”他在谈到他目前的工作场所 Calico Life Sciences(一家位于加利福尼亚州旧金山的生物技术公司)时说道。他还赞赏他的行业角色所带来的关注——公司的使命是了解控制人类衰老的生物学,并利用这些知识为与年龄相关疾病的治疗方法的开发提供信息。凯利说,这对他和他的同事来说是“指路明灯”,帮助他们优先考虑他们认为最有影响力的工作。

“如果我在大学,我想我会……被这个或那个问题分散注意力,”凯利说。– 然而,在工业界,你确实有一种强烈的吸引力:这真的很重要吗?这真的是我现在可以做的最重要的事情吗?

凯利正在研究基因调控作为与年龄相关疾病的潜在机制。基因调控是细胞控制其基因表达的过程,决定某些成分(例如蛋白质或 RNA)产生的时间、地点和数量。了解基因如何被控制的一大挑战是弄清楚某些 DNA 序列(称为增强子区域)如何与基因相互作用。增强子区域就像开关一样,可以打开基因,使其活跃。然而,这些开关可能距离它们控制的基因很远——远达一百万个DNA碱基对——使得寻找和研究其中许多连接变得很困难。

在发表于自然方法1凯利和他的合著者报告了一种名为 Enformer 的深度学习模型的开发,该模型可以预测基因变体的表达,包括那些与增强子有长距离相互作用的基因变体。凯利说,该模型“实际上只是几行代码”,但已成为一个强大的工具。“通过不断重复这种能够实现非常普遍的学习的单一数学运算,你可以获得人工智能的水平,这是相当惊人和深刻的。”

凯利对其领域的一大担忧是基因组学数据集中缺乏种族多样性。许多基因调控研究依赖于英国生物银行等资源的全基因组测序数据,该银行拥有 500,000 名参与者,其中约 95% 是白人2。他说,通过使用如此有限的数据集,研究人员错过了基因调控的重要线索。– 您确实想要分析世界上的所有变异,并了解这些遗传变异影响表型的所有方式。 –

另一个挑战是凯利的主要人工智能训练集是整个人类基因组序列,这是约 30 亿个碱基对的有限资源。“如果我们需要大量额外的训练数据,那么在哪里找到它并不完全明显,”他说。他的团队通过使用小鼠和人类的数据并同时训练两个物种的模型来发挥创造力。“这之所以有效,是因为我们共享细胞类型的监管驱动因素是高度保守的,”凯利说。“对更多灵长类动物或其他哺乳动物进行分析可能会取得丰硕成果。”

劳伦·高桥:催化剂工程师

劳伦·高桥 (Lauren Takahashi) 是日本札幌北海道大学的一名化学工程师和信息科学家,她在职业生涯的早期经历了一段曲折的道路。作为图森亚利桑那大学的本科生,她学习了语言学;然后,她转到瑞典哥德堡大学完成科学硕士学位,其中涉及构建原型搜索引擎。该程序旨在使用地图和位置来回答诸如“这是哪里?”或“我可以去哪里找到它?”等问题,而不仅仅是依靠搜索的热门结果,她说。

在瑞典期间,高桥参加了物理学家安德烈·海姆 (Andre Geim) 的讲座,后者因石墨烯实验而分享了 2010 年诺贝尔物理学奖 –包含单层碳原子的材料排列成六方格子。这次演讲启发高桥应用她对搜索引擎的理解来构建一个模型,研究人员可以使用该模型在创建石墨烯和其他二维材料时搜索科学文献以获取见解。

她说,这个项目最初只是一种爱好,但“它就像滚雪球一样越滚越大”。在这项工作的基础上,一位朋友邀请高桥加入位于筑波的日本国家材料科学研究所 (NIMS) 的一个研究项目,该研究所是该领域世界上最大的机构之一。在 NIMS 期间,她开始在东京大学攻读化学工程博士学位。

在北海道,高桥研究使用机器人和人工智能来生产高性能催化剂——加速化学反应的物质。她和她的同事们这样做的一种方法是在科学文献中搜寻可提高催化剂性能的实验条件。他们将这些信息输入人工智能系统,以便设计实验,以比现有方法更低的温度和更高的产量生产乙烯等化合物(塑料和其他材料的组成部分)3

“我们目前正在开发一款能够独立完成所有工作的机器人,”高桥说。未来,机器人可以与人工智能协同进行实验;收集和分析数据;预测新的条件、设置和催化剂组合;高桥和同事在 2023 年的一篇论文中写道,然后进行下一个实验4

高桥说,容纳自主的“机器人科学家”将是实验室的重大调整。– 机器人在人类开发的环境中很难发挥作用。如果我们要成功地使用人工智能,我们就必须考虑人工智能的需求,并在开发工作环境时将其纳入其中。”

关于《人工智能领域的新星使用机器人和自动化来加速他们的工作》的评论


暂无评论

发表评论

摘要

David Kelley、Lauren Takahashi 和 Aditya Nandy 是利用人工智能推进基因调控、材料开发和蛋白质动力学等科学领域的领先研究人员。Calico Life Sciences 的 Kelley 开发了 Enformer,这是一种预测基因表达与增强子区域相互作用的深度学习模型。高桥利用人工智能优化化学反应的催化剂性能,旨在开发能够独立进行实验的自主机器人。两者都强调需要多样化的数据集和适应性强的实验室环境来有效利用人工智能的潜力。