该技术对于科学发现确实很有用,但是其应用比您想象的要戏剧化。

由Elevenlabs和音频的新闻(NOA)使用AI叙述。听NOA应用程序上的更多故事。
听到硅谷说的话,疾病的终结正处于途中。不是因为肿瘤学研究或对美国的某些解决方案正在进行医生短缺,但由于(还有什么?)生成AI的进步。
Demis Hassabis是AI研究的诺贝尔奖获得者,也是Google DeepMind的首席执行官说周日,他希望AI能够解决重要的科学问题,并在五到十年内治愈所有疾病。本月初,OpenAI发行新模型并吹捧他们产生和批判性地评估生物学中新型假设的能力以及其他学科。(以前,Openai首席执行官Sam Altman有告诉唐纳德·特朗普总统,我们将看到疾病以前所未有的速度治愈。写去年秋天,他期望AI消除大多数癌症。
显然,这些都是高管营销他们的产品,但是在这些预测中甚至还有可能的内核吗?如果生成的AI可以丝毫贡献,就像自AI BOOM开始以来所承诺的那样,技术和科学家使用它甚至会从哪里开始?
我花了几周的时间与大学,主要公司和研究机构的科学家和高管进行交谈,包括辉瑞,现代和纪念斯隆·凯特(Sloan kettering Cancer)癌症中心,以了解技术可以(也不能)做些什么来推进他们的工作。AI公司肯定会有很多夸张:即使明天,OpenAI或Google模型提出了一种似乎可以可靠地治愈一种癌症的药物,该药物也需要多年的实验室和人体试验来证明其在现实世界中的安全性和功效,AI计划是AI计划的安全性和功效远处能够模拟。生物技术公司Insilico Medicine的首席执行官Alex Zhavoronkov是生物技术公司的首席执行官Alex Zhavoronkov。
然而,Insilico还使用AI来帮助设计多种成功的药物清除早期试验。使哈萨比斯成为诺贝尔奖获得者的AI模型被称为Alphafold,被药物和生物医学研究人员广泛使用。我了解到,生成的AI对科学有很大贡献,但是它的应用不可能像创建者那样更广泛地建议您更像更快的引擎,而不是自动驾驶汽车。
目前有两种生成的AI有助于科学和数学发现。第一个本质上是聊天机器人:搜索,分析和合成科学文献以产生有用报告的工具。梦想最终能够以简单的语言向这种程序询问罕见疾病或未经证实的定理并获得变革性的见解。我们不在那里,也许永远不会。但是,即使是当今存在的机器人,例如Openai和Google的独立研究产品也有其用途。科学家使用的工具用于信息处理和摘要,MIT的化学家RafaelGãmez-Bombarelli告诉我,他对材料设计申请了AI。您可以询问深入的研究,而不是搜索10篇论文并阅读10篇论文。每个人都这样做;他说,这是一个既定的胜利。
好的科学家知道检查AI的工作。哥伦比亚研究癌症的计算生物学家安德里亚·卡利卡诺(Andrea Califano)告诉我,他在近期手稿时向Chatgpt和Deepseek寻求帮助,这对他来说是一种正常的做法。但是这次,他们提出了一个令人惊叹的清单,其中包括参考文献,人物,论文,出版物等,而没有一个存在。”Openai有成立它最先进的型号O3和O4-Mini实际上是两到三次更多的比他们的前任O1自信地宣布虚假或幻觉。(这是O4米尼的预期,因为它接受了较少的数据培训,但Openai在一份技术报告中写道:“需要更多的研究来了解为什么O3以如此高的速度幻觉。)即使AI研究人员正常工作,他们的优势也是摘要,而不是新颖的。我认为这些机器人对这些机器人没有起作用,Gãmez-Bombarelli说,“是的,是对思想的新理由。从某种意义上说,这些程序可能会失败:经过培训可以综合现有的数据和想法,它们发明;当被要求发明时,他们挣扎。((大西洋与OpenAI建立了公司合作关系。)
为了帮助脾气和利用幻觉的趋势,将较新的AI系统定位为可以帮助判断思想的协作工具。一个这样的系统,宣布by Google researchers in February, is called the âAI co-scientistâ: a series of AI language models fine-tuned to research a problem, offer hypotheses, and evaluate them in a way somewhat analogous to how a team of human scientists would, Vivek Natarajan, an AI researcher at Google and a lead author on the paper presenting the AI co-scientist, told me.Natarajan说,类似于与自己的国际象棋AI程序通过对抗自己的反对,共同科学家提出了假设,然后使用一项想法锦标赛来排名最高的质量。他的希望是给人类科学家,或者至少是一种更快地构思和实验的工具。
这些排名的有用性可能需要数月或数年的验证,而目前仍在人类科学家评估的AI共同科学家现在仅限于生物医学研究。但是它的某些输出已经显示出承诺。伦敦帝国学院的传染病研究员蒂亚戈·科斯塔(Tiago Costa)告诉我,他最近与AI共同科学家一起进行了一项测试。Costa和他的团队在一个关于细菌进化的尚未解决的问题上取得了突破,他们尚未发表这些发现,因此不可能在AI共同科学家的培训数据中。他想知道Google的系统是否可以实现突破本身。Costa和他的合作者向AI共同科学家提供了简要摘要,其中一些相关的引用以及他们试图回答的主要问题。运行两天后,该系统返回了五个相关且可检验的假设,而排名最高的假设与人类团队的主要实验结果相匹配。AI似乎提出了与他们所做的同样的真实发现。
该系统以简单的理由开发了其最高的假设,绘制了与另一个研究领域的链接,并得出了人类团队花费了数年才能得出的结论。ICL的微生物学家Josépenadâ©penadésjos-penadésjos-penadés告诉我。但是,没有这样的隧道视觉的AI共同科学家通过绘制直接的研究联系来找到了这个想法。他说,如果他们有这个工具和假设,那么这项研究将会更快地进行。PenadâS说,我很沮丧地意识到这是一个非常简单的答案。该系统没有构建新的范式或闻所未闻的概念。它只是有效地考虑了大量信息,事实证明这足够好。随着人类科学家已经产生并且不断产生了大量知识,也许最有用的AI可能不会使这种能力自动化,而是对其进行补充。
从某种意义上说,第二种科学AI的目的是说生物学语言。Alphafold和类似程序不是在Internet文本上而是在实验数据上进行培训,例如蛋白质和基因表达的三维结构。这些类型的模型迅速采用了从数据中汲取的模式,即使是大批人类研究人员也可以在一生中分析的模型。当然,更传统的机器学习算法已经以这种方式使用了很长时间,但是生成的AI可以增强这些工具,使科学家能够找到将较老的药物重新用于不同疾病的方法,或者识别身体中有希望的新受体以一种治疗靶向,以治疗为例,仅为两个例子。辉瑞肿瘤学的科学事务负责人Sriram Krishnaswami告诉我,这些工具可以大大提高时间效率和成功的可能性。例如,辉瑞公司使用内部AI工具来识别两个可能有助于治疗乳腺癌和前列腺癌的靶标,这些目标目前正在测试中。
同样,生成-AI工具可以通过在进入实验室或试验之前更有效地平衡各种分子特征,副作用或其他因素来帮助药物设计。任何可能的药物的构型和相互作用的数量都非常大:有10秒¶âââââââismmRNA序列可以现代数字业务负责人韦德·戴维斯(Wade Davis)(包括AI-Prouduct Team)的现代销售中,生产用于共同疫苗的尖峰蛋白。超出了宇宙中原子数量的数十个数量级。生成的AI可以大大减少值得探索的序列数量。
马里兰大学使用AI方法的化学物理学家Pratyush Tiwary可能会通过AI发现的药物,它可能不会有一种药物。``有一些好的公司正在努力,但是AI将要做的是帮助减少搜索空间,以减少科学家自行进行调查的可能性数量。这些AI模型是针对图形计算器和制图软件等生物学家的:您可以更快地构思,但是您仍然必须建造桥梁并确认它在驾驶它之前不会崩溃。
因此,AI的最终成就可能只是要大幅提高科学效率,这与聊天机器人在任何数量的普通办公室工作中都没有不同。在考虑整个药物开发生命周期时,我们如何压缩时间?MSK的首席战略官Anaeze Offodile II告诉我。人工智能技术可能会从该生命周期中刮掉数年,尽管还将保留更多的年。Offodile认为,Insilico的Zhavoronkov说,AI可以帮助您减少整个过程并增加成功的可能性,从而减少了20年的减少。
当然,这些生物学模型的能力有很大的局限性。例如,尽管生成的AI在确定蛋白质结构方面非常成功,但类似程序经常表明实际上无法合成的小分子结构。也许最大的瓶颈是使用生成的AI来彻底改变生命科学,做出有用的预测,这不仅是蛋白质如何折叠或与特定受体结合的相对受约束的领域,而且在整个人体之间和人体之间的复杂信号级联对于从相关生物学实验中收集的高质量训练数据的稀缺。加利福尼亚州说,最重要的是不是设计最好的算法。”最重要的是提出正确的问题。
但是也许他们可以与人类合作者在一起。Gã³mez-Bombarelli是Lila Sciences材料的首席科学官,该公司的创业公司已建立了一家实验室通过人类科学家和生成性AI的组合可以指导的设备,允许模型在循环中测试和完善假设。Insilico在中国也有类似的机器人实验室,而Califano是Chan Zuckerberg倡议的全球努力的一部分模拟任何数量的人类生物过程。产生新思想并不是真正的问题。假设很便宜。但是评估假设耗资数百万美元。
将数据扔进盒子并摇动它在处理人类语言方面取得了令人难以置信的结果,但这足以治疗疾病。设计了促进科学的AI模型的人必须了解问题,提出适当的问题并策划相关数据,然后实验验证或反驳任何结果AI系统的输出。换句话说,为科学建造AI的方法是做一些科学。
关于作者
Matteo Wong是在大西洋。