人工智能在生物技术领域的失败?对真正重要的事情进行现实检验 - Inc.
在快节奏的生物技术和人工智能世界中,头条新闻往往超出了人们的理解。生物制药行业出版物《Endpoints News》最近发表的一篇文章,题为“在该领域的现实检验中,人工智能在皮带-BIOS 绑定竞赛中表现不佳:‘没有人做得很好’”,引发了科技和生物技术社区的争论。但这种关于人工智能在生物学上的失败的叙述忽略了关于人工智能、数据和科学进步的本质的关键点。
背景下的竞赛h2>
本文讨论了一场竞赛,其中人工智能模型的任务是预测生物学的基本过程。这种相互作用对于药物开发至关重要,准确预测这些相互作用的能力可能会彻底改变药物发现。
比赛结果并不理想,1,950 个参赛队伍的 AI 模型没有一个达到比随机猜测更好的准确度。值得注意的是,以先进的小分子计算方法而闻名的重量级玩家缺席,例如 Nimbus Therapeutics 和 Relay Therapeutics。
文章在视频之后继续。
结果强调了问题的复杂性,并表明需要重新评估我们在该领域的人工智能预测方法。
了解人工智能的真正潜力。
为了真正理解这场比赛的意义,我们需要超越表面的结果。以下是需要考虑的几个要点:
- 先验的力量:人工智能模型与人类一样,在拥有坚实的相关知识基础时表现最佳。正如麻省理工学院 FutureTech 基础人工智能小组负责人、Somite.ai 首席技术官兼我的联合创始人乔尼·罗森菲尔德 (Jonny Rosenfeld) 指出的那样:“如果你懂英语,你会更快地学习西班牙语,并且比不懂英语时需要的示例更少。根本没有语言。”同样的原则也适用于专业领域的人工智能。
- 数据为王:AI 模型的性能本质上取决于其训练数据的质量和数量。
- 规模法则很重要:人工智能功能通常遵循可预测的规模法则。性能改进可能需要更多数量级的数据和计算能力。现在看来的失败可能是通过增加资源实现突破性能的垫脚石。
- 人的因素:在数据稀缺的领域,能够直观地填补知识空白的人类专家仍然非常宝贵。
展望未来:真正的挑战和机遇。
我们不应该过早地判断人工智能在生物技术领域的能力,而应该关注:
- 改进数据生成:改变生物学数据生成的“单位经济学”至关重要。例如,人类基因组测序的成本已从 2000 年代初期的数十亿美元下降到如今的 100 美元左右,从而催生了围绕基因组数据的整个生态系统的发展。
- 了解领域细节:每个生物学问题都有独特的特征。成功将来自于深入理解这些细节并相应地定制人工智能方法。
- 现实的期望:人工智能不是魔法。它是一个强大的工具,需要适当的条件才能蓬勃发展。根据可用数据和领域理解设定切合实际的期望是关键。
- 长期愿景:将人工智能应用于复杂生物问题的进展可能是渐进的。重点应该是持续改进并从每次迭代中学习。
最近的竞赛结果并不意味着生物技术领域人工智能的末日。相反,他们强调需要更细致地了解人工智能在专业科学领域的能力和局限性。
罗森菲尔德强调,“从很多意义上说,我们才刚刚开始。毫无疑问,人工智能将彻底改变生物学。实现这一目标关键取决于科学严谨性和工程方法。不要寻找捷径;寻找积累方法感兴趣的过程背后的数据。”
罗森菲尔德的一个重要见解是,“只有通过改变数据生成的单位经济学,才能加速数据生成。”这凸显了该领域的根本挑战和机遇。通过创新生成、收集和处理生物数据的方式,我们可以极大地加快对细胞分化等复杂生物过程的理解。这反过来可能会导致细胞治疗和药物发现等领域的突破。
真正的故事并不是关于人工智能当前的局限性。这是关于当我们克服这些最初的障碍时所面临的令人兴奋的潜力。正如我们在蛋白质折叠方面所看到的那样,当适当的条件符合时,人工智能可以推动生物学取得前所未有的进步。释放人工智能在生物技术领域全部潜力的关键不仅在于改进人工智能算法,还在于彻底改变我们的生物数据生成和解释方法。