Claude Science 把科研 AI 做成工作台,但科学家不能把复核交出去
据 Anthropic 官方博客 介绍,Claude Science 是一个面向科学家的 AI 工作台,集成文献检索、代码执行、专业数据库、计算资源管理、图表和论文草稿生成,并为每个输出保留可审计的生成历史。它目前以 beta 形式向 Claude Pro、Max、Team 和 Enterprise 用户开放。
林岚
据 Anthropic 官方博客 介绍,Claude Science 是一个面向科学家的 AI 工作台,集成文献检索、代码执行、专业数据库、计算资源管理、图表和论文草稿生成,并为每个输出保留可审计的生成历史。它目前以 beta 形式向 Claude Pro、Max、Team 和 Enterprise 用户开放。
这不是又一个“帮科学家聊天”的产品。Anthropic 想做的是把 PubMed、Jupyter、R、HPC、蛋白结构查看器、基因组浏览器、数据库连接器和 reviewer agent 放进同一个会话环境里。科学家不只问一个问题,而是在同一个工作台里跑分析、改图、查引用、提交计算任务、复核结果。

最值得注意的是“可审计 artifacts”。科研 AI 如果只是给出一段结论,基本没法用。研究者需要知道图是用什么代码生成的,数据从哪里来,环境是什么,引用是否真实,数字是否能追溯。Anthropic 称,Claude Science 会保留代码、环境、自然语言说明和消息历史,reviewer agent 还会检查引用、计算和图表是否对应底层代码。
这恰好和 OpenAI 的 GeneBench-Pro 形成对照。OpenAI 在测模型有没有科研判断,Anthropic 在把 AI 做成科研流程产品。一个在问“模型会不会做对”,一个在问“科学家怎样把模型放进真实工作流”。这两个问题都重要,而且互相制约:如果模型判断不可靠,工作台越顺手,越可能把错误扩散得更快。
Claude Science 还强调可以运行在本地机器、Linux 工作站、远程 SSH 或 HPC login node 上,敏感数据不一定要离开实验室已有系统。这个设计对科研很关键。生物医学数据、患者队列、药物研发数据都不是随便上传给 SaaS 的文件。科学家愿不愿意用 AI,很大程度取决于工具能否尊重他们已有的计算环境和数据边界。
但 OC 也要降温。Anthropic 举了药物设计、神经科学综述、肿瘤遗传学分析等案例,还提到有团队把两年才能写完的综述流程加速成多篇长文草稿。这样的效率听起来诱人,但越是长流程、跨数据库、跨代码和跨引用的结果,越不能只相信 agent 自己的 reviewer。复核可以被辅助,不能被外包。
林岚的判断是,Claude Science 的方向是对的:科研 AI 不应该停在聊天框,而应该进入工具链、计算环境和可复现 artifacts。问题也同样明确:科学不是把材料堆起来写成一篇看起来像论文的东西,科学需要可证伪、可追溯、可复查。Claude Science 如果能让科学家更快发现错误,它就是好工具;如果只是让错误更快变成漂亮图表,它就很危险。
参考来源
评论
围绕这篇文章补充信息、提出问题或分享观察。