科技 · 2026-07-01 · AI 模型与产品 · 阅读 8

Claude Science 把科研 AI 做成工作台，但科学家不能把复核交出去

据 Anthropic 官方博客介绍，Claude Science 是一个面向科学家的 AI 工作台，集成文献检索、代码执行、专业数据库、计算资源管理、图表和论文草稿生成，并为每个输出保留可审计的生成历史。它目前以 beta 形式向 Claude Pro、Max、Team 和 Enterprise 用户开放。

作者

林岚

这不是又一个“帮科学家聊天”的产品。Anthropic 想做的是把 PubMed、Jupyter、R、HPC、蛋白结构查看器、基因组浏览器、数据库连接器和 reviewer agent 放进同一个会话环境里。科学家不只问一个问题，而是在同一个工作台里跑分析、改图、查引用、提交计算任务、复核结果。

OC 原创解释图：Claude Science 想把碎片化科研工具整合成可审计工作台

最值得注意的是“可审计 artifacts”。科研 AI 如果只是给出一段结论，基本没法用。研究者需要知道图是用什么代码生成的，数据从哪里来，环境是什么，引用是否真实，数字是否能追溯。Anthropic 称，Claude Science 会保留代码、环境、自然语言说明和消息历史，reviewer agent 还会检查引用、计算和图表是否对应底层代码。

这恰好和 OpenAI 的 GeneBench-Pro 形成对照。OpenAI 在测模型有没有科研判断，Anthropic 在把 AI 做成科研流程产品。一个在问“模型会不会做对”，一个在问“科学家怎样把模型放进真实工作流”。这两个问题都重要，而且互相制约：如果模型判断不可靠，工作台越顺手，越可能把错误扩散得更快。

Claude Science 还强调可以运行在本地机器、Linux 工作站、远程 SSH 或 HPC login node 上，敏感数据不一定要离开实验室已有系统。这个设计对科研很关键。生物医学数据、患者队列、药物研发数据都不是随便上传给 SaaS 的文件。科学家愿不愿意用 AI，很大程度取决于工具能否尊重他们已有的计算环境和数据边界。

但 OC 也要降温。Anthropic 举了药物设计、神经科学综述、肿瘤遗传学分析等案例，还提到有团队把两年才能写完的综述流程加速成多篇长文草稿。这样的效率听起来诱人，但越是长流程、跨数据库、跨代码和跨引用的结果，越不能只相信 agent 自己的 reviewer。复核可以被辅助，不能被外包。

林岚的判断是，Claude Science 的方向是对的：科研 AI 不应该停在聊天框，而应该进入工具链、计算环境和可复现 artifacts。问题也同样明确：科学不是把材料堆起来写成一篇看起来像论文的东西，科学需要可证伪、可追溯、可复查。Claude Science 如果能让科学家更快发现错误，它就是好工具；如果只是让错误更快变成漂亮图表，它就很危险。

参考来源

Tag

Anthropic Claude Science AI Agent 科研工作台 MCP 可复现研究生物医学