OC

Knowledge OS
OC Tech

#科学 AI

科技频道标签:科学 AI

OpenAI 做 GeneBench-Pro,不是炫模型,而是在承认科研 AI 还不会做判断
2026-07-01
AI 模型与产品

OpenAI 做 GeneBench-Pro,不是炫模型,而是在承认科研 AI 还不会做判断

据 OpenAI 官方博客 介绍,GeneBench-Pro 是一个面向计算生物学的新基准,用来评估 AI 在真实科研分析里的“判断能力”。它包含 129 个问题,覆盖基因组学、定量生物学和转化医学等领域。OpenAI 称,当前最强模型 GPT-5.6 Sol 在最高推理级别下通过率为 28.7%,开启 Pro 模式后