埃隆·马斯克有建议的xAI 的 Grok 5 和前 OpenAI 研究负责人 Andrej Karpathy 之间的公开编码竞赛,将其与 1997 年 Garry Kasparov 和国际商业机器公司— 深蓝。卡帕蒂拒绝了,并表示他宁愿与 Grok 合作,也不愿与其竞争。
这项挑战是对 Karpathy 最近在 Dwarkesh Podcast 上接受采访的一段片段的回应,他在其中认为 AGI 可能还需要十年的时间,并称 Grok 5 落后于 GPT-4 几个月。
马斯克曾表示,Grok 5 有 10% 的机会达到 AGI,而且这一可能性还在不断上升,他将此视为一个邀请:“你想参加人工智能编码竞赛吗?”他在 X 上发帖,直接标记了 Karpathy。
您提出了很多很好的观点,尤其是孩子们应该尽早学习物理工具。您是否想参加人工智能编码竞赛或任何您喜欢的 Andrej vs Grok 5、Kasparov vs Deep Blue 等任何形式的比赛?2025 年 10 月 18 日
卡帕蒂回答说,在这样的对决中,他的贡献将“趋向于零”,并强调他将当前的模型更多地视为合作者而不是对手。
正式的模型与人类编码竞赛的想法并不牵强。DeepMind 今年早些时候表示,Gemini 2.5 在 ICPC 世界总决赛条件下解决了 12 个问题中的 10 个问题,达到了金牌水平。OpenAI 和 DeepMind 现在都在使用 GPT-4 和 GPT-5 的相同基准测试中取得了完美的 12/12 分数。这些问题来自大学级别的算法竞赛,根据正确性和运行时性能进行评判,并在严格的资源和时间限制下运行。
今年早些时候,一位波兰程序员击败 OpenAI 的定制模型在 AtCoder 世界巡回赛总决赛上,一场长达 10 小时的正面对决决赛中,人们猜测这可能是人类在最高级别比赛中的最后一场胜利。那场比赛受到严格控制并且完全透明。
如果马斯克希望 Grok 5 在该课程中得到认真对待,他需要让其满足相同的条件。仅当匹配可衡量时,深蓝比较才有效。这意味着使用公共问题集进行固定长度的竞赛,使用相同的工具和计算,并且没有外部推理或人工协助。结果需要独立评分并完整发布。
卡帕蒂不参与的决定反映了机器学习从业者谈论性能的方式发生了更广泛的转变。现在,许多人不再进行面对面的竞赛,而是关注模型如何加速人类产出。但竞争性节目仍然提供了清晰且明确的基准。到目前为止,Grok 尚未发布分数。
如果 xAI 想要展示同等或优越性,那么在 ICPC 级任务上的正式运行将是明显的起点。
跟随Google 新闻上的 Tom's Hardware, 或者将我们添加为首选来源,在您的源中获取我们的最新新闻、分析和评论。