2025-10-20 09:00:00 · 英文原文

马斯克向传奇 AI 研究员 Karpathy 发起挑战，要求与 Grok 5 进行 AI 编码对决——在类似 IBM Deep Blue 的对决中，马斯克被礼貌地拒绝了

作者：Luke JamesSocial Links NavigationContributor

（图片来源：Shutterstock）

埃隆·马斯克有建议的xAI 的 Grok 5 和前 OpenAI 研究负责人 Andrej Karpathy 之间的公开编码竞赛，将其与 1997 年 Garry Kasparov 和国际商业机器公司— 深蓝。卡帕蒂拒绝了，并表示他宁愿与 Grok 合作，也不愿与其竞争。

这项挑战是对 Karpathy 最近在 Dwarkesh Podcast 上接受采访的一段片段的回应，他在其中认为 AGI 可能还需要十年的时间，并称 Grok 5 落后于 GPT-4 几个月。

马斯克曾表示，Grok 5 有 10% 的机会达到 AGI，而且这一可能性还在不断上升，他将此视为一个邀请：“你想参加人工智能编码竞赛吗？”他在 X 上发帖，直接标记了 Karpathy。

您提出了很多很好的观点，尤其是孩子们应该尽早学习物理工具。您是否想参加人工智能编码竞赛或任何您喜欢的 Andrej vs Grok 5、Kasparov vs Deep Blue 等任何形式的比赛？2025 年 10 月 18 日

卡帕蒂回答说，在这样的对决中，他的贡献将“趋向于零”，并强调他将当前的模型更多地视为合作者而不是对手。

正式的模型与人类编码竞赛的想法并不牵强。DeepMind 今年早些时候表示，Gemini 2.5 在 ICPC 世界总决赛条件下解决了 12 个问题中的 10 个问题，达到了金牌水平。OpenAI 和 DeepMind 现在都在使用 GPT-4 和 GPT-5 的相同基准测试中取得了完美的 12/12 分数。这些问题来自大学级别的算法竞赛，根据正确性和运行时性能进行评判，并在严格的资源和时间限制下运行。

今年早些时候，一位波兰程序员击败 OpenAI 的定制模型在 AtCoder 世界巡回赛总决赛上，一场长达 10 小时的正面对决决赛中，人们猜测这可能是人类在最高级别比赛中的最后一场胜利。那场比赛受到严格控制并且完全透明。

如果马斯克希望 Grok 5 在该课程中得到认真对待，他需要让其满足相同的条件。仅当匹配可衡量时，深蓝比较才有效。这意味着使用公共问题集进行固定长度的竞赛，使用相同的工具和计算，并且没有外部推理或人工协助。结果需要独立评分并完整发布。

将 Tom's Hardware 的最佳新闻和深入评论直接发送到您的收件箱。

卡帕蒂不参与的决定反映了机器学习从业者谈论性能的方式发生了更广泛的转变。现在，许多人不再进行面对面的竞赛，而是关注模型如何加速人类产出。但竞争性节目仍然提供了清晰且明确的基准。到目前为止，Grok 尚未发布分数。

如果 xAI 想要展示同等或优越性，那么在 ICPC 级任务上的正式运行将是明显的起点。

跟随Google 新闻上的 Tom's Hardware，或者将我们添加为首选来源，在您的源中获取我们的最新新闻、分析和评论。

卢克·詹姆斯 (Luke James) 是一名自由撰稿人和记者。虽然他的背景是法律，但他个人对所有科技领域都感兴趣，尤其是硬件和微电子，以及任何监管领域。

关于《马斯克向传奇 AI 研究员 Karpathy 发起挑战，要求与 Grok 5 进行 AI 编码对决——在类似 IBM Deep Blue 的对决中，马斯克被礼貌地拒绝了》的评论

暂无评论

发表评论

摘要

埃隆·马斯克 (Elon Musk) 提议在 xAI 的 Grok 5 和 Andrej Karpathy 之间举办一场公开编码竞赛，并将其与卡斯帕罗夫 (Kasparov) 与深蓝 (Deep Blue) 的比赛进行比较。卡帕蒂拒绝了，他更喜欢合作而不是竞争。这一挑战源于 Karpathy 的说法，即 AGI 还需要十年的时间，Grok 5 落后于 GPT-4。马斯克认为这是一场竞赛的邀请，但卡帕蒂强调，当前的模型更具协作性，而不是竞争性。为了建立 Grok 在编码竞赛中的可信度，xAI 需要让它遵守类似于 DeepMind 和 OpenAI 在算法竞赛中使用的严格条件。

OC

马斯克向传奇 AI 研究员 Karpathy 发起挑战，要求与 Grok 5 进行 AI 编码对决——在类似 IBM Deep Blue 的对决中，马斯克被礼貌地拒绝了

关于《马斯克向传奇 AI 研究员 Karpathy 发起挑战，要求与 Grok 5 进行 AI 编码对决——在类似 IBM Deep Blue 的对决中，马斯克被礼貌地拒绝了》的评论

发表评论

摘要

相关新闻

相关讨论