哪种AI模型是国际象棋最好的？Google推出了新的Kaggle游戏平台

作者：Chess.com Team (CHESScom)

一种独特而有力的理解AI功能的方法，Kaggle游戏领域与Google DeepMind合作，宣布了一个新平台，领先的AI模型将在国际象棋和其他游戏中竞争。

为了开始，Kaggle将于8月5日至7日举办为期三天的AI展览国际象棋锦标赛，其中八个世界领先的AI模型。竞争对手包括Google，OpenAI，Anthropic的大型语言模型（LLM）以及其他实验室：

Gemini 2.5 Pro（Google）
双子座2.5 Flash（Google）
O3（Openai）
O4-Mini（Openai）
Claude 4 Opus（拟人化）
Grok 4（xai）
DeepSeek R1
Kimi K2（Moonshot AI）

ð¢介绍了Kaggle Game Arena：一个新的开放基准平台，顶级AI模型在流媒体比赛中参与复杂的战略游戏。我们正在为值得信赖的AI评估绘制新的边界，并从国际象棋开始，这是系统智能的经典证明基础。pic.twitter.com/ohbwbnnqtn
Kaggle（@kaggle）2025年8月4日

Chess.com将通过覆盖范围来帮助Kaggle将活动带给更广泛的观众事件页面以及每日新闻报道。该发布也与Take Take合作和国际象棋中的三个知名人士合作进行：

通用Hikaru Nakamura将在他的Twitch流中提供现场每日评论
我是利维·罗兹曼（Levy Rozman）也被称为Gothamchess，将在他的YouTube频道上提供每日回顾和分析。
比赛将以通用汽车的回顾结束马格努斯·卡尔森在Take Take Take网站上，他将分享对AI VS AI动作的见解。

比赛将遵循单淘汰格式，并根据初步测试比赛的种子。比赛结束后，将在Kaggle上提供连续更新的带有ELO式排名的排行榜，以跟踪所有参与模型的性能。这将使公众清晰地观察哪个AI是国际象棋最好的AI。

激动地宣布@kaggleGame Arena是一个新的排行榜测试，现代LLM在游戏中的表现（剧透：ATM不好！）。AI系统互相发挥作用，使其成为客观和常绿的基准，随着它们的改善，它们将在难度方面扩展。https://t.co/0e2df2pbtx
demis hassabis（@demishassabis）2025年8月4日

Kaggle与Google Deepmind合作，该国际象棋销售的计算机计划彻底改变了国际象棋alphazero在2017年。从未向公众提供的Alphazero，当它仅使用强化学习并与自己玩了数百万游戏对抗自己时，它几乎无法想象的水平席卷了国际象棋世界，只使用四个小时来“学习”游戏。

alphazero著名地被击败斯托克鱼，世界上最强大的国际象棋计算机程序，单侧100场比赛。在2018年底，它将继续在1000场比赛中与Stockfish赢得第二场比赛。

但是，在Kaggle上竞争的AI模型远不及Alphazero的水平。与Alphazero不同，这些LLM是用于编码，写作和推理世界的通用工具，而不是专门针对国际象棋的编程。正如Chess.com所详述的那样，这些模型仍在学习并且众所周知非法举动和荒谬的辞职。

游戏平台的推出提供了一个独特的机会，可以观察各种AI模型的演变和改进。例如，许多LLM（例如Openai的Chatgpt和Google的双子座）目前估计在业余玩家的水平上玩。

尽管他们缺乏表现力量，但这些模型可以在每一步背后提供推理。根据Google的说法，这使我们能够超越静态分数，以了解AI在动态，竞争性的环境中的真正表现。

Kaggle Game Arena超越了棋盘游戏，因为这家数十亿美元的公司打算结合更复杂，多人游戏和现实世界的模拟环境。Kaggle将为整个AI社区开放，允许对模型在各种游戏中的表现有透明的了解。

OC

哪种AI模型是国际象棋最好的？Google推出了新的Kaggle游戏平台

关于《哪种AI模型是国际象棋最好的？Google推出了新的Kaggle游戏平台》的评论

发表评论

摘要

相关新闻

相关讨论