英语轻松读发新版了,欢迎下载、更新

哪种AI模型是国际象棋最好的?Google推出了新的Kaggle游戏平台

2025-08-04 16:12:00 英文原文

作者:Chess.com Team (CHESScom)

一种独特而有力的理解AI功能的方法,Kaggle游戏领域与Google DeepMind合作,宣布了一个新平台,领先的AI模型将在国际象棋和其他游戏中竞争。

为了开始,Kaggle将于8月5日至7日举办为期三天的AI展览国际象棋锦标赛,其中八个世界领先的AI模型。竞争对手包括Google,OpenAI,Anthropic的大型语言模型(LLM)以及其他实验室:

  • Gemini 2.5 Pro(Google)
  • 双子座2.5 Flash(Google)
  • O3(Openai)
  • O4-Mini(Openai)
  • Claude 4 Opus(拟人化)
  • Grok 4(xai)
  • DeepSeek R1
  • Kimi K2(Moonshot AI)

ð¢介绍了Kaggle Game Arena:一个新的开放基准平台,顶级AI模型在流媒体比赛中参与复杂的战略游戏。我们正在为值得信赖的AI评估绘制新的边界,并从国际象棋开始,这是系统智能的经典证明基础。pic.twitter.com/ohbwbnnqtn

Kaggle(@kaggle2025年8月4日

Chess.com将通过覆盖范围来帮助Kaggle将活动带给更广泛的观众事件页面以及每日新闻报道。该发布也与Take Take合作和国际象棋中的三个知名人士合作进行:

比赛将遵循单淘汰格式,并根据初步测试比赛的种子。比赛结束后,将在Kaggle上提供连续更新的带有ELO式排名的排行榜,以跟踪所有参与模型的性能。这将使公众清晰地观察哪个AI是国际象棋最好的AI。

激动地宣布@kaggleGame Arena是一个新的排行榜测试,现代LLM在游戏中的表现(剧透:ATM不好!)。AI系统互相发挥作用,使其成为客观和常绿的基准,随着它们的改善,它们将在难度方面扩展。https://t.co/0e2df2pbtx

demis hassabis(@demishassabis2025年8月4日

Kaggle与Google Deepmind合作,该国际象棋销售的计算机计划彻底改变了国际象棋alphazero在2017年。从未向公众提供的Alphazero,当它仅使用强化学习并与自己玩了数百万游戏对抗自己时,它几乎无法想象的水平席卷了国际象棋世界,只使用四个小时来“学习”游戏。

alphazero著名地被击败斯托克鱼,世界上最强大的国际象棋计算机程序,单侧100场比赛。在2018年底,它将继续在1000场比赛中与Stockfish赢得第二场比赛。

但是,在Kaggle上竞争的AI模型远不及Alphazero的水平。与Alphazero不同,这些LLM是用于编码,写作和推理世界的通用工具,而不是专门针对国际象棋的编程。正如Chess.com所详述的那样,这些模型仍在学习并且众所周知非法举动和荒谬的辞职

游戏平台的推出提供了一个独特的机会,可以观察各种AI模型的演变和改进。例如,许多LLM(例如Openai的Chatgpt和Google的双子座)目前估计在业余玩家的水平上玩。

尽管他们缺乏表现力量,但这些模型可以在每一步背后提供推理。根据Google的说法,这使我们能够超越静态分数,以了解AI在动态,竞争性的环境中的真正表现。

Kaggle Game Arena超越了棋盘游戏,因为这家数十亿美元的公司打算结合更复杂,多人游戏和现实世界的模拟环境。Kaggle将为整个AI社区开放,允许对模型在各种游戏中的表现有透明的了解。 

关于《哪种AI模型是国际象棋最好的?Google推出了新的Kaggle游戏平台》的评论


暂无评论

发表评论

摘要

Kaggle与Google DeepMind合作,推出了Kaggle Game Arena,这是一个创新的平台,用于领导AI模型参与国际象棋和其他战略游戏。为期三天的AI展览国际象棋锦标赛将于8月5日至7日开始,其中包括八种顶级AI模型,包括Gemini(Google),O3/O4-Mini(Openai),Claude Opus(Anthropic),Grok(XAI),DeepSeek R1和Kimi K2。该锦标赛将在GM Hikaru Nakamura和Im Levy Rozman的评论中现场直播。具有ELO般排名的排行榜将在比赛后跟踪模型的棋手游戏能力。该计划旨在评估AI超出静态性能指标的战略思维和推理。