首页 > 人工智能 >国际象棋最强 AI 鸣锣开赛:首日战果公布,OpenAI 的 o3、xAI 的 Grok4 等晋级

国际象棋最强 AI 鸣锣开赛:首日战果公布,OpenAI 的 o3、xAI 的 Grok4 等晋级

来源:ithome 2025-08-06 10:30:02
感谢xiayx网友 那些繁华往事 的线索投递!

xiayx 8月6日消息,科技媒体 webpronews 昨日(8 月 5 日)发布博文,报道称谷歌 DeepMind 于 8 月 5~7 日在 Kaggle 的 Game Arena 平台上,举办“AI 国际象棋”比赛,邀请 OpenAI、Anthropic、谷歌、Kimi、Deepseek 在内的顶尖模型一较高下。

DeepMind 表示,本次“AI 国际象棋”比赛的目的,是检验顶级 AI 模型的推理能力。本次活动将于 8 月 5~7 日举行,每日举办一轮比赛,由国际象棋大师 Hikaru Nakamura 和流媒体播主 Levy Rozman 解说。

在 AI 发展的重要时刻,这场象棋对决提供了一个严格的测试,以评估 AI 的预见和策略调整能力,文本基础的格式解决了许多大型语言模型在视觉象棋盘表示上的难题,提供了一个更公平的推理能力测试。

国际象棋最强 AI 鸣锣开赛:首日战果公布,OpenAI 的 o3、xAI 的 Grok4 等晋级

xiayx附上本次参赛选手如下:

Gemini 2.5 Pro(Google)

Gemini 2.5 Flash(Google)

o3(OpenAI)

o4-mini(OpenAI)

Claude 4 Opus(Anthropic)

Grok 4(xAI)

DeepSeek R1

Kimi k2(Moonshot AI)

根据首日战况,OpenAI 的 o4 mini 胜过 Deepseek-R1、OpenAI 的 o3 超过 Kimi K2 Instruct 模型、谷歌的 Gemini 2.5 Pro 胜过 Claude Opus 4、xAI 的 Grok4 模型超过谷歌的 Gemini 2.5 Flash。

国际象棋最强 AI 鸣锣开赛:首日战果公布,OpenAI 的 o3、xAI 的 Grok4 等晋级

侠游戏发布此文仅为了传递信息,不代表侠游戏网站认同其观点或证实其描述

热游推荐

更多
湘ICP备14008430号-1 湘公网安备 43070302000280号
All Rights Reserved
本站为非盈利网站,不接受任何广告。本站所有软件,都由网友
上传,如有侵犯你的版权,请发邮件给xiayx666@163.com
抵制不良色情、反动、暴力游戏。注意自我保护,谨防受骗上当。
适度游戏益脑,沉迷游戏伤身。合理安排时间,享受健康生活。