精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

鬧玩呢!首屆大模型對(duì)抗賽,DeepSeek、Kimi第一輪被淘汰了

人工智能 新聞
剛剛,我們拿到了第一輪比賽的結(jié)果:Gemini 2.5 Pro、o4-mini、Grok 4 和 o3 均以 4-0 的戰(zhàn)績(jī)分別擊敗 Claude 4 Opus、DeepSeek R1、Gemini 2.5 Flash 和 Kimi k2,晉級(jí)半決賽。

在玩游戲方面,到底哪個(gè)模型最厲害?為了回答這個(gè)問(wèn)題,谷歌近日發(fā)起了首屆大模型國(guó)際象棋對(duì)抗賽。

這場(chǎng)比賽為期三天,參賽選手包括:  

  • o4-mini(OpenAI)
  • DeepSeek-R1(DeepSeek)
  • Kimi K2 Instruct(月之暗面)
  • o3(OpenAI)
  • Gemini 2.5 Pro(谷歌)
  • Claude Opus 4(Anthropic)
  • Grok 4(xAI)
  • Gemini 2.5 Flash(谷歌)

剛剛,我們拿到了第一輪比賽的結(jié)果:Gemini 2.5 Pro、o4-mini、Grok 4 和 o3 均以 4-0 的戰(zhàn)績(jī)分別擊敗 Claude 4 Opus、DeepSeek R1、Gemini 2.5 Flash 和 Kimi k2,晉級(jí)半決賽。

以下是模型對(duì)陣圖。

這個(gè)比賽是在一個(gè)名叫「Kaggle Game Arena」的平臺(tái)上進(jìn)行的。這是 Kaggle 公司的一個(gè)新項(xiàng)目,旨在跳出平時(shí)的基準(zhǔn)測(cè)試框架,探索像 Gemini、DeepSeek 等 LLM 在動(dòng)態(tài)和競(jìng)爭(zhēng)環(huán)境中表現(xiàn)如何。

在昨天的報(bào)道中,我們?cè)敿?xì)描述了這場(chǎng)比賽的規(guī)則,比如不允許模型調(diào)用 Stockfish 等國(guó)際象棋引擎。

以下是對(duì)戰(zhàn)的詳細(xì)信息:

Kimi k2 對(duì)陣 o3:0-4

Kimi k2 與 o3 的對(duì)局較早結(jié)束,四局比賽都在八步棋內(nèi)完成。由于 Kimi k2 連續(xù)四次未能找到合法著法而被判負(fù),o3 獲得了全勝。 

不過(guò)需要說(shuō)明的是,與 o3 對(duì)戰(zhàn)的 Kimi K2 Instruct 為非推理模型,打不過(guò) o3 也在預(yù)料之中。

雖然 Kimi k2 未能獲勝,但這場(chǎng)比賽也為我們提供了有價(jià)值的觀察。從 Kimi k2 的走棋注釋來(lái)看,它在開(kāi)局階段能夠遵循棋譜理論行棋。然而,一旦脫離了熟悉的開(kāi)局理論,技術(shù)問(wèn)題就開(kāi)始顯現(xiàn) —— 而對(duì) Kimi k2 來(lái)說(shuō),這個(gè)轉(zhuǎn)折點(diǎn)來(lái)得較早。

Kimi k2 遇到困難的具體原因還需要進(jìn)一步分析。在某些時(shí)候,它能清楚看到棋子的位置,卻似乎忘記了棋子的走法。

image.png

在這一次對(duì)局中,Kimi k2 完整識(shí)別了棋盤(pán)局勢(shì),卻依然無(wú)法給出合法著法,似乎對(duì)棋子的走法規(guī)則出現(xiàn)了記憶混亂。

在其他對(duì)局中,它在局面識(shí)別上也存在一些技術(shù)問(wèn)題。

image.png

憑借這場(chǎng)勝利,o3 順利晉級(jí)半決賽,與 o4 mini 對(duì)戰(zhàn)。 

DeepSeek R1 對(duì)陣 o4-mini:0-4

OpenAI 的 o4-mini 與 DeepSeek R1 之間的對(duì)局呈現(xiàn)出了獨(dú)特的特點(diǎn)。如果單獨(dú)觀察每局比賽的前幾步棋,你可能會(huì)以為這是兩位高手在過(guò)招。然而對(duì)局進(jìn)行到某個(gè)階段后,棋局質(zhì)量就會(huì)突然斷崖式下跌。

image.png

這一現(xiàn)象在整場(chǎng)比賽中反復(fù)出現(xiàn):幾步不錯(cuò)的開(kāi)局之后,會(huì)出現(xiàn)判斷偏差和一系列失誤。

盡管如此,o4-mini 在這場(chǎng)比賽中成功實(shí)現(xiàn)了兩次將軍 —— 這是一個(gè)值得注意的成就,考慮到對(duì) AI 系統(tǒng)來(lái)說(shuō),準(zhǔn)確把握整個(gè)棋盤(pán)狀態(tài)本身就具有相當(dāng)?shù)奶魬?zhàn)性。

Gemini 2.5 Pro 對(duì)陣 Claude 4 Opus:4-0

Gemini 2.5 Pro 與 Claude 4 Opus 的對(duì)局是本次比賽中唯一一個(gè)通過(guò)「將殺」獲勝的場(chǎng)次多于因違規(guī)行棋告負(fù)的場(chǎng)次的比賽。不過(guò),目前尚不清楚 Gemini 2.5 Pro 的真實(shí)棋力究竟如何,也不確定其勝利在多大程度上得益于 Claude 4 Opus 的失誤表現(xiàn)。

這場(chǎng)比賽第四局出現(xiàn)了一個(gè)耐人尋味的局面:Gemini 2.5 Pro 當(dāng)時(shí)擁有 32 分的子力優(yōu)勢(shì),棋盤(pán)上甚至有兩個(gè)后。然而盡管火力全開(kāi),它在完成將殺的過(guò)程中仍然出現(xiàn)了送子的情況。

image.png

但更值得分析的是本場(chǎng)比賽的第一局。前九個(gè)回合,雙方 AI 都表現(xiàn)穩(wěn)健,著法精妙。然而就在此時(shí),執(zhí)黑的 Claude 4 Opus 做出了一個(gè)草率的決定,走 10...g5。這步棋不僅白送一兵,還徹底破壞了己方王城的安全,直接加速了敗局的到來(lái)。從雙方 AI 的賽后評(píng)注中,我們可以看出一些端倪:

image.png

Grok 4 對(duì)陣 Gemini 2.5 Flash:4-0

今日表現(xiàn)最為亮眼的當(dāng)屬 Grok 4。除了以全勝戰(zhàn)績(jī)收獲 4 分外,其棋藝水平也堪稱目前最佳。雖然對(duì)手 Gemini 2.5 Flash 多次失誤送子確實(shí)降低了比賽難度,但與其他 AI 不同的是,Grok 4 展現(xiàn)出了精準(zhǔn)捕捉無(wú)保護(hù)棋子的能力,并能果斷實(shí)施打擊。

image.png

Grok 4 的出色表現(xiàn)甚至引起了科技界的關(guān)注,其創(chuàng)始人埃隆?馬斯克在 X 平臺(tái)簡(jiǎn)短互動(dòng)時(shí),再次提及他那個(gè)著名觀點(diǎn) ——「國(guó)際象棋太過(guò)簡(jiǎn)單」。

image.png

截至目前,大語(yǔ)言模型在象棋對(duì)弈中暴露出三大關(guān)鍵短板:全局棋盤(pán)視覺(jué)化能力不足、棋子間互動(dòng)關(guān)系理解有限,以及由此引發(fā)的合法著法執(zhí)行問(wèn)題。而 Grok 4 的出色表現(xiàn)證明,它似乎成功突破了這些限制。

這些 AI 模型的優(yōu)勢(shì)與缺陷能否在后續(xù)賽事中保持穩(wěn)定?我們還要看明天的半決賽成績(jī)。

文章中提及的棋局在線上國(guó)際象棋對(duì)弈網(wǎng)站 chess.com 中均有詳細(xì)描述,感興趣的讀者可以參見(jiàn)以下鏈接:https://www.chess.com/news/view/kaggle-game-arena-chess-2025-day-1

國(guó)際象棋大師 Levy Rozman 也在最新錄制的視頻中對(duì)這場(chǎng)比賽進(jìn)行了講解。

我們?cè)谧蛱斓膱?bào)道中發(fā)起了一個(gè)投票,目前已有近 4000 位讀者參與。從目前的數(shù)據(jù)看,大家此前最看好的是 Gemini 2.5 Pro—— 贏得了超過(guò) 37% 的票數(shù)。

e787b0757681e3abee0c74a781f0a6d.jpg

現(xiàn)在,第一天的比賽結(jié)果已經(jīng)出爐,我們也稍微了解了各個(gè)模型的表現(xiàn),不知道大家的想法有無(wú)變化呢?  

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2025-08-05 15:11:36

AI模型象棋

2010-06-17 15:47:45

世界杯UPS布線

2025-08-07 09:20:00

2012-07-11 16:39:15

飛碟射擊

2017-03-23 13:38:32

2015-05-25 10:05:16

2014-01-09 15:33:40

云計(jì)算

2014-02-21 09:14:34

影子IT云安全

2023-04-17 09:00:00

WakeData惟客數(shù)據(jù)大模型

2025-02-10 09:42:14

2018-07-03 14:45:34

2018-08-06 15:40:13

大數(shù)據(jù)睿至

2025-06-09 08:30:00

2015-01-21 18:22:31

2012-06-20 14:08:27

創(chuàng)業(yè)大賽

2010-06-19 15:51:19

通信服務(wù)華為

2017-03-14 14:56:13

XCTFNJCTF線上

2023-08-30 12:03:40

2009-07-15 09:19:45

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

亚洲四虎影院| 不卡视频在线播放| 色爱综合网欧美| 9191成人精品久久| 在线观看17c| 天天色综合久久| 日韩av不卡在线观看| 久久亚洲精品视频| 少妇毛片一区二区三区| 国产精品亚洲成在人线| 亚洲午夜一二三区视频| 日本三级中国三级99人妇网站| 亚洲一区精品在线观看| 影音先锋亚洲一区| 中文字幕av一区二区三区谷原希美| 亚洲精品综合在线观看| 国产污视频在线播放| 国产精品三级久久久久三级| 动漫一区二区在线| 伊人成人在线观看| 美女视频黄免费| 悠悠资源网亚洲青| 亚洲视频网在线直播| 国产一区二区三区奇米久涩 | 手机av免费在线观看| 奇米一区二区三区av| 97成人在线视频| 波多野结衣爱爱视频| 综合伊思人在钱三区| 欧美成人福利视频| 日本中文字幕二区| 成人网ww555视频免费看| 亚洲午夜激情网站| www国产免费| 69久久久久| 久久一日本道色综合| 国产高清精品一区二区| 国产精品无码免费播放| 日韩电影一区二区三区四区| 欧美亚洲成人精品| 日韩精品人妻中文字幕| 欧美日韩精品| 欧美剧在线观看| 男人的午夜天堂| 日韩av二区| 一色桃子一区二区| 91网站免费视频| 亚洲国产欧美视频| 色网在线观看| 自拍偷拍亚洲综合| 中日韩在线视频| 日本在线视频网| 中文字幕精品三区| 亚洲精品二区| 日本高清视频在线播放| 国产精品午夜电影| 亚洲乱码一区二区三区三上悠亚| 精华区一区二区三区| 久久女同精品一区二区| 精品九九九九| 亚洲 另类 春色 国产| 波多野结衣91| 久久久久久久久久久久久久一区| 天天干天天干天天干| 99久久伊人久久99| 精品一区二区久久久久久久网站| 天天色棕合合合合合合合| 成人av手机在线观看| 国产乱子伦精品| 日韩专区一区二区| 久久综合九色综合97婷婷女人 | 日韩丝袜视频| 亚洲欧美制服综合另类| 国产综合精品在线| 日韩欧美综合| 欧美大片免费观看| 日韩美女黄色片| 久久久久国产精品一区二区| 国产精品久久久久久久天堂| 一区二区不卡视频在线观看| 国产伦精一区二区三区| 精品国产一区二区三区日日嗨| 四虎成人免费在线| 91免费看片在线观看| 欧美一卡2卡3卡4卡无卡免费观看水多多 | 中文亚洲免费| 国产精品日韩一区| 国内精品久久久久久久久久久| 成人免费黄色在线| 欧美日韩国产三区| 国产原创视频在线观看| 亚洲国产aⅴ天堂久久| 92看片淫黄大片一级| 国产第一亚洲| 精品国产免费久久| 91久久免费视频| 综合一区av| 欧日韩不卡在线视频| 国产又粗又黄又爽| 99久久99久久精品国产片果冻| 日韩一区免费观看| 欧美性受ⅹ╳╳╳黑人a性爽| 欧美日韩国产中文精品字幕自在自线| 日本www.色| 爱爱精品视频| 在线观看91久久久久久| 妺妺窝人体色www婷婷| 日韩二区在线观看| 国产精品久久九九| 北条麻妃在线| 精品久久久久久久中文字幕| 亚洲黄色av网址| 91成人入口| 中文字幕欧美日韩精品| 亚洲男人的天堂在线视频| 精品在线免费观看| 欧洲亚洲一区二区| 操人在线观看| 欧美一级欧美三级在线观看| 女人又爽又黄免费女仆| 国产在线日韩| 91在线看www| 搞黄视频免费在线观看| 午夜电影一区二区| 国产又黄又嫩又滑又白| 成人精品影院| 日本一区二区在线播放| 国产激情视频在线播放| 亚洲欧洲日韩在线| 国产真人无码作爱视频免费| 欧美日韩一区二区三区在线电影 | 日韩在线一二三区| 国产亚洲精品美女久久久m| 国产激情在线| 欧美色成人综合| 爱爱的免费视频| 亚洲日产国产精品| 国产福利久久精品| 中文字幕有码在线观看| 91精品国产综合久久精品app| 精品国产av无码| 国产精品一页| 国严精品久久久久久亚洲影视| av片在线观看永久免费| 欧美精品tushy高清| 五月天免费网站| 久久精品国产在热久久| 天天爽天天狠久久久| 欧美自拍电影| 亚洲欧美色图片| www.久久久久久久| 国产性做久久久久久| 欧美性久久久久| 亚洲欧洲av| 国产精品wwwwww| 超碰国产在线观看| 欧美精品在线一区二区三区| 任我爽在线视频| 韩国午夜理伦三级不卡影院| 2025韩国大尺度电影| 欧美经典影片视频网站| 九九热这里只有在线精品视| 国产探花精品一区二区| 在线观看精品| 午夜日韩电影| 91精品国产综合久久久久久蜜臀| 国产私人尤物无码不卡| 色婷婷狠狠综合| www亚洲色图| 蓝色福利精品导航| 在线观看欧美亚洲| 四虎影视国产精品| 欧美成人合集magnet| 成人福利小视频| 亚洲国产精品影院| 亚洲国产精品成人综合久久久| 亚洲永久免费精品| 日韩欧美在线电影| 91丨精品丨国产| 九色精品美女在线| 无码国产精品一区二区免费16 | 老司机成人免费视频| 国产麻豆精品在线观看| 成人免费观看cn| 国产va免费精品观看精品视频| 国产97人人超碰caoprom| 9191在线观看| 欧美va在线播放| 在线免费黄色av| 国产精品不卡在线| 国产免费一区二区三区最新6| 久久成人精品| 欧美少妇一级片| 香蕉久久夜色精品国产使用方法| 国产精品一区久久| av资源中文在线| 中文字幕亚洲天堂| 亚洲欧美高清视频| 欧美性xxxx18| 成人免费毛片东京热| 2021久久国产精品不只是精品| 国产精品嫩草影院8vv8| 亚洲激情网站| 在线不卡视频一区二区| 欧美日韩导航| 91美女福利视频高清| 少妇在线看www| 操人视频在线观看欧美| 图片区 小说区 区 亚洲五月| 欧美日本一区二区三区| 国产成人免费观看视频| 18欧美乱大交hd1984| 亚洲av片不卡无码久久| 国产一区二区三区免费在线观看| 久久久噜噜噜www成人网| 亚洲一级毛片| 五月天久久综合网| 日韩伦理一区二区三区| 99re6在线| 日韩色性视频| 日韩美女在线观看一区| 9999热视频在线观看| www.日韩视频| 国产高清在线| 日韩精品亚洲视频| 粉嫩小泬无遮挡久久久久久| 欧美美女一区二区三区| 中文字幕永久在线| 欧美日韩亚洲国产一区| wwwav国产| 中文字幕一区在线观看| 男人天堂av电影| 不卡一区二区中文字幕| 亚洲三级在线视频| 狠狠网亚洲精品| 日韩一级免费片| 日本亚洲天堂网| 女人另类性混交zo| 亚洲一区成人| 欧美成人高潮一二区在线看| 国产一区日韩一区| 亚洲精品久久久久久久蜜桃臀| 91高清一区| 伊甸园精品99久久久久久| 欧洲杯什么时候开赛| 久久久久高清| 天堂日韩电影| 欧美aaaaa喷水| 一道本一区二区三区 | 国产精品三级| 欧美精品一区在线| 嫩草影视亚洲| 欧美精品久久久| 九九免费精品视频在线观看| 精品一区久久久久久| 啪啪国产精品| 裸体丰满少妇做受久久99精品 | 欧美高清性xxxxhd| 久久99高清| 色噜噜色狠狠狠狠狠综合色一| 国产日产精品_国产精品毛片| 欧美久久在线| 欧美军人男男激情gay| 色噜噜狠狠一区二区三区| 久久理论电影| 操bbb操bbb| 在线成人亚洲| 无码aⅴ精品一区二区三区浪潮 | 国产欧美一区二区在线| 最近中文字幕免费视频| 国产欧美一区二区三区沐欲 | 国产高清在线观看视频| 欧美一区日韩一区| 欧美视频一二区| 亚洲乱码一区二区| 在线a人片免费观看视频| 久久亚洲影音av资源网| 日本孕妇大胆孕交无码| 欧美韩日一区二区| 欧美成人性网| 成人精品一区二区三区电影免费| 国产专区精品| 精品久久精品久久| 91影院成人| 91免费黄视频| 日韩高清一区在线| 樱花草www在线| 91在线码无精品| 黄色av片三级三级三级免费看| 国产精品水嫩水嫩| 久一区二区三区| 欧美性受xxxx| 国产香蕉在线观看| 亚洲欧洲xxxx| 色黄网站在线观看| 日本中文字幕成人| 日韩激情综合| 亚洲黄色成人久久久| 国产真实久久| 亚洲精品自拍网| 91在线一区二区三区| 日本午夜在线观看| 色香蕉久久蜜桃| 亚洲AV无码成人片在线观看| 亚洲欧美国产精品va在线观看| 激情影院在线观看| 日本亚洲欧洲色| 日韩精品视频在线看| 日韩精品欧美在线| 欧美日韩三级| 久久婷五月综合| ww久久中文字幕| 免费在线视频一区二区| 欧美日韩国产一二三| 特黄aaaaaaaaa真人毛片| 啊v视频在线一区二区三区 | 国产精品嫩草影院久久久| 91精品久久久久久综合五月天| 四虎永久国产精品| 日韩天天综合| 中文字幕avav| 亚洲欧美在线高清| 亚洲视屏在线观看| 亚洲欧美国产制服动漫| 丁香花电影在线观看完整版| 国产一区二区丝袜高跟鞋图片| 九九热爱视频精品视频| 欧美乱大交xxxxx潮喷l头像| 国产精品一区二区果冻传媒| 四虎影视一区二区| 欧美性三三影院| 青青国产在线| 欧美二区在线播放| 国产不卡精品| 中文字幕不卡每日更新1区2区| 男人的天堂亚洲| www.中文字幕av| 欧美日韩国产页| 无码国产色欲xxxx视频 | 日本免费一区二区三区四区| 好吊色欧美一区二区三区视频 | 国产日产精品1区| av中文在线播放| 日韩风俗一区 二区| 成年人国产在线观看| 国产精品大全| 亚洲人成免费| 日本免费福利视频| 色综合网站在线| 国产在线高清| 国产精品视频男人的天堂| 国产亚洲电影| 性猛交ⅹ×××乱大交| 国产精品毛片久久久久久久| 亚洲中文无码av在线| 日韩在线视频网| 精品欧美视频| 嫩草影院中文字幕| 成人一区在线观看| 六月丁香在线视频| 亚洲视频777| 91亚洲视频| 吴梦梦av在线| 成人性生交大片| 国产性xxxx高清| 亚洲片av在线| 日本欧美在线| 丁香婷婷综合激情| 91色在线porny| 国产偷人爽久久久久久老妇app | 精品欧美日韩| 久久天天综合| 亚洲 欧美 国产 另类| 日韩一级片网站| yellow在线观看网址| 久久久久久亚洲精品不卡4k岛国| 天堂在线一区二区| 波多野结衣喷潮| 日韩亚洲欧美综合| 伊人网在线播放| 手机成人av在线| 成人av午夜电影| 成人一级免费视频| 久久夜精品va视频免费观看| 99这里只有精品视频| 蜜臀av午夜一区二区三区| √…a在线天堂一区| 日韩中文字幕免费在线观看| 国产精品第三页| 欧美性久久久| 中文字幕免费高清| 91精品婷婷国产综合久久 | 国产成人亚洲综合91精品| 99热国内精品| 成人无码www在线看免费| 欧美色视频在线| 2018av在线| 一区二区免费电影| 26uuu另类欧美| 国产免费黄色片|