精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AlphaZero的黑箱打開了!DeepMind論文登上PNAS

人工智能 新聞
AlphaZero 表明神經網絡可以學到人類可理解的表征。

國際象棋一直是 AI 的試驗場。70 年前,艾倫·圖靈猜想可以制造一臺能夠自我學習并不斷從自身經驗中獲得改進的下棋機器。上世紀出現的「深藍」第一次擊敗人類,但它依賴專家編碼人類的國際象棋知識,而誕生于 2017 年的 AlphaZero 作為一種神經網絡驅動的強化學習機器實現了圖靈的猜想。

AlphaZero 無需使用任何人工設計的啟發式算法,也不需要觀看人類下棋,而是完全通過自我對弈進行訓練。

那么,它真的學習了人類關于國際象棋的概念嗎?這是一個神經網絡的可解釋性問題。

對此,AlphaZero 的作者 Demis Hassabis 與 DeepMind 的同事以及谷歌大腦的研究員合作了一項研究,在 AlphaZero 的神經網絡中找到了人類國際象棋概念的證據,展示了網絡在訓練過程中獲得這些概念的時間和位置,還發現了 AlphaZero 與人類不同的下棋風格。論文近期發表于 PNAS。

圖片

論文地址:https://www.pnas.org/doi/epdf/10.1073/pnas.2206625119

AlphaZero 在訓練中獲得人類象棋概念

AlphaZero 的網絡架構包含一個骨干網絡殘差網絡(ResNet)和單獨的 Policy Head、Value Head,ResNet 由一系列由網絡塊和跳躍連接(skip connection)的層構成。

在訓練迭代方面,AlphaZero 從具有隨機初始化參數的神經網絡開始,反復與自身對弈,學習對棋子位置的評估,根據在此過程中生成的數據進行多次訓練。

為了確定 AlphaZero 網絡在多大程度上表征了人類所擁有的國際象棋概念,這項研究使用了稀疏線性探測方法,將網絡在訓練過程中參數的變化映射為人類可理解概念的變化。

首先將概念定義為如圖 1 中橙色所示的用戶定義函數。廣義線性函數 g 作為一個探針被訓練用于近似一個國際象棋概念 c。近似值 g 的質量表示層(線性)對概念進行編碼的程度。對于給定概念,對每個網絡中所有層的訓練過程中產生的網絡序列重復該過程。

圖片

圖 1:在 AlphaZero 網絡(藍色)中探索人類編碼的國際象棋概念。

比如,可以用一個函數來確定我方或地方是否有「主教」 (?) :

圖片

當然,還有很多比這個例子更復雜的象棋概念,比如對于棋子的機動性(mobility),可以編寫一個函數來比較我方和敵方移動棋子時的得分。

在本實驗中,概念函數是已經預先指定的,封裝了國際象棋這一特定領域的知識。

接下來是對探針進行訓練。研究人員將 ChessBase 數據集中 10 的 5 次方個自然出現的象棋位置作為訓練集,從深度為 d 的網絡激活訓練一個稀疏回歸探針 g,來預測給定概念 c 的值。

通過比較 AlphaZero 自學習周期中不同訓練步驟的網絡,以及每個網絡中不同層的不同概念探針的分數,就可以提取網絡學習到某個概念的時間和位置。

最終得到每個概念的 what-when-where 圖,對「被計算的概念是什么」、「該計算在網絡的哪個位置發生」、「概念在網絡訓練的什么時間出現」這三個指標進行可視化。如圖2。

圖片

圖2:從 A 到 B 的概念分別是「對總分的評估」、「我方被將軍了嗎」、「對威脅的評估」、「我方能吃掉敵方的皇后嗎」、「敵方這一步棋會將死我方嗎」、「對子力分數的評估」、「子力分數」、「我方有王城兵嗎」。

可以看到,C 圖中,隨著 AlphaZero 變得更強,「threats」概念的函數和 AlphaZero 的表征(可由線性探針檢測到)變得越來越不相關。

這樣的 what-when-where 圖包括探測方法比較所需的兩個基線,一是輸入回歸,在第 0 層顯示,二是來自具有隨機權重的網絡激活的回歸,在訓練步驟 0 處顯示。上圖的結果可以得出結論,回歸精度的變化完全由網絡表征的變化來決定。

此外,許多 what-when-where 圖的結果都顯示了一個相同的模式,即整個網絡的回歸精度一直都很低,直到大約 32k 步時才開始隨著網絡深度的增加而迅速提高,隨后穩定下來并在后面的層中保持不變。所以,所有與概念相關的計算都在網絡的相對早期發生,而之后的殘差塊要么執行移動選擇,要么計算給定概念集之外的特征。

而且,隨著訓練的進行,許多人類定義的概念都可以從 AlphaZero 的表征中預測到,且預測準確率很高。

對于更高級的概念,研究人員發現 AlphaZero 掌握它們的位置存在差異。首先在 2k 訓練步驟時與零顯著不同的概念是「material」和「space」;更復雜的概念如「king_safety」、「threats」、「mobility」,則是在 8k 訓練步驟時顯著得變為非零,且在 32k 訓練步驟之后才有實質增長。這個結果與圖 2 中 what-when-where 圖顯示的圖片急劇上升的點一致。

另外,大多數 what-when-where 圖的一個顯著特征是網絡的回歸精度在開始階段增長迅速,隨后達到平穩狀態或下降。這表明目前從 AlphaZero 身上所發現的概念集還只是檢測了網絡的較早層,要了解后面的層,需要新的概念檢測技術。

AlphaZero 的開局策略與人類不同

在觀察到 AlphaZero 學習了人類國際象棋概念后,研究人員進一步針對開局策略探討了 AlphaZero 對于象棋戰術的理解,因為開局的選擇也隱含了棋手對于相關概念的理解。

圖片

研究人員觀察到,AlphaZero 與人類的開局策略并不相同:隨著時間的推移,AlphaZero 縮小了選擇范圍,而人類則是擴大選擇范圍。

如圖 3A 是人類對白棋的第一步偏好的歷史演變,早期階段,流行將 e4 作為第一步棋,后來的開局策略則變得更平衡、更靈活。

圖 3B 則是 AlphaZero 的開局策略隨訓練步驟的演變。可以看到,AlphaZero 的開局總是平等地權衡所有選擇,然后逐漸縮小選擇范圍。

圖片

圖 3:隨著訓練步驟和時間的推移,AlphaZero 和人類對第一步的偏好比較。

這與人類知識的演變形成鮮明對比,人類知識從 e4 開始逐漸擴展,而 AlphaZero 在訓練的后期階段明顯偏向于 d4。不過,這種偏好不需要過度解釋,因為自我對弈訓練是基于快速游戲,為了促進探索增加了許多隨機性。

造成這種差異的原因尚不清楚,但它反映了人類與人工神經網絡之間的根本差異。一個可能的因素,或許是關于人類象棋的歷史數據更強調大師玩家的集體知識,而 AlphaZero 的數據包括了初學者級別下棋和單一進化策略。

那么,當 AlphaZero 的神經網絡經過多次訓練后,是否會出對某些開局策略顯示出穩定的偏好?

研究結果是,許多情況下,這種偏好在不同訓練中并不穩定,AlphaZero 的開局策略非常多樣。比如在經典的Ruy Lopez 開局(俗稱「西班牙開局」)中,AlphaZero 在早期有選擇黑色的偏好,并遵循典型的下法,即 1.e4 e5,2.Nf3 Nc6,3.Bb5。

圖片

圖 4:Ruy Lopez 開局

而在不同的訓練中,AlphaZero 會逐漸收斂到 3.f6 和 3.a6 中的一個。此外,AlphaZero 模型的不同版本都各自顯示出對一個動作的強烈偏好,且這種偏好在訓練早期就得以建立。

這進一步證明,國際象棋的成功下法多種多樣,這種多樣性不僅存在于人與機器之間,也存在于 AlphaZero 的不同訓練迭代中。

AlphaZero 掌握知識的過程

那么,以上關于開局策略的研究結果,與 AlphaZero 對概念的理解有什么關聯呢?

這項研究發現,在各種概念的 what-when-where 圖中有一個明顯的拐點,與開局偏好的顯著變化正好相吻合,尤其是 material 和 mobility的概念似乎與開局策略直接相關。

material 概念主要是在訓練步驟 10k 和 30k 之間學習的,piece mobility 的概念也在同一時期逐步融入到 AlphaZero 的 value head 中。對棋子的 material 價值的基本理解應該先于對棋子 mobility 的理解。然后 AlphaZero 將這一理論納入到 25k 到 60k 訓練步驟之間開局偏好中。

作者進一步分析了 AlphaZero 網絡關于國際象棋的知識的演變過程:首先發現棋力;接著是短時間窗口內基礎知識的爆炸式增長,主要是與 mobility 相關的一些概念;最后是改進階段,神經網絡的開局策略在數十萬個訓練步驟中得到完善。雖然整體學習的時間很長,但特定的基礎能力會在相對較短的時間內迅速出現。

前國際象棋世界冠軍 Vladimir Kramnik 也被請來為這一結論提供佐證,他的觀察與上述過程一致。

最后總結一下,這項工作證明了 AlphaZero 網絡所學習的棋盤表示能夠重建許多人類國際象棋概念,并詳細說明了網絡所學習的概念內容、在訓練時間中學習概念的時間以及計算概念的網絡位置。而且,AlphaZero 的下棋風格與人類并不相同。

既然我們以人類定義的國際象棋概念來理解神經網絡,那么下一個問題將會是:神經網絡能夠學習人類知識以外的東西嗎?

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-10-28 09:27:04

2023-12-15 12:52:32

模型數據

2025-11-13 15:29:48

Nature模型AI

2025-09-18 08:30:54

2022-11-17 13:32:46

AlphaZero黑箱網絡

2023-04-25 14:00:00

GPTAI

2021-02-24 15:38:37

數據語言架構

2025-11-14 09:15:39

2021-12-07 09:51:06

神經網絡AI算法

2025-09-15 08:40:00

2024-03-18 10:19:15

AI藥物研發

2023-02-13 11:34:13

數字孿生工業4.0

2023-11-18 09:48:23

2022-07-06 13:13:36

SWIL神經網絡數據集

2022-07-04 18:33:40

深度學習人工智能科學

2024-07-25 13:56:49

2020-01-16 15:57:36

AI 數據人工智能

2024-12-06 09:00:00

2020-04-13 14:00:07

量子計算圍棋AI

2023-11-15 14:17:23

微軟語言模型AI 模型
點贊
收藏

51CTO技術棧公眾號

欧美日韩福利视频| 欧美另类久久久品| 日本精品一区二区| 91精品人妻一区二区三区果冻| 五月开心六月丁香综合色啪| 精品国产百合女同互慰| www.超碰com| 污污网站在线观看| 国产婷婷色一区二区三区四区| 91牛牛免费视频| av大片在线免费观看| 国产精品久久久久蜜臀| 国产婷婷成人久久av免费高清 | 日本在线影院| 亚洲欧美在线高清| 欧美1o一11sex性hdhd| 99久久精品国产一区色| 模特精品在线| 色与欲影视天天看综合网| 无码少妇一区二区| 日韩成人动漫在线观看| 91精品国模一区二区三区| 免费黄色日本网站| 黄色污污视频在线观看| 国产精品久久久久久亚洲伦| 久久av一区二区三区亚洲| 91无套直看片红桃| 日韩精品电影在线| 欧美在线一区二区三区四| 一级黄色录像视频| 亚欧美无遮挡hd高清在线视频| 亚洲男女性事视频| 美女久久久久久久久| 亚洲人体在线| 欧美私人免费视频| 免费裸体美女网站| 国产精品原创| 午夜精品久久久久久久久久 | 91精品国产综合久久久久久久久久 | 色偷偷在线观看| 国产精品1024久久| 成人久久精品视频| 亚洲天堂手机版| 日韩高清不卡一区二区三区| 欧美在线欧美在线| 欧美不卡视频在线观看| 欧美体内she精视频在线观看| 色妞色视频一区二区三区四区| 中文字幕av久久爽一区| 黑丝美女一区二区| 亚洲热线99精品视频| 瑟瑟视频在线观看| 亚洲电影男人天堂| 亚洲男人天堂手机在线| 国产白嫩美女无套久久| 秋霞蜜臀av久久电影网免费| 亚洲国产精品视频在线观看| 插我舔内射18免费视频| 99re91这里只有精品| 精品国产乱码久久久久久牛牛| 极品白嫩的小少妇| 在线视频国产区| 一区免费观看视频| 欧美一级免费在线观看| 国产传媒在线播放| 亚洲永久免费视频| 美女扒开大腿让男人桶| 激情国产在线| 日本久久精品电影| 成人性生交免费看| 日本一区二区三区播放| 日韩精品中文字幕一区| 一级欧美一级日韩片| 香蕉久久夜色精品国产使用方法 | 欧美色男人天堂| 欧美美女一级片| 国产精品久久久久久久久久久久久久久 | 日av中文字幕| 成人一级视频| 日韩欧美一级二级三级久久久| 欧美一级片在线免费观看| 成人午夜大片| 一区二区成人av| 国产精品久久久精品四季影院| 欧美激情成人在线| 欧美亚洲日本黄色| 伊人22222| 成人小视频在线| 日韩免费毛片| 欧美大片黄色| 一本色道亚洲精品aⅴ| 久久久久xxxx| 久久综合另类图片小说| 最近2019中文字幕大全第二页| 欧美三级黄色大片| 国产精品亚洲综合色区韩国| 国产精品日韩在线播放| 亚洲女同志亚洲女同女播放| 久久一日本道色综合| 性欧美18一19内谢| 偷拍自拍在线看| 7777精品伊人久久久大香线蕉超级流畅 | 激情五月婷婷久久| 日韩三级不卡| 亚洲欧美成人在线| 青青草在线观看视频| 欧美资源在线| 国产99在线免费| √天堂资源地址在线官网| 亚洲成在人线在线播放| 777视频在线| 自拍亚洲一区| 久久久最新网址| 国产精品羞羞答答在线| 91麻豆免费看| 男人天堂手机在线视频| 欧美网站免费| 亚洲香蕉成人av网站在线观看| 久久久久成人网站| 另类成人小视频在线| 欧美日韩国产三区| segui88久久综合| 69堂国产成人免费视频| 日本美女bbw| 在线午夜精品| 狠狠干一区二区| 天堂8中文在线| 欧美精品丝袜久久久中文字幕| 人妻精品久久久久中文字幕 | 黄色aaa级片| 女人抽搐喷水高潮国产精品| 欧美久久精品一级黑人c片| 中文字幕一区二区人妻| 久久久久久久久久电影| 久久视频这里有精品| 中文字幕亚洲在线观看| 美女视频黄免费的亚洲男人天堂| 夜夜躁狠狠躁日日躁av| 国产清纯白嫩初高生在线观看91 | 中文字幕亚洲在线| 中文字幕视频网站| 91啪亚洲精品| 免费高清在线观看免费| 欧美成人午夜77777| 欧美黑人巨大xxx极品| 亚洲第一色网站| 亚洲综合视频在线观看| jjzz黄色片| 93在线视频精品免费观看| 国产美女精品视频| 欧美激情办公室videoshd| 欧美日韩黄色一区二区| 国产福利在线导航| 捆绑调教一区二区三区| 爱爱爱视频网站| 国产精品毛片无码| 欧美xxxx14xxxxx性爽| www三级免费| 亚洲成人av福利| 精品夜夜澡人妻无码av| 日韩极品在线观看| 一本色道久久综合亚洲二区三区| 四虎国产精品成人免费影视| 欧美另类xxx| 日韩一级片免费观看| 疯狂欧美牲乱大交777| 在线小视频你懂的| 麻豆成人久久精品二区三区小说| 樱空桃在线播放| 亚洲一区二区三区在线免费| 国内精品久久久久久中文字幕| 污污视频在线免费看| 在线观看视频一区二区欧美日韩| 99精品欧美一区二区| 激情综合一区二区三区| 久久久久久久香蕉| 亚洲国产合集| 成人免费网站在线观看| 牛牛电影国产一区二区| 日韩风俗一区 二区| 欧美性受xxx黑人xyx性爽| 亚洲天堂av一区| 最近中文字幕无免费| 日本视频在线一区| 国产女教师bbwbbwbbw| 日韩伦理一区二区三区| 国产日本欧美在线观看| tube8在线hd| 中文字幕久热精品视频在线| 国产黄色片网站| 色噜噜狠狠成人网p站| 91插插插插插插| 久久亚洲综合色| 精品亚洲视频在线| 亚洲美女网站| 熟妇熟女乱妇乱女网站| 精品国产午夜肉伦伦影院| 国产精品美女主播| 国产在线xxx| 中文字幕亚洲综合| 手机看片一区二区| 91精品国产综合久久久久| 国产精品久久久久久久久久久久久久久久久| 国产欧美一区二区精品忘忧草 | 8x国产一区二区三区精品推荐| 日韩69视频在线观看| 在线你懂的视频| 国产亚洲人成a一在线v站| 开心激情综合网| 欧美精品视频www在线观看| 日本免费在线观看视频| 亚洲国产视频网站| 天天做夜夜爱爱爱| 国产日韩av一区| 无遮挡aaaaa大片免费看| 国产成人在线视频播放| 国产高清视频网站| 亚洲一区二区三区高清不卡| 精品视频在线观看一区二区| 久久电影院7| 日韩精品欧美专区| 亚洲午夜久久| 韩日午夜在线资源一区二区| 精品中文视频| 国产一区玩具在线观看| 日本高清不卡一区二区三区视频| 久久久久久国产精品| 麻豆传媒在线免费看| 色妞色视频一区二区三区四区| 久草在线青青草| 日韩成人黄色av| 婷婷av一区二区三区| 亚洲高清在线观看| www.天天干.com| 日韩三级免费观看| 精品人妻无码一区二区| 91精品国产综合久久久蜜臀粉嫩| 一级做a爱片性色毛片| 欧美图片一区二区三区| 国产一级精品毛片| 在线免费亚洲电影| 日本黄色中文字幕| 91精品福利在线| 中文字幕无码乱码人妻日韩精品| 欧美主播一区二区三区美女| 国产一级片免费在线观看| 色哟哟欧美精品| 99久久久无码国产精品免费蜜柚| 一本到不卡免费一区二区| 日韩不卡在线播放| 日本高清无吗v一区| 无码人妻丰满熟妇区五十路| 欧美视频在线一区二区三区| 亚洲av人无码激艳猛片服务器| 欧美性高清videossexo| 亚洲午夜精品久久久| 欧美日韩dvd在线观看| 国产精品久久久久久久久毛片| 91精品欧美久久久久久动漫| 成人高潮片免费视频| 精品久久久久久久久久久久包黑料| 亚洲精品综合网| 亚洲精美色品网站| 国产视频在线看| 这里精品视频免费| av网站大全在线| 久久噜噜噜精品国产亚洲综合 | 第一福利永久视频精品| 久久精品久久久久久久| 欧美色精品在线视频| 国产精品无码专区av免费播放| 精品奇米国产一区二区三区| 天堂а√在线8种子蜜桃视频| 亚洲国产精品久久久久秋霞蜜臀| 欧美套图亚洲一区| 色偷偷偷亚洲综合网另类| 亚洲精品天堂| 日本久久亚洲电影| 99er精品视频| 久久99久久99精品蜜柚传媒| 日韩一区二区在线免费| 国产视频在线观看网站| 亚洲资源av| 爱豆国产剧免费观看大全剧苏畅| 粉嫩久久99精品久久久久久夜| 精品国产无码在线观看| 亚洲欧洲日韩在线| 国产又大又黑又粗免费视频| 欧美撒尿777hd撒尿| 亚洲精品久久久狠狠狠爱| 国产一区二区三区免费视频| 黄色精品免费看| 欧美一级大片在线观看| 99久久99九九99九九九| 久久精品国产美女| 91精品久久久久久久蜜月| 91专区在线观看| 国产一区中文字幕| 中国美女乱淫免费看视频| 亚洲男同性视频| 国产中文字幕视频| 日韩午夜激情av| 在线观看黄色av| 97精品在线观看| 99精品美女视频在线观看热舞| 欧美日韩大片一区二区三区| 国产精品www.| 在线观看免费的av| 久久久噜噜噜久久中文字幕色伊伊 | 嫩草在线播放| 欧美国产在线视频| 日韩美女在线| 日本一区二区免费看| 亚洲国产高清视频| 91在线第一页| 国产精品久久久久桃色tv| 欧美一级视频免费观看| 日韩精品一区二区三区在线观看| eeuss影院在线播放| 欧美中在线观看| 波多野结衣在线一区二区| 欧美性视频在线播放| 日本欧美一区二区三区| 三级电影在线看| 亚洲成a人在线观看| 国产绳艺sm调教室论坛| 最近2019中文字幕第三页视频| 成人va天堂| 欧洲一区二区在线| 久久青草久久| 丰满少妇一区二区三区| 午夜精品123| 婷婷丁香一区二区三区| 97人洗澡人人免费公开视频碰碰碰| 国产精品亚洲四区在线观看| 国产精品av免费| 激情综合网天天干| 男人的天堂久久久| 91精品免费在线观看| 成年人黄视频在线观看| 成人国产精品色哟哟| 久久亚洲影视| 欧美成人乱码一二三四区免费| 中文一区一区三区高中清不卡| 在线观看亚洲黄色| 在线观看免费高清视频97| 成人在线视频播放| 五月天亚洲综合| 精品一二三四区| 精品国产精品国产精品| 日韩欧美一级精品久久| 久草在线视频福利| 国产亚洲自拍偷拍| 奶水喷射视频一区| av电影网站在线观看| 在线观看国产日韩| 午夜激情视频在线| 亚洲japanese制服美女| 欧美a级片一区| 日本人添下边视频免费| 狠狠爱在线视频一区| 国产中文字幕在线看| 国产精品视频一区国模私拍| 日韩一区电影| 黑人无套内谢中国美女| 亚洲高清视频中文字幕| 日本人妖在线| 国产区精品在线观看| 欧美精品一区二区三区久久久竹菊| jjzz黄色片| 日本道免费精品一区二区三区| 在线观看h片| 成人蜜桃视频| 天堂久久一区二区三区| 黄色录像免费观看| 精品国产一区二区三区不卡| gay欧美网站| 99热这里只有精品7| 成人动漫视频在线| 最新在线中文字幕| 欧美激情精品久久久久久| 羞羞色国产精品网站| 爱爱爱爱免费视频| 天天色综合天天| 在线看黄色av| 国产欧美丝袜| 免费在线观看成人| 五月天婷婷网站| 中文字幕av一区中文字幕天堂| 亚洲一区 二区| 天天操天天爱天天爽| 亚洲五月六月丁香激情| 成人全视频高清免费观看| 91九色蝌蚪嫩草| 丝袜亚洲另类丝袜在线| 久久久久无码精品国产| 在线观看欧美视频| 国产乱论精品| 午夜视频在线网站| 色综合天天性综合|