精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

MIT斯坦福Transformer最新研究:過度訓練讓中度模型「涌現」結構泛化能力

人工智能 新聞
雖然Transformer架構存在一些明顯的限制(例如無法實現無限遞歸),但研究人員的結果表明它可能具有比以前認為的更強的歸納偏好:通過充分的訓練,Transformer能夠表示分層的句子結構并利用這種結構進行正確的泛化。

對于人類來說,句子是分層的。

句子的層次結構對于表達和理解都相當重要。

但是在自然語言處理中,之前的研究認為,在泛化到新的結構輸入時,以Transformer為代表的神經序列模型似乎很難有效地捕捉到這種句子的層級結構。

但是斯坦福和MIT的研究人員在最近的研究中發現。

如果對Transformer類的模型進行長時間的訓練之后,它能獲得這種結構性的泛化能力。

研究人員將這種現象稱為:結構頓悟(Structural Grokking,SG)

Grokking這個詞是一個作家在書中造出來的詞,中文大概翻譯成「頓悟」。

微博網友木遙老師把這個詞解釋為:一個高度復雜的神經網絡在漫長的訓練期內一直只能記住訓練樣本的信息,幾乎沒有泛化能力,但到了某一刻,它的泛化水平忽然跳了出來,而且非常完美。

可以想象成一個神經網絡經歷了一個「aha moment」,像是內部的某個齒輪忽然對上了一樣。

論文地址:https://arxiv.org/abs/2305.18741

研究人員在不同的數據集中發現,SG在模型的深度(Model Depth)上呈現倒U縮放。

中深度模型的泛化能力比非常深和非常淺的模型都要好。

總體上看,如果能對模型進行更多的擴展訓練,普通的Transformer能夠展現出層級結構。

背景

在之前的類似研究中,研究人員認為Transformer在分層級泛化測試中是失敗的。

Transformer模型中的分層級結構

為了了解給定的模型是否對獲取層次結構有偏見,斯坦福的研究人員按照之前的實驗流程,評估了模糊任務上訓練的模型的泛化性。

在這些任務中,訓練數據與“層次規則”和“非層次規則”相一致的。

為測試是否獲得了分層規則,研究人員在一個單獨的分布外測試集上測試泛化性。

頓悟(Grokking)

之前的研究表明,在小型算法數據集上會出現頓悟現象,他們發現在訓練性能飽和后的很長時間里,模型測試性能繼續提高。

因此研究人員就假設存在一個類似的結構頓悟,在域內驗證性能飽和后很長時間內,模型對于分層結構依然可以繼續頓悟。

因此,分層泛化可以通過擴展訓練繼續提高。

實驗

數據集

研究人員的目標是理解transformer中的分層泛化 , 使用了來自之前研究中的兩個數據集,并在一個簡單的括號跟蹤任務上進行了評估。

我們評估了Dyck20,10中結構上未觀察到的字符串的泛化能力,以下圖為例。

模型

研究人員訓練了有{2,4,6,8,10}層的transformer語言模型。

對于每個深度,研究人員用10個隨機種子來訓練模型,300k steps。(Dyck為400k)

給定輸入句子(或在Dyck的情況下前綴),研究人員在測試時從模型中解碼。

對于Dyck,研究人員報告準確性是通過在給定語言的輸入前綴的情況下,通過對右括號進行排名來生成正確的右括號類型。

和之前已經進行的研究類似,對于Question-Formation,研究人員報告解碼問題的第一個單詞的準確性。

對于Tense-Inflection,研究人員報告的是目標動詞詞形變化正確的測試輸入的分數。

主要結果

Transformers展現出了結構頓悟。

研究人員在下圖中展示了在所有數據集上使用最佳模型深度所獲得的結果。

他們發現了明確的結構頓悟證據:在各個數據集上,在分布內準確率飽和之后的訓練步驟中,泛化性能得到改善,有時甚至接近完美的準確率。

提前停止是有害的

接下來,研究人員將通過在域內驗證準確率上進行提前停止而獲得的泛化準確率,與更長的訓練流程(如下圖)的泛化準確性進行了比較。

提前停止會導致泛化性能被嚴重低估。

例如,在Question-Formation和Tense-Inflection兩個任務上,平均泛化性能從不到40%、不到50%提高到分別不到90%、不到80%。

倒U形分布

在Question-Formation和Tense-Inflection任務中,研究人員從2層到10層逐漸增加深度進行模型訓練。

對于每個深度,在下圖中報告了最終泛化準確率超過80%的種子數(10個種子中的比例)。

他們發現了一個倒U形的分布狀態——非常淺和非常深的模型效果不佳,而大多數種子在中等深度的模型中表現出較好的泛化性能。

這也可以解釋為什么之前的研究要么使用非常淺的模型(1-3層的Transformer),要么使用非常深的模型(Mueller等人論文中的12層Transformer),都無法很好地泛化。

分析

鑒于結構頓悟僅在一部分模型架構中發生,研究人員能否確定它何時發生(或預測何時會發生)?

幾個模型內部屬性與結構性理解或Transformer中出現的新興分層結構或許有關。

Weight Norms

最近的研究將認為參數權重的L2 norm是結構頓悟的重要量。

但總體上來說,訓練過程中范數(Norms)增長被作為神經網絡泛化的關鍵因素之一進行了研究。

注意力稀疏性

Merrill等人(2021年)證明了Transformer中的范數增長導致了注意力的飽和,這是新興語言結構的重要特性(Merrill等人,2022年)。為了衡量fLθ的注意力稀疏性,我們計算了所有分布{apk}的負均熵。

樹結構

之前有研究展示了樹結構編碼器表現出接近完美的分層泛化。

雖然Transformer相對較為自由,但最近的證據表明,當在語言數據上進行訓練時,它們隱含地實現了(近似)樹結構計算。

而且,之前研究中樹投影方法精確地描述了Transformer對輸入進行的內部計算可以用樹結構神經編碼近似的程度,為任何Transformer提供了樹結構度量分數(tscore),并提供了一個在輸入字符串上最佳近似其計算的二叉樹。

為了評估這些樹是否與人類的句法概念相對應,我們還將恢復的樹與黃金標準樹進行比較。

結果

在Question-Formation和Tense-Inflection任務中,研究人員通過每隔3k steps更新計算一次這些量的方式來描述權重范數(通過層數統一化來比較不同模型深度)、注意力稀疏性和樹結構性的動態變化情況。

對于依賴于數據的屬性,如注意力稀疏性和樹結構性,我們從訓練數據中隨機抽取了10k個樣例。

研究人員在下圖中繪制了這些量在最小模型、最大模型(其中至少有一個運行顯示成功的結構頓悟)以及最佳模型深度的情況。

樹形結構是最佳的模型

在兩個數據集的所有模型設置中,權重范數和注意力稀疏性都會增長。

然而,僅憑這些屬性本身無法預測淺層和深層模型的失敗 - 淺層模型學習到了最稀疏的解以及具有最大權重范數的解,但從未進行分層泛化。

正如之前的研究中所指出的,tscore隨時間的推移對于所有模型都有所改善,表明隨著時間的推移,樹結構性增加。

對于這兩個數據集,與深層和淺層模型相比,“最佳”模型學習到了最多的樹結構解。

在算法任務中,結構性理解“與嵌入中結構的出現相吻合”。

類似地,在語言任務中,我們發現結構性理解與樹狀內部計算的出現相吻合。

Transformer在誘導結構方面表現出驚人的效果

從下圖的tparseval的動態變化中,研究人員注意到所有模型,無論它們是否進行泛化,都學習到了接近于真實句法的結構,有時表現優于右分支基線。

之前的研究認為,只有樹結構編碼器根據正確的句法分析樹進行結構化時才能進行泛化。

研究人員發現所有Transformer都學習到了正確的樹結構,但只有最具樹結構性的模型表現出最好的泛化能力。

結論

這項研究表明,通過結構頓悟機制,Transformer能夠展現出對結構敏感的“分層泛化”。

它們的整體學習行為逐漸從記憶(領域內高準確率,領域外準確率較差)向泛化(領域內和領域外準確率高)轉變。

雖然研究人員在相對較小的數據集和小型模型上展示了這種行為,但這些結果可能具有更廣泛的意義。

因為已經證明長時間的訓練即使對于規模龐大的語言建模和組合泛化任務也有幫助。

結構頓悟在“中等規模”的模型深度最常發生,而非常淺和非常深的模型則無法展現出這種行為。

雖然以往與Transformer中的語言泛化相關的屬性,如權重范數和注意力稀疏性,不能區分好的架構和壞的架構,但Transformer的功能性樹結構可以很好地預測最佳模型深度。

雖然Transformer架構存在一些明顯的限制(例如無法實現無限遞歸),但研究人員的結果表明它可能具有比以前認為的更強的歸納偏好:通過充分的訓練,Transformer能夠表示分層的句子結構并利用這種結構進行正確的泛化。

責任編輯:張燕妮 來源: 新智元
相關推薦

2023-05-04 12:32:28

模型研究

2024-11-21 08:39:08

2023-07-21 14:47:24

AI訓練

2023-10-20 12:17:57

AI數據

2023-06-25 13:28:21

2023-02-14 09:45:11

模型測試

2025-10-28 15:46:19

AIChatGPT算法

2025-01-17 10:26:19

模型開發ChatGPT

2025-05-06 00:45:00

2017-11-28 14:18:29

2022-02-23 14:36:31

AI數據研究

2018-12-03 09:35:26

互聯網

2025-01-20 13:08:25

2023-12-05 13:38:11

架構模型

2023-09-06 13:34:31

2025-10-31 16:06:19

AI參數微調

2022-10-08 12:38:23

模型開源

2018-12-17 11:06:34

華為云

2025-10-24 12:17:22

2024-01-03 13:37:00

模型數據
點贊
收藏

51CTO技術棧公眾號

日韩一区二区三区三四区视频在线观看 | 精品人妻aV中文字幕乱码色欲| av亚洲在线观看| 色综合欧美在线视频区| 日本精品视频一区| 中文字幕91爱爱| 亚洲国产日韩欧美在线| 欧美精品一区二区三区高清aⅴ | 国产suv一区二区三区| 久久久久久久久成人| 亚洲老妇xxxxxx| 国产精品一 二 三| www.毛片.com| 93在线视频精品免费观看| 欧美一区二区三区性视频| a级黄色小视频| 久草福利在线视频| 国产综合色在线| 国内精品小视频| 蜜桃av乱码一区二区三区| 亚洲精品tv| 亚洲成人一区二区在线观看| 日本在线视频不卡| 国内精品久久久久久久久久 | 成人av资源站| 国产精品成人品| 欧美色图亚洲天堂| 女人丝袜激情亚洲| 日韩视频一区二区在线观看| 99999精品视频| 久久综合之合合综合久久| www.亚洲人| 国产又爽又黄的激情精品视频 | 欧美黄色成人网| 女人又爽又黄免费女仆| 精品视频一区二区三区| 91福利在线导航| 日韩一级性生活片| 免费黄网在线观看| 久久色中文字幕| 动漫美女被爆操久久久| 在线免费a视频| 亚洲免费一区二区| 欧美人在线观看| 中文字幕第69页| 西野翔中文久久精品字幕| 日韩欧美在线综合网| 婷婷六月天在线| 麻豆免费在线| 亚洲综合视频在线观看| 婷婷视频在线播放| av基地在线| 久久久久久久久久久久久夜| 国产91色在线|亚洲| 国产精品国产av| 日韩—二三区免费观看av| 97在线观看视频| 青青草成人免费| 91综合在线| 中文字幕亚洲色图| 中文字幕在线观看免费高清| 蜜臀av免费一区二区三区| 亚洲精品aⅴ中文字幕乱码| 色哟哟网站在线观看| 国产精品一区二区精品视频观看| 欧美在线制服丝袜| 天天摸天天碰天天添| 黄色在线免费观看网站| 亚洲3atv精品一区二区三区| 久久99久久久久久| 国内高清免费在线视频| 亚洲男女一区二区三区| 欧洲金发美女大战黑人| 91高清在线观看视频| 亚洲欧洲日韩av| 一区二区三区电影| 91精品国产综合久久久久久豆腐| 国产日韩欧美综合一区| 欧洲av一区| 福利在线午夜| 国产精品久久久久久久久免费丝袜| 色一情一乱一伦一区二区三区| 成人av毛片| 伊人久久亚洲热| 欧美激情二区三区| 国产无遮无挡120秒| 99精品视频免费| 国产69精品久久久久久| 青青操免费在线视频| 亚洲欧美日韩国产综合精品二区 | 亚洲不卡免费视频| 丁香啪啪综合成人亚洲小说| 国产精品久久久久久久久久久久午夜片| 精品久久人妻av中文字幕| 国产91综合一区在线观看| 99一区二区| 神马精品久久| 日本一区二区三级电影在线观看| 免费看啪啪网站| 污污的网站在线看| 欧美视频专区一二在线观看| www亚洲成人| 深夜福利一区| 日韩精品中文字幕在线| 在线观看日本黄色| 影院欧美亚洲| 国产成人精品久久亚洲高清不卡| ,亚洲人成毛片在线播放| 国产a久久麻豆| 免费精品视频一区| 黄色国产网站在线播放| 精品国产91久久久久久| av网站在线不卡| 99亚洲乱人伦aⅴ精品| 亚洲香蕉成人av网站在线观看 | 少妇人妻大乳在线视频| 国产精品亚洲一区二区三区在线观看 | 日韩欧美福利视频| 天堂av8在线| 欧美五码在线| www.国产一区| av网站中文字幕| 国内成人自拍视频| 日本不卡高清视频一区| 92久久精品| 欧美人牲a欧美精品| 波多野结衣视频播放| 外国成人激情视频| 国产91露脸中文字幕在线| 国产高清在线免费| 国产精品欧美经典| 国产精品丝袜久久久久久消防器材| 国产成人视屏| 国产一区二区三区18| 日本三级网站在线观看| 精品亚洲国产成人av制服丝袜| 久久久久久一区| 欧美24videosex性欧美| 欧美精选一区二区| 摸摸摸bbb毛毛毛片| 国产精品美女久久久| 97人摸人人澡人人人超一碰| 日本中文字幕在线2020| 丁香五六月婷婷久久激情| 亚洲欧洲国产视频| 午夜激情久久| 国产精品福利在线| 欧美新色视频| 精品久久久久久中文字幕大豆网| 国偷自产av一区二区三区麻豆| 成人毛片在线| 国产成人精品在线播放| 天堂中文资源在线| 婷婷久久综合九色综合伊人色| 国产成人强伦免费视频网站| 天天综合网网欲色| 国产日韩欧美日韩| 日本三级视频在线播放| 欧美精品久久久久久久多人混战| 日本成人午夜影院| 日韩专区在线视频| 色综合视频二区偷拍在线| 日韩在线影院| 一个人www欧美| 337p粉嫩色噜噜噜大肥臀| 93久久精品日日躁夜夜躁欧美| 精品少妇人欧美激情在线观看| 日韩精品中文字幕吗一区二区| 欧美成人高清视频| 精品人妻少妇嫩草av无码专区 | 久久久一区二区三区四区| 国产精品一区在线| 免费高清一区二区三区| 蜜桃一区av| 欧美中文在线视频| 户外极限露出调教在线视频| 91成人看片片| gv天堂gv无码男同在线观看| 另类调教123区| 在线免费观看成人| 精品视频一区二区三区在线观看| 欧美高清第一页| 秋霞av鲁丝片一区二区| 欧美日韩国产综合视频在线观看中文| 先锋资源av在线| 免费看的黄色欧美网站| 日韩久久精品一区二区三区| 国产精品久久久久77777丨| 久久手机精品视频| 亚洲成人第一区| 日韩欧美精品网站| 国产精品视频在| 丰满少妇久久久久久久| 国产精品免费观看久久| 久久精品国产亚洲夜色av网站| 91视频-88av| bl在线肉h视频大尺度| 国产偷国产偷亚洲清高网站 | 欧美日韩黄色影视| 欧美国产在线看| 91丝袜国产在线播放| 搡女人真爽免费午夜网站| 婷婷久久一区| 精品视频在线观看| 国产精品蜜月aⅴ在线| 欧美成人亚洲成人| 欧美女优在线观看| 91精品蜜臀在线一区尤物| 亚洲综合一二三| 国产精品毛片大码女人| 免费看毛片的网站| 蜜臀久久99精品久久久久久9| 欧美黑人在线观看| 精品午夜久久| 国产一区二区无遮挡| 欧美一级做a| 91国产美女在线观看| 黄色免费在线网站| 国产一区二区三区高清在线观看| 亚洲黄色精品视频| 欧美色电影在线| 可以免费看的av毛片| 亚洲日本va在线观看| 精品成人av一区二区三区| 国产成+人+日韩+欧美+亚洲| 亚洲综合欧美激情| 国产日韩欧美三级| 69精品丰满人妻无码视频a片| 欧美日韩久久精品| 久久精品一二三区| 91在线一区| 成人欧美一区二区三区黑人孕妇| 中国色在线日|韩| 久久99精品久久久久久青青91| 成年女人的天堂在线| 日韩精品免费综合视频在线播放| 性生活视频软件| 欧美丰满少妇xxxxx高潮对白| 亚洲图片在线视频| 亚洲妇熟xx妇色黄| 欧美日韩中文字幕在线观看| 亚洲欧美中日韩| 91在线无精精品白丝| 99麻豆久久久国产精品免费| www.黄色网| 国产激情视频一区二区在线观看 | 日韩免费视频在线观看| 2018av在线| 色综合久综合久久综合久鬼88| 免费网站成人| 精品国产拍在线观看| 69视频在线| 中文字幕欧美国内| 国产精品久久一区二区三区不卡| 国产婷婷成人久久av免费高清| 视频一区二区免费| 亚洲国产成人久久综合| 日本高清视频www| 亚洲精品一区二区三区香蕉| 成人午夜福利视频| 欧美精品一区二区久久婷婷| 亚洲乱码精品久久久久..| 欧美一级专区免费大片| 国产视频第一页| 日韩亚洲欧美成人一区| www.蜜桃av.com| 欧美电影精品一区二区| 国模私拍视频在线| 精品国产91乱码一区二区三区 | 久热av在线| 亚洲欧美变态国产另类| 国产有码在线| 国产亚洲综合久久| 91亚洲精选| www.午夜精品| 青春草免费在线视频| 午夜精品www| 亚洲十八**毛片| 国产成人激情小视频| 91看片一区| 91精品中文在线| 一区二区三区免费在线看| 国产精品日韩欧美一区二区三区| 奇米影视777在线欧美电影观看| 精品无人区一区二区三区竹菊| 一区二区导航| 日韩不卡av| 91精品国产成人观看| 国产精品视频网站在线观看| 在线看片一区| 日本黄色三级大片| 美国三级日本三级久久99| 亚洲国产欧美91| 成人av综合一区| www.99热| 亚洲欧洲制服丝袜| 圆产精品久久久久久久久久久| 色菇凉天天综合网| 91麻豆一区二区| 亚洲电影在线观看| aaa在线观看| 久久久噜噜噜久久| 成人免费福利| 亚洲精品日韩av| 香蕉久久夜色精品国产使用方法 | 色视频在线观看福利| 色婷婷综合久久久久| 在线观看wwwxxxx| 国产成人综合精品| 涩涩屋成人免费视频软件| 美日韩精品免费| 亚洲国产精品久久久久蝴蝶传媒| 看av免费毛片手机播放| 国产曰批免费观看久久久| www.久久国产| 亚洲欧美一区二区久久| 日本一区二区三区精品| 欧美一区二区三级| 毛片网站在线| 欧美黄色片视频| 久久久久五月天| 天堂久久一区| 欧美不卡福利| 国产精品av久久久久久麻豆网| 美女喷白浆视频| 99久久久精品| 性欧美videos| 欧美三级视频在线| 亚洲欧洲精品视频| 九九九久久久久久| 欧美日韩破处视频| 免费看成人av| 国内精品久久久久久久97牛牛 | 人成在线免费网站| 97netav| 婷婷亚洲五月色综合| 男操女免费网站| 91免费在线视频观看| 免费在线一区二区三区| 欧美人牲a欧美精品| www.视频在线.com| 欧美在线视频免费| 精品欠久久久中文字幕加勒比| 老司机午夜免费福利视频| 毛片av一区二区| xxx在线播放| 一本色道久久综合亚洲精品按摩| 人妻精品无码一区二区| 九九热视频这里只有精品| 伊人国产精品| 亚洲v国产v| 奇米在线7777在线精品| 欧美 日韩 成人| 色综合久久中文字幕| 婷婷国产在线| 欧美一级大片视频| 日本亚洲不卡| 久久久一本二本三本| 99久久99久久精品免费看蜜桃| 国产无码精品在线观看| 精品久久国产老人久久综合| 毛片在线导航| 成人片在线免费看| 欧美日韩综合| 日韩少妇一区二区| 午夜精品久久久久久久久久| 色综合久久久久久| 5566成人精品视频免费| 亚洲午夜久久| 国产理论在线播放| 国产精品不卡视频| 国产肥老妇视频| 欧美日本亚洲视频| 九九热hot精品视频在线播放| 黄色一级视频在线播放| 91农村精品一区二区在线| 自拍偷拍校园春色| 日韩中文字幕视频在线观看| 国产亚洲高清在线观看| 日本wwwcom| 91在线观看高清| 亚洲精品久久久久久久蜜桃| 一本一道久久a久久精品逆3p| 欧美风情在线视频| 欧美做暖暖视频| gogo大胆日本视频一区| 男人天堂av在线播放| 日韩在线视频网站| 一区二区三区四区精品视频| 伊人成色综合网| 国产欧美精品一区二区色综合| 一区二区三区免费观看视频| 久久久久久噜噜噜久久久精品| 网曝91综合精品门事件在线| 高清av免费看| 亚洲一区二区三区不卡国产欧美| 亚洲欧美综合一区二区| 成人国产精品免费视频| 亚洲午夜一区| 少妇精品无码一区二区免费视频|