精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

田淵棟新作:打開1層Transformer黑盒,注意力機制沒那么神秘

人工智能 新聞
最近田淵棟博士公布了團隊的最新研究成果,以數學嚴格方式,分析了1層Transformer(一個自注意力層加一個解碼器層)在下一個token預測任務上的SGD訓練動態。

Transformer架構已經橫掃了包括自然語言處理、計算機視覺、語音、多模態等多個領域,不過目前只是實驗效果非常驚艷,對Transformer工作原理的相關研究仍然十分有限。

其中最大謎團在于,Transformer為什么僅依靠一個「簡單的預測損失」就能從梯度訓練動態(gradient training dynamics)中涌現出高效的表征?

最近田淵棟博士公布了團隊的最新研究成果,以數學嚴格方式,分析了1層Transformer(一個自注意力層加一個解碼器層)在下一個token預測任務上的SGD訓練動態。

圖片

論文鏈接:https://arxiv.org/abs/2305.16380

這篇論文打開了自注意力層如何組合輸入token動態過程的黑盒子,并揭示了潛在的歸納偏見的性質。

具體來說,在沒有位置編碼、長輸入序列、以及解碼器層比自注意力層學習更快的假設下,研究人員證明了自注意力就是一個判別式掃描算法(discriminative scanning algorithm)

從均勻分布的注意力(uniform attention)開始,對于要預測的特定下一個token,模型逐漸關注不同的key token,而較少關注那些出現在多個next token窗口中的常見token

對于不同的token,模型會逐漸降低注意力權重,遵循訓練集中的key token和query token之間從低到高共現的順序。

有趣的是,這個過程不會導致贏家通吃,而是由兩層學習率控制的相變而減速,最后變成(幾乎)固定的token組合,在合成和真實世界的數據上也驗證了這種動態。

田淵棟博士是Meta人工智能研究院研究員、研究經理,圍棋AI項目負責人,其研究方向為深度增強學習及其在游戲中的應用,以及深度學習模型的理論分析。先后于2005年及2008年獲得上海交通大學本碩學位,2013年獲得美國卡耐基梅隆大學機器人研究所博士學位。

曾獲得2013年國際計算機視覺大會(ICCV)馬爾獎提名(Marr Prize Honorable Mentions),ICML2021杰出論文榮譽提名獎。

曾在博士畢業后發布《博士五年總結》系列,從研究方向選擇、閱讀積累、時間管理、工作態度、收入和可持續的職業發展等方面對博士生涯總結心得和體會。

揭秘1層Transformer

基于Transformer架構的預訓練模型通常只包括非常簡單的監督任務,比如預測下一個單詞、填空等,但卻可以為下游任務提供非常豐富的表征,實在是令人費解。

之前的工作雖然已經證明了Transformer本質上就是一個通用近似器(universal approximator),但之前常用的機器學習模型,比如kNN、核SVM、多層感知機等其實也是通用近似器,這種理論無法解釋這兩類模型在性能上的巨大差距。

圖片

研究人員認為,了解Transformer的訓練動態(training dynamics)是很重要的,也就是說,在訓練過程中,可學習參數是如何隨時間變化的。

文章首先以嚴謹數學定義的方式,形式化描述了1層無位置編碼Transformer的SGD在下一個token預測(GPT系列模型常用的訓練范式)上的訓練動態。

1層的Transformer包含一個softmax自注意力層和預測下一個token的解碼器層。

圖片

在假設序列很長,而且解碼器的學習速度比自注意力層快的情況下,證明了訓練期間自注意力的動態行為:

1. 頻率偏差Frequency Bias

模型會逐漸關注那些與query token大量共現的key token,而對那些共現較少的token降低注意力。

2. 判別偏差Discrimitive Bias

模型更關注那些在下一個要預測的token中唯一出現的獨特token,而對那些在多個下一個token中出現的通用token失去興趣。

這兩個特性表明,自注意力隱式地運行著一種判別式掃描(discriminative scanning)的算法,并存在歸納偏差(inductive bias),即偏向于經常與query token共同出現的獨特的key token

此外,雖然自注意力層在訓練過程中趨向于變得更加稀疏,但正如頻率偏差所暗示的,模型因為訓練動態中的相變(phase transition),所以不會崩潰為獨熱(one hot)。

圖片

學習的最后階段并沒有收斂到任何梯度為零的鞍點,而是進入了一個注意力變化緩慢的區域(即隨時間變化的對數),并出現參數凍結和學會(learned)。

研究結果進一步表明,相變的開始是由學習率控制的:大的學習率會產生稀疏的注意力模式,而在固定的自注意力學習率下,大的解碼器學習率會導致更快的相變和密集的注意力模式。

研究人員將工作中發現的SGD動態命名為掃描(scan)和snap:

掃描階段:自注意力集中在key tokens上,即不同的、經常與下一個預測token同時出現的token;其他所有token的注意力都下降。

snap階段:注意力全中幾乎凍結,token組合固定。

圖片

這一現象在簡單的真實世界數據實驗中也得到驗證,使用SGD在WikiText上訓練的1層和3層Transformer的最低自注意力層進行觀察,可以發現即使在整個訓練過程中學習率保持不變,注意力也會在訓練過程中的某一時刻凍結,并變得稀疏。

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-12-19 09:48:07

2024-02-26 00:20:00

AI模型

2024-10-31 10:00:39

注意力機制核心組件

2024-10-28 08:50:00

2025-10-08 10:19:29

2024-12-04 09:25:00

2018-08-26 22:25:36

自注意力機制神經網絡算法

2024-12-17 14:39:16

2023-11-24 12:36:00

模型訓練

2022-07-03 14:06:27

元宇宙交互技術AR

2025-02-17 09:30:00

AI訓練模型

2025-06-03 08:43:00

2024-09-19 10:07:41

2023-03-17 08:28:17

GPT-4AI

2024-03-08 12:35:41

模型數據

2024-12-12 09:00:00

2024-10-16 13:50:00

模型AI

2012-08-16 12:50:29

2023-07-25 13:57:28

模型AI

2025-10-23 08:25:08

點贊
收藏

51CTO技術棧公眾號

绿色成人影院| 黑人一级大毛片| 亚洲狼人在线| 亚洲一区在线观看视频| 欧美精品与人动性物交免费看| 国产真人无遮挡作爱免费视频| 秋霞欧美视频| 精品国产污网站| 免费男同深夜夜行网站| 97超碰资源站在线观看| 久久青草国产手机看片福利盒子| 国产精品一区二区久久| 国产精品1000| 99久久精品国产亚洲精品| 精品国产91九色蝌蚪| 男女视频在线看| 3344国产永久在线观看视频| 国产精品萝li| 日本一区二区三区在线视频| 亚洲av无码一区二区乱子伦| 毛片基地黄久久久久久天堂| 91po在线观看91精品国产性色| 亚洲天堂精品一区| 婷婷综合成人| 日韩欧美一二三四区| 国产视频在线视频| 亚洲精华液一区二区三区| 尤物视频一区二区| 亚洲欧洲精品在线| 黄色av网址在线免费观看| a级精品国产片在线观看| 成人精品视频99在线观看免费 | 亚洲成年人影院| 先锋影音网一区| 日本韩国精品一区二区| av男人天堂一区| 成人欧美一区二区| 精品国自产在线观看| 久久国产精品色婷婷| 欧美在线视频网| 影音先锋亚洲天堂| 亚洲二区在线| 久久久久久中文字幕| 加勒比婷婷色综合久久| 亚洲精品电影| xxxxx成人.com| 成人三级视频在线观看| 色婷婷综合网| 日韩中文字幕欧美| 91视频最新网址| 国产精品不卡| 日韩有码在线电影| 中文字幕资源站| 欧美疯狂party性派对| 中日韩美女免费视频网站在线观看| 人妻无码中文久久久久专区| 超碰精品在线| 日韩av综合中文字幕| 日韩免费高清一区二区| 欧美一区 二区| 亚洲精品网站在线播放gif| 无码人妻精品一区二区三区温州 | 日韩欧美亚洲日产国| 成全电影播放在线观看国语| 中文字幕va一区二区三区| 神马影院我不卡午夜| 日韩黄色影院| 99re6这里只有精品| 免费一区视频| 97精品视频在线| 久久草视频在线| 亚洲欧美日韩在线观看a三区 | 免费成人直播| 在线观看亚洲成人| 五月激情五月婷婷| 伊人www22综合色| 欧美精品一区二区三区在线| 粉嫩av懂色av蜜臀av分享| 亚洲资源网站| 中日韩美女免费视频网址在线观看 | 日韩在线视频线视频免费网站| 亚洲国产精品一区二区久久hs| 久久精品国内一区二区三区水蜜桃| 久久色免费在线视频| 久久精品视频久久| 天使萌一区二区三区免费观看| 国产精品香蕉在线观看| 精品久久久久久亚洲综合网站| 福利电影一区二区| 欧美人xxxxx| 麻豆视频免费在线观看| 亚洲成国产人片在线观看| 88av.com| 日韩不卡在线视频| 亚洲欧美综合精品久久成人| 成人高潮免费视频| 午夜在线视频观看日韩17c| 国产日本欧美一区二区三区| 肥臀熟女一区二区三区| 国产日韩欧美亚洲| 国产一区二区三区小说| 3d性欧美动漫精品xxxx软件| 日韩欧美激情一区| 免费在线观看污| 亚洲国产精品日韩专区av有中文| 91精品国产高清自在线看超| 国产精品嫩草影院桃色| 久久久久久电影| 国产又大又长又粗又黄| 日韩伦理精品| 日韩欧美精品三级| 久久久噜噜噜久久| 成人性生生活性生交12| 人人爱人人干婷婷丁香亚洲| 亚洲人成免费电影| 久久精品欧美一区二区| 久久精品国产网站| 欧美亚洲另类在线一区二区三区| 黄色网址视频在线观看| 欧美日韩中文字幕综合视频| 26uuu国产| 久久精品国产68国产精品亚洲| 668精品在线视频| www.黄色片| 中文字幕一区二区三区色视频| 亚洲自偷自拍熟女另类| 中文字幕亚洲在线观看| 精品国产一区二区三区久久久狼| 国产婷婷色一区二区在线观看| 成人精品免费视频| 成人午夜免费剧场| 9.1麻豆精品| 在线成人中文字幕| 免费av中文字幕| 91麻豆swag| 欧美,日韩,国产在线| 国产精品成人自拍| 欧美激情第三页| www.久久成人| 一区二区三区在线免费播放| 日本特黄在线观看| 欧美1区免费| 96成人在线视频| 日本高清在线观看| 日韩精品一区二区三区老鸭窝 | 日本精品久久中文字幕佐佐木| 韩国av永久免费| 亚洲福利视频一区二区| 一级黄色片毛片| 在线观看视频日韩| 九九久久99| 中文字幕影音在线| 亚洲视频欧洲视频| 欧美一级做a爰片免费视频| 国产欧美中文在线| 久久99999| 日韩激情图片| 成人黄色av播放免费| 伊人精品久久久久7777| 国产精品视频二区三区| 在线观看亚洲精品| 在线免费看视频| 国产精品影视天天线| 日韩人妻精品一区二区三区| 亚洲啊v在线免费视频| 久久久久久一区二区三区 | 精品视频在线播放色网色视频| 你懂的国产视频| 久久久无码精品亚洲日韩按摩| 能看的毛片网站| 99精品综合| 99国产在线观看| 毛片在线网站| 中文字幕久精品免费视频| 91久久精品无码一区二区| 亚洲免费观看高清完整版在线 | 欧美在线关看| 国产精品www色诱视频| 欧美r级在线| 日韩免费看网站| 国产成人无码精品久在线观看| 91视频国产资源| 欧美三级午夜理伦三级富婆| 9191国语精品高清在线| 国产偷国产偷亚洲高清97cao| 台湾佬成人网| 美女视频黄免费的亚洲男人天堂| 人人妻人人澡人人爽精品日本| 色噜噜狠狠成人网p站| 亚洲综合视频网站| 久久综合视频网| 91精品999| 国产亚洲激情| 日本特级黄色大片| 日本在线中文字幕一区| 国产日韩欧美一二三区| heyzo一区| 综合网中文字幕| 免费观看黄色av| 欧美日韩精品一区二区| 国产五月天婷婷| 中日韩av电影| 亚洲蜜桃精久久久久久久久久久久| 日韩av不卡一区二区| 久久免费一级片| 精品久久视频| 亚洲欧洲国产一区| 日本一区二区三区视频免费看| 国内精彩免费自拍视频在线观看网址 | 日本久久综合| 精品久久久久久乱码天堂| 二区三区精品| 国产成人精品视| 91超碰在线| 欧美猛交ⅹxxx乱大交视频| 国产视频福利在线| 亚洲国内高清视频| 亚洲精品综合网| 欧美高清精品3d| 探花国产精品一区二区| 欧美日韩亚洲一区二区三区| 久久久精品视频免费观看| 国产精品色呦呦| 国产精品jizz| av不卡在线观看| 野花视频免费在线观看| 狠狠狠色丁香婷婷综合激情| 成年人在线观看视频免费| 亚洲麻豆一区| 天堂8在线天堂资源bt| 亚洲精品成人无限看| 亚洲一区美女| 成人精品久久| 亚洲国产精品123| 禁果av一区二区三区| 动漫一区二区在线| 日韩欧美中文字幕在线视频| 91精品国产综合久久香蕉922| 亚洲国产尤物| 国产精品白嫩美女在线观看| 成人香蕉视频| 日韩免费av片在线观看| 88xx成人免费观看视频库| 欧美中文在线观看国产| 天堂中文在线播放| 欧美与黑人午夜性猛交久久久| 成入视频在线观看| 国产91精品青草社区| 国产美女高潮在线观看| 97久久国产精品| 在线看的毛片| 国产成人精品日本亚洲专区61| 欧美日韩精品免费观看视完整| 国产成+人+综合+亚洲欧美丁香花| 欧美黄色网页| 国产精品一区电影| 秋霞一区二区三区| 国产精品一区免费观看| 亚洲日产av中文字幕| 日本一区高清不卡| 日韩理论片av| 中文字幕在线视频日韩| 2018日日夜夜| 日韩欧美大片| 中文字幕一区二区三区乱码| 亚洲女同中文字幕| 日韩视频一二三| 亚洲国产精品第一区二区| 国产九九九九九| 青娱乐精品在线视频| 怡红院亚洲色图| 国产一区二区按摩在线观看| 中文字幕无码毛片免费看| 成人av电影在线| 亚洲黄色小说视频| 日韩久久一区二区| 国产精品7777| 日本乱码高清不卡字幕| 国产精品一区二区免费视频| 精品成a人在线观看| 日韩欧美亚洲系列| 久久精品中文字幕免费mv| caoporn视频在线观看| 国产成人免费av| 欧美电影院免费观看| 久久国产精品久久| 欧美hd在线| 99在线免费视频观看| 日日摸夜夜添夜夜添精品视频| www.久久av.com| av一二三不卡影片| 免费成人深夜蜜桃视频| 亚洲国产成人91porn| 最近中文字幕免费在线观看| 日韩欧美国产三级| 黄视频在线观看免费| 欧美老女人性视频| 日韩中文在线播放| 俄罗斯精品一区二区| 久久一级电影| 免费无码不卡视频在线观看| 精品一区二区三区av| 无码人妻精品一区二区三应用大全| 亚洲特级片在线| 尤物视频免费观看| 欧美精品一区二区久久婷婷| 三区四区在线视频| 97视频免费看| 精品一区二区三区亚洲| 日产精品一线二线三线芒果| 欧美午夜国产| 99re6在线观看| 久久久久国产精品人| 中文字幕一区二区三区手机版| 欧美日韩国产在线观看| 精品av中文字幕在线毛片 | 亚洲色婷婷一区二区三区| 91久久精品网| 亚洲日本香蕉视频| 久久久久中文字幕2018| 电影一区中文字幕| 亚洲欧洲精品在线观看| 蜜桃av一区| 精品亚洲一区二区三区在线播放| 中文字幕免费观看视频| 亚洲精品日韩欧美| 成人在线黄色电影| 国产精品国产精品国产专区不卡| 91一区在线| 男女污污的视频| 久久天堂av综合合色蜜桃网| 久久久久久久黄色片| 欧美电影免费提供在线观看| av激情在线| 91视频国产一区| 久久精品影视| theporn国产精品| 中文字幕一区二区三区乱码在线| 国产免费a视频| 国产一区二区三区在线| 在线天堂资源| 欧美日本韩国国产| 久久一区二区三区超碰国产精品| 国产福利短视频| 欧美性生交xxxxx久久久| 天堂a中文在线| 日本精品久久久| 国产亚洲一卡2卡3卡4卡新区| 欧美在线观看成人| 99re热这里只有精品视频| 亚洲日本韩国在线| 亚洲香蕉成人av网站在线观看| 日韩成人高清| 亚洲欧洲精品在线| 国产毛片精品一区| 久久丫精品久久丫| 亚洲精品久久久一区二区三区| 蜜桃视频在线观看免费视频| 久久av一区二区三区漫画| 羞羞视频在线观看欧美| av网站免费在线看| 91.com视频| 久草在线视频福利| 久久66热这里只有精品| 石原莉奈在线亚洲三区| 5566中文字幕| 精品国产乱码久久久久久图片| 欧产日产国产精品视频 | 青青青草原在线| 国产精品www| 欧美一区精品| av网站有哪些| 欧美日韩国产一级片| 日韩激情av| 麻豆成人在线播放| 精品制服美女久久| 国产真实的和子乱拍在线观看| 精品呦交小u女在线| 国产激情欧美| 国产天堂视频在线观看| 久久久久久久久伊人| 国产偷拍一区二区| 97精品久久久| 欧美电影三区| 亚洲色图14p| 欧美夫妻性生活| 牛牛精品一区二区| 伊人久久大香线蕉午夜av| 成人免费电影视频| 伊人影院中文字幕| 欧美精品久久久久久久| 欧美最新另类人妖| 野战少妇38p| 欧美日韩的一区二区| 国产伦精品一区二区三区精品| 欧美一级一区| 欧美第一页在线观看| 亚洲精品视频在线播放| 麻豆精品久久| 亚洲少妇久久久|