精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

ViT作者飛機上也要讀的改進版Transformer論文,花2個小時詳細批注解讀分享出來

人工智能 新聞
這篇論文被他簡寫為DiffTranformer,不過不是Sora底層架構的那個Diffusion Transformer,而是不久前來自微軟的Differencial Transformer。

ViT核心作者Lucas Beyer,長文分析了一篇改進Transformer架構的論文,引起推薦圍觀。

他前不久從谷歌跳槽到OpenAI,這次是在飛機上閱讀論文并寫下了分析。

圖片

這篇論文被他簡寫為DiffTranformer,不過不是Sora底層架構的那個Diffusion Transformer,而是不久前來自微軟的Differencial Transformer。

論文中介紹,整體思路類似差分放大電路或降噪耳機,用兩個信號的差值來濾除共模噪聲,解決Transformer模型信噪比低的問題。

這篇論文發布時引起大量關注,但也面對一些質疑,在彈幕版alphaXiv上作者與讀者進行了很多討論。

圖片

Beyer起初也對這篇文章持保留態度,覺得“難道MHA中的兩個注意力頭不能學習到這些嗎?”。

但經過近期和同行的一些互動,覺得不應該輕易下定論,重新看了一遍論文后,他改變了看法圖片

我的最初印象被團隊的實驗徹底打破了,他們的實驗非常公平和謹慎。

圖片

此外還有一個彩蛋:

大佬通常會用坐飛機的時間來打4把Dota 2游戲快速模式。

現在寫這個帖子也不能當論文評審工作寫進簡歷,是純純的貢獻個人時間了,以后也不會常寫。

總之先給大佬點贊。

圖片

大佬解讀熱點論文

Beyer評價這篇論文的核心創新非常simple和nice,可以用一句話概括。

將兩個注意力頭配對,然后執行(softmax(Q1K1) - λ*softmax(Q2K2)) V,其中λ是一個可學習的標量。
圖片

他認為這項研究的動機非常充分:隨著上下文變長,(微小的)對不相關token的注意力之和可能超過對少數相關token的注意力,從而淹沒它們。

這一洞見表明,隨著輸入長度的增加,經典Transformer可能越來越難以捕捉到關鍵信息。DIFF Transformer試圖解決這一問題。

但他仍不確定對于訓練充分的模型來說這是個多大的問題,希望在DIFF Transformer論文中有一些關于attention分布/熵的圖表,以實際證明這個插圖的合理性。

圖片

接下來,他指出了幾個容易被忽視的細節:

  • 與Figure1不同,DiffAttn實際上并沒有對差值重新歸一化。那么它究竟如何放大”相關”的分數呢?

Beyer建議論文中能提供更多實際訓練的DIFF Transformer的分析圖表。

圖片

  • λ的計算相當復雜,涉及兩個可學習的指數函數之差,加上一些基線λ_init,在早期的層是0.1,后面又是0.8。

Beyer認為λ不一定需要是正值,并建議提供更多對可學習λ參數的分析。

  • 每個注意力頭的輸出都經過了層歸一化并乘以(1-λ_init),然后再concat并乘以WO,這里也需要更多圖表來證明。

圖片

接下來看論文中大量的實驗。研究者基本上分叉了了StableLM-3B-4E1T,稱之為Diff-3B,作為基線模型進行比較。

可惜的是,基線模型只在其中3個數據集上報告了結果,其中2個Diff-3B的表現都相當好。

Beyer懷疑這個StableLM-3B是否真的是一個強基線。
圖片

在參數量和token數的縮放曲線上,DIFF Transformer乍一看很有前景。但仔細觀察后,Beyer提出了兩點質疑:

  • 縮放曲線明顯分為兩組,在它們之間畫一條線有點牽強。查看附錄可知,研究者為較大的兩個模型降低了學習率。這是否意味著他們遇到了不穩定性問題?

圖片

  • 每次實驗只用了10B個token訓練,這個數量非常小。Beyer理解其中的計算資源限制,但仍然感到有點不安。

圖片

這些實驗表明,在相同大小的情況下,DIFF Transformer性能會更好一些,并且訓練時間相同。

然而,它的的推理速度也會慢一些(慢5-10%)。

Beyer提出最好能看到以計算量或實際時間為橫軸的縮放曲線。

圖片

在長文本評測和對輸入樣本順序的魯棒性方面,DIFF Transformer表現出了明顯的優勢。

特別是在上下文學習的魯棒性實驗中,DIFF Transformer在不同的樣本排列順序下,性能方差遠小于經典Transformer。

這表明它更不容易被輸入的細微變化擾亂,而經典Transformer容易受到樣本順序的影響,在最好和最壞情況下表現相差很大。

總的來說,Beyer對這篇論文的看法有所改觀:

研究者的實驗非常全面和謹慎,的確展現了DIFF Transformer比單純的”兩個注意力頭相減”更多的潛力

這項工作展現了一些有前景的火花。它在其他人的訓練任務中能否很好地復現、或帶來幫助,還有待進一步觀察。

Lucas Beyer是誰

12月初,Lucas Beyer與Xiaohua Zhai、Alexander Kolesnikov集體從谷歌被挖到OpenAI。

他們曾共同提出Vision Transformer,開創了Transformer在CV領域應用的先河。

圖片

據他個人官網中介紹,他在比利時長大,曾夢想制作電子游戲以及從事AI研究。

他在德國亞琛工業大學學習機械工程,并在那里獲得了機器人感知和計算機視覺博士學位,2018年加入谷歌。

圖片

除了這次長文分析DIFF Transformer之外,他還經常對新研究發表一些短的評論,比如最近火爆的DeepSeek v3,他也提出自己的建議。

圖片

總之是一位非常值得關注的學者。

DIFF Transformer論文:https://arxiv.org/abs/2410.05258

責任編輯:張燕妮 來源: 量子位
相關推薦

2022-09-06 08:31:09

線程池工具系統

2012-07-31 13:31:34

Windows 8鼠標鍵盤

2012-07-31 09:47:22

微軟Windows 8

2023-09-26 08:39:28

限流方式滑動窗口計數器

2023-11-28 12:49:01

AI訓練

2024-11-21 16:06:02

2025-01-07 12:43:14

2021-01-07 13:08:27

AI 數據人工智能

2014-07-01 10:15:52

2023-12-25 15:11:16

AI模型

2017-11-16 08:15:26

程序員Java程序

2024-03-25 12:39:00

AI數據

2022-02-08 15:43:08

AITransforme模型

2025-07-14 08:50:00

語言模型AI論文

2021-11-23 09:30:34

架構AI技術

2022-07-07 08:30:50

類型注解原生JS

2023-12-17 13:02:10

AI模型

2024-12-18 08:00:00

2024-11-12 06:23:50

ViTCIFAR10模型

2015-06-19 09:39:35

點贊
收藏

51CTO技術棧公眾號

三级av免费看| 日韩av不卡播放| 久久久一二三区| 欧美电影完整版在线观看| 欧美日韩亚洲网| 一区二区在线观| 秋霞视频一区二区| 日本成人在线一区| 欧美高跟鞋交xxxxhd| 巨胸大乳www视频免费观看| 欧美一级在线| 五月天欧美精品| 一区二区在线高清视频| 污污网站在线免费观看| 麻豆精品久久久| 97激碰免费视频| 91视频免费看片| 精品中国亚洲| 欧美日韩国产大片| 日本精品免费在线观看| a级影片在线| 久久久久久一二三区| eeuss一区二区三区| 自拍偷拍校园春色| 亚洲精品四区| 九九精品在线视频| 大胸美女被爆操| 伊人精品一区| 欧美精品一区二区三区高清aⅴ| 欧美成年人视频在线观看| 爱看av在线| 亚洲精品美国一| 亚洲欧洲一区二区在线观看| 三级在线视频| 成人高清视频在线观看| 91精品中文在线| 进去里视频在线观看| 在线综合亚洲| 久久久女人电视剧免费播放下载| 亚洲一二三四五六区| 免费看成人哺乳视频网站| 亚洲国产精品va在线看黑人动漫| www.色.com| 亚洲日韩中文字幕一区| 欧美性猛交xxxxxxxx| 免费成人在线视频网站| 九色porny丨入口在线| 一区二区激情视频| 一级全黄肉体裸体全过程| 大地资源中文在线观看免费版| 91一区二区三区在线观看| 国产视频99| 精品人妻一区二区三区浪潮在线 | 成人精品国产免费网站| 91久久夜色精品国产网站| 国产精品高潮呻吟久久久| 麻豆国产一区二区| 国产精品揄拍一区二区| 亚洲资源在线播放| 久久爱www久久做| 国产精品视频中文字幕91| 国产在线一级片| 免费高清成人在线| 成人午夜激情网| 国产精品主播一区二区| 国产精品一区二区三区乱码| 91丨九色丨国产| 免费观看黄色av| 99国产精品久久久久久久久久久| 国产综合 伊人色| 日韩a级作爱片一二三区免费观看| 91麻豆6部合集magnet| 欧美亚洲一级二级| 91精彩在线视频| 亚洲欧洲日产国产综合网| 久久天天东北熟女毛茸茸| 一色桃子av在线| 午夜欧美一区二区三区在线播放 | 美女网站视频久久| 成人情趣片在线观看免费| 国产成人精品免费看视频| 国产·精品毛片| 欧美精品人人做人人爱视频| 午夜激情视频在线| 一区二区三区不卡视频在线观看| 国产69精品久久久久久久| 日韩av中字| 91精品国产综合久久久蜜臀粉嫩| 日韩成人av影院| 一呦二呦三呦国产精品| 久久影视电视剧免费网站清宫辞电视| 久久这里只有精品国产| 久久国产精品久久w女人spa| 国产乱肥老妇国产一区二 | 极品国产91在线网站| 久久精品国产亚洲a| 97超碰人人模人人爽人人看| 日本一卡二卡四卡精品| 日韩美女久久久| 国产a级片网站| 国产三级一区| 精品国产青草久久久久福利| 少妇太紧太爽又黄又硬又爽小说| 中国精品18videos性欧美| 7m第一福利500精品视频| 国产精品久久久久久久成人午夜| 成人午夜视频福利| 亚洲视频欧美在线| 玖玖在线播放| 日韩欧美国产综合一区| www.av天天| 亚洲青色在线| 91在线精品播放| 精品亚洲综合| 亚洲午夜影视影院在线观看| 成人性生交免费看| 天堂av一区二区三区在线播放| 日韩一级黄色av| 久久久久久久久久久影院 | 国产熟妇久久777777| 影视一区二区| 国产精品免费一区豆花| 天堂av电影在线观看| 亚洲欧洲精品一区二区精品久久久 | 午夜国产福利在线| 91激情在线视频| 99久久99久久精品免费看蜜桃 | 亚洲欧美综合一区二区| 亚洲欧美在线视频观看| 天天干在线影院| 要久久爱电视剧全集完整观看 | 日韩色淫视频| 精品亚洲一区二区三区在线播放 | 91精品91久久久中77777| 国产在线观看免费播放| 欧美一区国产在线| 91九色视频在线| 18视频免费网址在线观看| 色综合网色综合| 在线免费观看成年人视频| 亚洲精品韩国| 国产伦精品一区二区三区四区视频| 超碰在线caoporn| 91精品国产欧美一区二区18| 性欧美疯狂猛交69hd| 免费亚洲电影在线| 亚洲精品8mav| 成人免费视频观看| 色偷偷综合社区| 亚洲午夜激情视频| 国产精品美女久久久久久久网站| 激情视频免费网站| 成人羞羞视频播放网站| 国产精品美女久久久久久免费| 日韩色妇久久av| 免费一级在线观看播放网址| 五月婷婷色综合| 亚洲av网址在线| 国产欧美91| 欧美日韩精品中文字幕一区二区| 亚洲精品成人图区| 夜夜嗨av一区二区三区免费区 | 欧美一级二级三级九九九| 午夜影院一区| 一区二区av在线| 97视频免费在线| 一区二区三区免费看视频| 一本色道久久hezyo无码| 99国产精品视频免费观看一公开| 久久久久久高清| 欧亚一区二区| 不卡av在线播放| 成人毛片在线精品国产| 色综合色综合色综合 | 一个色在线综合| 成人在线视频免费播放| 丝瓜av网站精品一区二区 | а√资源新版在线天堂| 欧美成人艳星乳罩| 国产99久久久| 亚洲欧美中日韩| 怡红院一区二区| 日韩二区三区四区| 日韩av一卡二卡| 三级黄色片网站| 日韩精品国产欧美| 一级全黄肉体裸体全过程| 国产精品黄网站| 国产精品久久久久秋霞鲁丝 | 久久久久这里只有精品| 蝌蚪视频在线播放| 91精品国产麻豆| 精品欧美一区二区三区免费观看| 中文字幕av一区二区三区高| 永久免费看片在线观看| 久久高清免费观看| 菠萝蜜视频在线观看入口| 最新精品国偷自产在线| 亚洲精品免费在线视频| 黑人精品一区| 欧美精品在线网站| 国产高清视频在线| 亚洲第一页中文字幕| 在线免费观看一区二区| 天天亚洲美女在线视频| 182在线观看视频| 91在线看国产| 少妇精品无码一区二区| 日本在线观看不卡视频| 激情伊人五月天| 在线精品小视频| 亚洲激情啪啪| 亚洲日产av中文字幕| 99re在线视频上| 999国产精品亚洲77777| 2019亚洲男人天堂| 免费在线播放电影| 久久视频在线直播| 成人高清免费在线播放| 亚洲娇小xxxx欧美娇小| 国产av精国产传媒| 欧美日韩国产综合草草| 波多野结衣 久久| 五月天亚洲婷婷| 国产精品18p| 亚洲免费观看视频| 女性裸体视频网站| 国产精品久久久久久久久免费桃花 | 在线观看视频中文字幕| 色综合久久99| 天堂在线免费观看视频| 亚洲国产精品人人做人人爽| 亚洲国产成人精品综合99| 日韩码欧中文字| 美女av免费看| 欧美视频官网| 精品国产一区二区精华| 中文字幕丰满人伦在线| 在线精品视频一区二区| 亚洲影院在线播放| 色噜噜狠狠色综合欧洲selulu| 亚洲国产综合久久| 午夜精品成人在线| 毛片视频网站在线观看| 欧美性猛交xxxx久久久| 日韩欧美高清在线观看| 狠狠综合久久av一区二区小说| 国产无遮挡aaa片爽爽| 亚洲国产精品综合小说图片区| 久久久久成人精品无码| 亚洲精品视频在线观看免费| 欧美卡一卡二卡三| 亚洲国产色一区| 免费日韩一级片| 欧美性猛交xxxx乱大交3| 中文字幕激情小说| 欧美丝袜自拍制服另类| 91资源在线视频| 日韩欧美一二三四区| 国精产品一品二品国精品69xx| 精品av综合导航| 日韩精品系列| 国产一区二区三区视频免费| 在线观看麻豆| 久久999免费视频| 麻豆mv在线观看| 国产成人精品国内自产拍免费看 | 91官网在线免费观看| 中文字幕久久网| 日韩一区二区三区视频在线观看| 精品人妻一区二区三区蜜桃| 亚洲成人教育av| 国产美女视频一区二区三区| 日韩中文理论片| 蜜桃成人365av| 日韩av片免费在线观看| 国内欧美日韩| 国产精品国产精品国产专区蜜臀ah | 欧美va亚洲va香蕉在线| 亚洲欧美色视频| 色偷偷9999www| 国产偷倩在线播放| 国产精品99久久久久久白浆小说 | 日本免费高清一区| 88国产精品视频一区二区三区| 人妻互换免费中文字幕| 久久久噜噜噜| 亚洲av无码久久精品色欲| 91麻豆6部合集magnet| 婷婷伊人五月天| 欧美日韩亚洲一区二区| 国产男男gay体育生白袜| 国产va免费精品观看精品| 日本亚洲欧美成人| 免费精品一区| 日韩三级电影| 亚洲国产网站| 国产乱女淫av麻豆国产| 97se狠狠狠综合亚洲狠狠| 国产精品免费在线视频| 欧美日韩国产丝袜美女| 国产精品高潮呻吟久久久| 亚洲精品一区久久久久久| 尤物视频在线看| 国产精品视频久久久| 高清日韩欧美| 欧美xxxx吸乳| 美女视频免费一区| 91av在线免费| 一区二区三区精品久久久| 中文字幕人妻丝袜乱一区三区| 亚洲高清久久久久久| 超碰在线免费播放| 国产精品一区专区欧美日韩| 日本妇女一区| 久青草视频在线播放| 麻豆国产一区二区| 欧美18—19性高清hd4k| 五月婷婷另类国产| 丰满人妻一区二区三区免费视频| 少妇激情综合网| 久久久成人av毛片免费观看| 国产一级二级三级精品| 国内一区二区三区| 污污的视频免费观看| 中文字幕乱码亚洲精品一区| 亚洲天堂视频网站| 日韩国产中文字幕| а√天堂中文资源在线bt| 亚洲综合在线中文字幕| 午夜欧美在线| 色婷婷一区二区三区av免费看| 中文字幕欧美日韩一区| 久久亚洲精品石原莉奈| 日韩精品免费在线观看| sm久久捆绑调教精品一区| 国产精品区一区二区三在线播放| 五月精品视频| 国内自拍第二页| 中文字幕制服丝袜成人av| 亚洲一级特黄毛片| 中文字幕v亚洲ⅴv天堂| 视频精品导航| 一区二区国产日产| 久久aⅴ国产欧美74aaa| 乱老熟女一区二区三区| 欧美伦理视频网站| 黄色网页在线看| 亚洲最大的成人网| 欧美激情精品久久久六区热门| 亚洲色图偷拍视频| 亚洲免费观看视频| 亚洲av无码一区二区三区性色| 欧美成人性色生活仑片| 91精品国产自产在线丝袜啪| 大荫蒂性生交片| 99久久综合狠狠综合久久| 亚洲欧美综合另类| 在线观看日韩欧美| 日日狠狠久久| 国产精品8888| 成人精品亚洲人成在线| 麻豆久久久久久久久久| 亚洲午夜女主播在线直播| 素人一区二区三区| www.亚洲一区二区| 成人av在线网站| 丁香社区五月天| 最近2019年好看中文字幕视频 | 精品国产乱子伦一区| av3级在线| 欧洲精品久久| 黑人巨大精品欧美一区| 国产成人精品av久久| 亚洲欧美在线看| 97久久精品一区二区三区的观看方式 | 欧美日韩国内| 鲁大师私人影院在线观看| 色国产综合视频| 国产黄色在线免费观看| 精品视频第一区| 麻豆91在线观看| 国产一级一片免费播放| 亚洲天堂网在线观看| 久久久久久爱| 国产男女在线观看| 亚洲欧美日韩国产综合在线| 亚洲欧美日本在线观看| 成人a在线观看| 国产精品久久久免费| 91免费公开视频| 精品亚洲夜色av98在线观看| 亚洲一区二区小说| 欧美日韩激情视频在线观看| 日韩一区中文字幕| 艳母动漫在线看| 亚洲一区久久久| 日韩和欧美一区二区三区| 久久精品国产亚洲av麻豆色欲| 中文字幕精品网|