精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

微軟清華改進Transformer:用降噪耳機原理升級注意力,一作在線答疑

人工智能 新聞
新架構(gòu)在長上下文建模、關(guān)鍵信息檢索、減少幻覺、提高上下文學(xué)習(xí)能力以及減少激活異常值等各項指標(biāo)中,普遍優(yōu)于Transformer架構(gòu)。

Transformer自問世后就大放異彩,但有個小毛病一直沒解決:

總愛把注意力放在不相關(guān)的內(nèi)容上,也就是信噪比低

現(xiàn)在微軟亞研院、清華團隊出手,提出全新改進版Differential Transformer,專治這個老毛病,引起熱議。

圖片

論文中介紹,整體思路類似差分放大電路或降噪耳機,用兩個信號的差值來濾除共模噪聲。

圖片

具體到在語言模型中,如果句子很長,只有少數(shù)token會真正影響當(dāng)前token的含義。而注意力機制允許每兩個詞之間產(chǎn)生交互,其中就包含大量噪聲了。

團隊提出的方法是在注意力層中增加一個Softmax,然后兩個Softmax做減法。

這一減,噪音信息就被大幅抵消,讓注意力更集中在相關(guān)內(nèi)容上。

圖片

語言建模任務(wù)上的一系列實驗結(jié)果顯示,僅需約65%的模型大小或訓(xùn)練tokens,DIFF Transformer就能達到與傳統(tǒng)Transformer相當(dāng)?shù)男阅堋?/p>

新架構(gòu)在長上下文建模、關(guān)鍵信息檢索、減少幻覺、提高上下文學(xué)習(xí)能力以及減少激活異常值等各項指標(biāo)中,普遍優(yōu)于Transformer架構(gòu)。

圖片

論文上傳到arXiv平臺后,有不少學(xué)者到彈幕版alphaXiv劃線提問。一作Tianzhu Ye正絕贊在線答疑中。

圖片

差分Transformer

與傳統(tǒng)Tranformer相比,DIFF Transformer保持宏觀架構(gòu)不變,主要區(qū)別在于用差分注意力替換傳統(tǒng)softmax注意力。

此外還采用了LLaMA系列中的一些改進,如pre-RMSNorm歸一化和SwiGLU激活函數(shù)。

在差分注意力模塊中,需要先給Q和K分成兩個組,然后分別計算softmax。

第二組乘了一個標(biāo)量λ,是可學(xué)習(xí)的參數(shù),在同一層的注意力頭之間共享。

λ的引入是為了在差分操作中平衡兩組注意力的貢獻,使得差分注意力機制能夠更好地適應(yīng)不同的任務(wù)需求和數(shù)據(jù)分布。
圖片

接下來是一系列實驗結(jié)果。

語言建模評估

在1T tokens上訓(xùn)練3B大小的DIFF Transformer,遵循 StableLM-3B-4E1T的配方,在各種下游任務(wù)中與以前訓(xùn)練良好的Transformer模型相比表現(xiàn)出優(yōu)勢。
圖片

可擴展性評估

只需約65%的模型參數(shù)或訓(xùn)練tokens來匹配Transformer的性能。

圖片

長上下文能力評估

在額外1.5B tokens上訓(xùn)練3B大小的DIFF Transformer,擴展上下文長度至64k。

隨著上下文長度增加,累計平均負對數(shù)似然(NLL)持續(xù)降低,并且比傳統(tǒng)Transformer的NLL值更低。

表明DIFF Transformer可以有效利用不斷增加的上下文。

圖片

關(guān)鍵信息檢索能力評估

也就是多個“針”的大海撈針試驗,設(shè)置不同的上下文長度(4K和64K)來模擬不同復(fù)雜程度的信息檢索場景。

在4K上下文長度下,隨著插入 “針” 數(shù)量和查詢數(shù)量的增加,DIFF Transformer的準(zhǔn)確率保持穩(wěn)定,而Transformer 的準(zhǔn)確率顯著下降。

圖片

在64K上下文長度下,DIFF Transformer在不同答案針深度(即關(guān)鍵信息在長上下文中的位置)和上下文長度下都能保持穩(wěn)定性能,且在關(guān)鍵信息位于上下文前半部分時優(yōu)勢明顯。

特別是當(dāng)關(guān)鍵信息位于25%深度時,DIFF Transformer比Transformer的準(zhǔn)確率提高了 76%。

圖片

上下文學(xué)習(xí)能力評估

分為兩個角度來評估,分別是多樣本分類和上下文學(xué)習(xí)的穩(wěn)健性。

多樣本分類任務(wù),同樣使用64K上下文長度的3B參數(shù)模型,DIFF Transformer的準(zhǔn)確率始終高于Transformer,提升幅度從5.2%到21.6%不等

圖片

上下文學(xué)習(xí)穩(wěn)健性采用排列順序任務(wù),DIFF Transformer的結(jié)果方差遠小于傳統(tǒng)Transformer。
圖片

上下文幻覺評估

主要關(guān)注輸入中包含正確事實,但模型仍然無法產(chǎn)生準(zhǔn)確輸出的情況。

將模型輸出與ground-truth一起發(fā)給GPT-4o,讓GPT-4o來判斷是否存在幻覺,此前試驗表明GPT-4o與人類評判結(jié)果一致率較高,相對可靠。

在不同數(shù)據(jù)集上DIFF Transformer的準(zhǔn)確率更高,幻覺更少。
圖片

激活異常值分析

Transformer中的激活異常值,導(dǎo)致模型在訓(xùn)練和推理過程中難以量化。

試驗比較了注意力logits和隱藏狀態(tài)兩種激活類型下的最大激活值,DIFF Transformer都表現(xiàn)出更低的頂部激活值,即產(chǎn)生更少的激活異常值。

在對注意力logits進行量化實驗時,DIFF Transformer在降低比特寬度量化時仍能保持較高性能,而Transformer在6-bi 量化時準(zhǔn)確性顯著下降。

4-bit的DIFF Transformer能達到與6-bit的Transformer相當(dāng)?shù)臏?zhǔn)確性,且比4-bit的Transformer準(zhǔn)確率提高約 25%。

圖片

代碼已開源, 降噪耳機類比引熱議

對于目前讀者的疑問,作者已做出幾點答復(fù)

問題1:Diff Transformer與每個注意力頭溫度可學(xué)習(xí)的方法有什么不同?與門控注意力對比如何?

作者回應(yīng)在實驗中,可學(xué)習(xí)溫度效果不大。而本文方法是門控注意力的改進。

圖片

問題2:差分注意力是否意味著將標(biāo)準(zhǔn)注意力矩陣參數(shù)翻倍?

作者澄清,單個注意力頭維度翻倍,但是注意力頭數(shù)量減半,總體在參數(shù)和FLOPS上都是對齊的。

圖片

問題3:第二組Softmax乘可學(xué)習(xí)參數(shù)lambda的研究思路。

作者也做出詳細回應(yīng)。

圖片

DIFF Transformer在純學(xué)術(shù)圈之外也引起非常多的討論,有不少人困惑論文中將方法與降噪耳機的類比。

降噪耳機采集環(huán)境噪聲并生成相反的信號,在這種情況下哪些信號屬于噪聲是已知的,但差分注意力中并不能事先確定哪些是噪聲。

圖片

一種解釋是,低注意力分數(shù)的噪聲也有很低的梯度,因此模型其實已知哪些是噪聲,只是單個Softmax無法輸出0,所以噪聲很難去除。

圖片

也有人提出,比起降噪耳機,其實專業(yè)音頻中“平衡線”,或者USB、網(wǎng)卡等傳輸方式更適合一些。

使用兩條信號線傳輸正負信號,接收器只對比他們之間的差異,由于在空間中離得很近,受到的干擾是相同的。

有用的正負信號相減會被放大,相同的噪聲相減卻被抵消,大大增強抗干擾能力。

圖片

總之,DIFF Transformer代碼已開源在微軟unilm項目下,其中還包含魔改版支持差分注意力的FlashAttention-2的代碼。

感興趣的可以試起來了。

圖片

論文:https://arxiv.org/abs/2410.05258

代碼:https://aka.ms/Diff-Transformer

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2024-10-09 15:30:00

2024-10-09 13:22:10

2025-10-22 08:52:23

2024-02-19 00:12:00

模型數(shù)據(jù)

2024-10-31 10:00:39

注意力機制核心組件

2022-02-08 15:43:08

AITransforme模型

2024-09-19 10:07:41

2025-06-09 08:52:00

2024-12-04 09:25:00

2011-07-07 13:12:58

移動設(shè)備端設(shè)計注意力

2025-02-25 09:40:00

模型數(shù)據(jù)AI

2024-07-01 12:17:54

2024-12-17 14:39:16

2023-11-24 12:36:00

模型訓(xùn)練

2018-08-26 22:25:36

自注意力機制神經(jīng)網(wǎng)絡(luò)算法

2021-02-02 14:47:58

微軟PyTorch可視化

2025-04-07 07:47:00

模型訓(xùn)練AI

2023-05-05 13:11:16

2023-06-12 09:57:22

AIChatGPT

2023-07-29 13:26:51

模型AI
點贊
收藏

51CTO技術(shù)棧公眾號

av一区观看| 亚洲图片欧洲图片av| 久久久久久www| 三级视频在线播放| 蜜臀av亚洲一区中文字幕| 欧美成人激情视频| 性久久久久久久久久| 日韩一级特黄| 精品国产福利视频| 一本久道久久综合| 秋霞网一区二区| 久久国产剧场电影| 国产91精品高潮白浆喷水| 午夜影院黄色片| 国产精品香蕉| 欧美日本韩国一区| 国产中文字幕在线免费观看| 米奇精品一区二区三区| 99久久久免费精品国产一区二区| 国产精品色视频| 免费日韩一级片| 亚洲成人tv| 亚洲欧美日韩一区在线| 日本人dh亚洲人ⅹxx| 国产精品蜜芽在线观看| 亚洲视频一区二区在线观看| 蜜桃导航-精品导航| 亚洲国产精品视频在线| 久久精品72免费观看| 日本一欧美一欧美一亚洲视频| 手机在线免费看毛片| 激情五月综合| 亚洲电影免费观看高清| 日韩高清在线一区二区| 国产乱子伦农村叉叉叉| 日本少妇激情舌吻| 亚洲综合自拍| 中文字幕日韩av电影| 日本丰满少妇裸体自慰| 视频成人永久免费视频| 91精品国产色综合久久| 久久久久久蜜桃一区二区| 中文在线资源| 欧美日韩久久久久| 日韩精品在线观看av| av黄在线观看| 亚洲婷婷在线视频| 亚洲 欧洲 日韩| 97在线观看免费观看高清| 久久久电影一区二区三区| 国产在线精品日韩| 天堂在线观看av| 国产91对白在线观看九色| 成人网欧美在线视频| 中文字幕人妻色偷偷久久| 奇米精品一区二区三区在线观看一| 91国产视频在线| 国产成人精品a视频一区| 一区在线免费观看| 91极品女神在线| 日韩久久精品视频| 国产一区二区三区的电影 | 中文字幕久精品免| 欧洲日本在线| 亚洲欧美色一区| 波多野结衣 作品| 羞羞视频在线观看免费| 亚洲一卡二卡三卡四卡无卡久久| 欧美精品在欧美一区二区| 手机在线免费观看av| 一区二区三区四区五区视频在线观看| 777久久精品一区二区三区无码 | 亚洲乱码电影| 欧美国产精品va在线观看| 久久久国产精华液| 国产一区二区三区久久久久久久久| 欧美在线影院在线视频| 亚洲色成人www永久网站| 蜜桃视频第一区免费观看| 成人午夜小视频| www国产一区| 91亚洲精品一区二区乱码| 欧美亚州在线观看| 秋霞a级毛片在线看| 亚洲综合视频网| 日韩av片在线看| 99riav视频一区二区| 欧美一区二区视频在线观看2020 | 欧美成人性色生活仑片| 久久机热这里只有精品| 一本色道久久综合亚洲精品不卡| 日本久久久a级免费| 中文字幕在线观看免费| 国产乱码精品一区二区三区忘忧草 | 国产95亚洲| 精品av久久707| www亚洲色图| 好吊视频一区二区三区四区| 奇门遁甲1982国语版免费观看高清| 高潮无码精品色欲av午夜福利| 久久99精品国产91久久来源| 国产99在线免费| www.中文字幕久久久| 一区二区日韩电影| 一本色道无码道dvd在线观看| www一区二区三区| 日韩大陆毛片av| 午夜免费激情视频| 日韩经典一区二区| 国产福利久久精品| 性开放的欧美大片| 黑人精品xxx一区一二区| 潘金莲激情呻吟欲求不满视频| 国产精品久久久网站 | 国产免费一区二区三区网站免费| 黄色小视频在线观看| 亚洲三级在线免费| 五月天婷婷激情视频| 国产伦理久久久久久妇女 | 极品人妻videosss人妻| 黄色日韩在线| 成人日韩在线电影| 岛国视频免费在线观看| 亚洲成人自拍一区| 日韩高清在线一区二区| 日韩欧美视频| 国产99久久精品一区二区 夜夜躁日日躁| 国产成人精品白浆久久69| 久久人人97超碰com| 国产精品视频一二三四区| 精品久久99| 国产亚洲视频在线观看| 人妻 日韩精品 中文字幕| 懂色av中文一区二区三区| 熟女熟妇伦久久影院毛片一区二区| 日韩欧美精品电影| 亚洲另类欧美自拍| 国产精品自拍99| 国产一区二区三区四区五区美女 | 91香蕉一区二区三区在线观看| 日韩有码一区二区三区| 欧美不卡三区| 91精品论坛| 亚洲美女久久久| 黄色在线观看国产| 久久这里只有精品首页| 国产超级av在线| 亚洲最好看的视频| 欧洲成人在线观看| 国产区视频在线播放| 色婷婷精品大在线视频| 3d动漫精品啪啪一区二区下载| 国产欧美另类| 久久综合九色综合久99| 大胆人体一区| 亚洲视频在线视频| 日韩xxx视频| 国产精品无码永久免费888| 婷婷视频在线播放| 欧美电影院免费观看| 精品国产一区二区在线| 中文字幕福利视频| 亚洲欧洲国产日韩| 制服丝袜中文字幕第一页 | 污视频在线免费观看一区二区三区 | 亚洲欧美综合v| 久久一区二区三区视频| 91在线视频播放| 免费看国产曰批40分钟| 欧美在线关看| 国产精品美女呻吟| 男人天堂久久久| 91麻豆精品国产91久久久久| 国产老头老太做爰视频| 国产综合色在线| 一区二区三区四区免费观看| 国产区一区二| 久久露脸国产精品| 青青色在线视频| 欧洲色大大久久| 亚洲视频重口味| 久久99最新地址| 成人免费播放器| 香蕉久久夜色精品国产使用方法| 国产91免费观看| 国产美女性感在线观看懂色av| 日韩一区二区视频| 国产一级久久久| 久久久噜噜噜久久人人看| 日本999视频| 国产精品97| 美脚丝袜一区二区三区在线观看| 写真福利精品福利在线观看| 中文字幕欧美日韩在线| 国产精品一级视频| 欧美性猛交xxxx乱大交3| 免费一级特黄3大片视频| 激情综合网av| 免费看又黄又无码的网站| 亚州综合一区| ts人妖另类在线| 欧美aa在线观看| 丝袜情趣国产精品| 亚洲精品97久久中文字幕| 性感美女极品91精品| 天天色天天综合| 不卡在线观看av| 九一精品在线观看| 亚洲网址在线| 欧美亚洲视频一区| 欧美日韩导航| 国产.欧美.日韩| 日本亚洲欧洲色| 色www永久免费视频首页在线| 亚洲精品ady| 91激情在线观看| 精品日韩视频在线观看| 欧美成人精品一区二区免费看片 | 91精品国产高清91久久久久久| 国产一区二区三区成人欧美日韩在线观看| 亚洲欧洲精品一区| 丝袜美腿综合| 国产精品大全| 国产精品美女久久久久| 国产成人精品999| 国产乱码在线| 色天天综合狠狠色| 日本人妖在线| 精品国产乱码久久久久久免费| 一区二区三区在线观看av| 污片在线观看一区二区 | 亚洲一区二区在线免费观看视频 | 亚洲a视频在线| 欧美日韩专区在线| 91精品国产高潮对白| 亚洲综合色噜噜狠狠| 中文字幕精品亚洲| 国产亚洲一区二区三区四区| 性高潮免费视频| 国产sm精品调教视频网站| 特黄视频免费观看| 日韩精品乱码免费| www.四虎成人| 久久久夜夜夜| 116极品美女午夜一级| 亚洲天堂偷拍| av在线免费观看国产| 国产精品jizz在线观看美国| 在线观看污视频| 99久久亚洲精品蜜臀| 亚洲免费视频一区| 亚洲午夜精品一区二区国产| 亚洲人成网站在线观看播放| 久久综合色占| 激情久久av| 女优一区二区三区| 欧美一级二级三级| 久久91精品| 欧美日韩在线观看一区| 欧美精品momsxxx| 欧美高清性xxxxhdvideosex| 老汉色老汉首页av亚洲| 欧美日韩综合精品| 亚洲亚洲免费| 欧美成熟毛茸茸复古| 丝袜久久网站| 亚洲图片都市激情| 久久久久国产精品| 中文字幕乱码免费| 66国产精品| 天天夜碰日日摸日日澡性色av| 雨宫琴音一区二区在线| 黄网站欧美内射| 三级一区在线视频先锋| 91制片厂毛片| 精品一区二区三区在线观看国产| 狠狠干狠狠操视频| 北条麻妃一区二区三区| 加勒比精品视频| 国产欧美精品一区aⅴ影院| 日韩欧美黄色网址| 亚洲中国最大av网站| 国产乱码久久久久久| 粉嫩老牛aⅴ一区二区三区| 天堂网av手机版| 欧美日韩一二三区| 性一交一乱一伧老太| 亚洲精品美女在线观看| 9191在线| 欧美激情一级精品国产| 黄色软件视频在线观看| 国产成人亚洲精品| www.久久东京| 欧美日韩成人一区二区三区| 日韩毛片视频| 黄色免费高清视频| 亚洲欧美日韩专区| 成 人 黄 色 小说网站 s色| 韩国一区二区视频| 成人片黄网站色大片免费毛片| 国产精品网站在线观看| 久草视频在线免费看| 欧美性20hd另类| 国产女18毛片多18精品| 亚洲经典中文字幕| 一级毛片视频在线| 欧美黑人性视频| 日韩免费大片| 国产一区二区在线网站 | 中文字幕中文字幕在线中一区高清| 欧美黄色一级视频| 国产精品第12页| 处破女av一区二区| 欧美 日韩 国产 一区二区三区| 精品国产电影一区| 99产精品成人啪免费网站| 亚洲深夜福利在线| 黄色污污视频在线观看| 国产精品久久一区主播| 国产精品x8x8一区二区| 四虎永久免费网站| 日本欧美一区二区三区| 奇米777第四色| 一区二区三区小说| 亚洲影视一区二区| 日韩精品在线观| 久草中文在线观看| 国产伦精品免费视频| 日韩在线麻豆| 亚洲欧洲在线免费| 国产精品不卡av| 欧美日韩aaaaaa| 高清一区二区三区四区| 欧美精品中文字幕一区| 99热播精品免费| 欧美日韩电影一区二区三区| 国产一区二区精品| 亚洲午夜久久久久久久久| 亚洲人成伊人成综合网小说| 中文字幕一区二区人妻| 亚洲美女激情视频| 桃色av一区二区| 国产精品欧美久久| 亚洲免费黄色| 久久久无码人妻精品无码| 成人欧美一区二区三区视频网页| 91影院在线播放| 中文字幕av日韩| 日韩色淫视频| 亚洲国产午夜伦理片大全在线观看网站 | 国产艳俗歌舞表演hd| 一区二区欧美在线观看| 亚洲伦理在线观看| 精品少妇v888av| 日韩免费一级| 亚洲理论电影在线观看| 粉嫩一区二区三区性色av| 久久久全国免费视频| 日本韩国欧美在线| 最新97超碰在线| 成人av在线天堂| 91麻豆精品国产91久久久平台| 国产精品igao| 欧美激情一区二区三区四区| 亚洲精品一区二区二区| 亚洲免费小视频| 亚洲电影观看| 日韩av高清在线播放| 日本aⅴ免费视频一区二区三区 | 午夜精品久久久久久久第一页按摩| 久久激情视频免费观看| 久久视频社区| 亚洲 高清 成人 动漫| 91丨porny丨在线| 免费黄色片视频| 欧美成人性色生活仑片| 第一区第二区在线| 97国产精东麻豆人妻电影| 日本一区二区三级电影在线观看| 中文永久免费观看| 久久精品小视频| 久久超级碰碰| 黄色高清无遮挡| ...中文天堂在线一区| 少妇精品视频一区二区| 欧美最顶级丰满的aⅴ艳星| 青草国产精品| 四虎永久免费观看| 色www精品视频在线观看| 日本在线观看视频| 久久久影院一区二区三区| 日韩精品亚洲专区| 一级片一级片一级片| 日韩精品在线视频| 免费视频成人| 国产a级黄色大片| 国产肉丝袜一区二区| 国产美女自慰在线观看| 日韩av男人的天堂| 欧美aⅴ99久久黑人专区|