精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

模型壓縮95%,MIT韓松等人提出新型Lite Transformer

新聞 人工智能
Transformer 的高性能依賴于極高的算力,這讓移動端 NLP 嚴重受限。在不久之前的 ICLR 2020 論文中,MIT 與上海交大的研究人員提出了一種高效的移動端 NLP 架構 Lite Transformer,向在邊緣設備上部署移動級 NLP 應用邁進了一大步。

 Transformer 的高性能依賴于極高的算力,這讓移動端 NLP 嚴重受限。在不久之前的 ICLR 2020 論文中,MIT 與上海交大的研究人員提出了一種高效的移動端 NLP 架構 Lite Transformer,向在邊緣設備上部署移動級 NLP 應用邁進了一大步。

雖然推出還不到 3 年,Transformer 已成為自然語言處理(NLP)領域里不可或缺的一環。然而這樣流行的算法卻需要極高的算力才能實現足夠的性能,這對于受到算力和電池嚴格限制的移動端來說有些力不從心。

在 MIT 最近的研究《Lite Transformer with Long-Short Range Attention》中,MIT 與上海交大的研究人員提出了一種高效的移動端 NLP 架構 Lite Transformer,向在邊緣設備上部署移動級 NLP 應用邁進了一大步。該論文已被人工智能頂會 ICLR 2020 收錄。

該研究是由 MIT 電氣工程和計算機科學系助理教授韓松領導的。韓松的研究廣泛涉足深度學習和計算機體系結構,他提出的 Deep Compression 模型壓縮技術曾獲得 ICLR2016 最佳論文,論文 ESE 稀疏神經網絡推理引擎 2017 年曾獲得芯片領域頂級會議——FPGA 最佳論文獎,引領了世界深度學習加速研究,對業界影響深遠。

模型壓縮95%,MIT韓松等人提出新型Lite Transformer

論文地址:
https://arxiv.org/abs/2004.11886v1

GitHub 地址:
https://github.com/mit-han-lab/lite-transformer

Transformer 在自然語言處理任務(如機器翻譯、問答)中應用廣泛,但它需要大量計算去實現高性能,而這不適合受限于硬件資源和電池嚴格限制的移動應用。

這項研究提出了一種高效的移動端 NLP 架構——Lite Transformer,它有助于在邊緣設備上部署移動 NLP 應用。其核心是長短距離注意力(Long-Short Range Attention,LSRA),其中一組注意力頭(通過卷積)負責局部上下文建模,而另一組則(依靠注意力)執行長距離關系建模

這樣的專門化配置使得模型在三個語言任務上都比原版 transformer 有所提升,這三個任務分別是機器翻譯、文本摘要和語言建模。

在資源有限的情況下(500M/100M MACs),Lite Transformer 在 WMT’14 英法數據集上的 BLEU 值比分別比 transformer 高 1.2/1.7。Lite Transformer 比 transformer base 模型的計算量減少了 60%,而 BLEU 分數卻只降低了 0.3。結合剪枝和量化技術,研究者進一步將 Lite Transformer 模型的大小壓縮到原來的 5%。

對于語言建模任務,在大約 500M MACs 上,Lite Transformer 比 transformer 的困惑度低 1.8。

模型壓縮95%,MIT韓松等人提出新型Lite Transformer

值得注意的是,對于移動 NLP 設置,Lite Transformer 的 BLEU 值比基于 AutoML 的 Evolved Transformer 高 0.5,而且它不需要使用成本高昂的架構搜索。

從 Lite Transformer 與 Evolved Transformer、原版 transformer 的比較結果中可以看出,Lite Transformer 的性能更佳,搜索成本相比 Evolved Transformer 大大減少。

模型壓縮95%,MIT韓松等人提出新型Lite Transformer

那么,Lite Transformer 為何能夠實現高性能和低成本呢?接下來我們來了解其核心思想。

長短距離注意力(LSRA)

NLP 領域的研究人員試圖理解被注意力捕捉到的上下文。Kovaleva 等人 (2019) 和 Clark 等人 (2020) 對 BERT 不同層的注意力權重進行了可視化。

如下圖 3b 所示,權重 w 表示源句單詞與目標句單詞之間的關系(自注意力也是如此)。隨著權重 w_ij 的增加(顏色加深),源句中的第 i 個詞更加注意目標句中的第 j 個詞。注意力圖通常有很強的模式化特征:稀疏和對角線。它們代表了一些特定單詞之間的關系:稀疏表示長距離信息間的關系,對角線表示近距離信息間的關系。研究者將前者稱為「全局」關系,將后者稱為「局部」關系。

模型壓縮95%,MIT韓松等人提出新型Lite Transformer

圖 3:Lite Transformer 架構 (a) 和注意力權重的可視化。傳統的注意力 (b) 過于強調局部關系建模(參見對角線結構)。該研究使用卷積層專門處理局部特征提取工作,以高效建模局部信息,從而使注意力分支可以專門進行全局特征提取 (c)。

在翻譯任務中,注意力模塊必須捕獲全局和局部上下文,這需要很大的容量。與專門化的設計相比,這并非最佳選擇。以硬件設計為例,CPU 等通用硬件的效率比 FPGA 等專用硬件低。研究者認為應該分別捕捉全局和局部上下文。模型容量較大時,可以容忍冗余,甚至可以提供更好的性能。但是在移動應用上,由于計算和功率的限制,模型應該更加高效。因此,更需要專門化的上下文捕獲。

為了解決該問題,該研究提出一個更專門化的架構,即長短距離注意力(LSRA),而不是使用處理 “一般” 信息的模塊。該架構分別捕獲局部和全局上下文。

如圖 3a 所示,LSRA 模塊遵循兩分支設計。左側注意力分支負責捕獲全局上下文,右側卷積分支則建模局部上下文。研究者沒有將整個輸入饋送到兩個分支,而是將其沿通道維度分為兩部分,然后由后面的 FFN 層進行混合。這種做法將整體計算量減少了 50%。

左側分支是正常的注意力模塊(Vaswani et al. (2017)),不過通道維度減少了一半。至于處理局部關系的右分支,一個自然的想法是對序列應用卷積。使用滑動窗口,模塊可以輕松地覆蓋對角線組。為了進一步減少計算量,研究者將普通卷積替換為輕量級的版本,該版本由線性層和深度卷積組成。通過這種方式,研究者將注意力模塊和卷積模塊并排放置,引導它們對句子進行全局和局部的不同角度處理,從而使架構從這種專門化設置中受益,并實現更高的效率。

實驗設置

數據集和評估

研究者在機器翻譯、文本摘要和語言建模三個任務上進行了實驗和評估。

具體而言,機器翻譯任務使用了三個基準數據集:IWSLT’14 德語 - 英語 (De-En)、WMT 英語 - 德語 (En-De)、WMT 英語 - 法語(En-Fr)。

文本摘要任務使用的是 CNN-DailyMail 數據集。

語言建模任務則在 WIKITEXT-103 數據集上進行。

架構

模型架構是基于序列到序列學習的編碼器 - 解碼器。在機器翻譯任務中,針對 WMT 數據集,基線模型基于 Vaswani 等人提出的模型。對于 IWSLT 數據集,基線模型遵循 Wu 等人的設置。對于文本摘要任務,研究者采用了與 WMT 相同的模型。至于語言建模任務,模型與 Baevski & Auli (2019) 一致,但模型尺寸較小。

該研究提出的架構首先將 transformer base 模型中的 bottleneck 拉平,然后用 LSRA 替換自注意力。更具體地說,是使用兩個專門的模塊,一個注意力分支和一個卷積分支。

實驗結果

機器翻譯

表 1 展示了 Lite Transformer 在 IWSLT’14 De-En 數據集上的定量結果,并與 transformer 基線方法和 LightConv 做了對比。在大約 100M Mult-Adds 時,Lite Transformer 模型的 BLEU 值比 transformer 高出 1.6。

模型壓縮95%,MIT韓松等人提出新型Lite Transformer

表 1:IWSLT’14 De-En 上的結果。

表 2 中的定量結果表明,在 100M Mult-Adds 設置下,Lite Transformer 在 WMT En-De 數據集和 WMT En-Fr 數據集上的 BLEU 值分別比 Transformer 高出 1.2 和 1.7,在 300M Mult-Adds 設置下,也有 0.5 和 1.5 分的提升。

模型壓縮95%,MIT韓松等人提出新型Lite Transformer

表 2:在 WMT’14 En-De 和 WMT’14 En-Fr 上的結果。

研究者還提供了模型在 WMT En-Fr 上的權衡曲線,如圖 4a 所示,Lite Transformer 一直優于原版 transformer。

模型壓縮95%,MIT韓松等人提出新型Lite Transformer

圖 4:在 WMT En-Fr 數據集上的機器翻譯權衡曲線,以及在 WIKITEXT-103 數據集上的語言建模權衡曲線。兩個曲線都說明了在移動設置下,Lite Transformer 比 transformer 性能更佳(藍色區域)。

與自動化設計模型的對比

與基于 AutoML 的 Evolved Transformer(ET)相比,Lite Transformer 在移動設置中也有明顯的改進。此外,在 100M 和 300M 的 Mult-Adds 下,Lite Transformer 的 BLEU 值分別比 ET 高 0.5 和 0.2,詳見表 3。

模型壓縮95%,MIT韓松等人提出新型Lite Transformer

表 3:不同 NMT 模型的性能和訓練成本。

文本摘要

模型壓縮95%,MIT韓松等人提出新型Lite Transformer

表 4:在 CNN-DailyMail 數據集上的文本摘要結果。

模型壓縮95%,MIT韓松等人提出新型Lite Transformer

表 5:在 WIKITEXT-103 數據集上的語言建模結果。

責任編輯:張燕妮 來源: 機器之心Pro
相關推薦

2020-03-23 15:10:49

人工智能機器學習技術

2025-01-26 13:20:49

谷歌AI模型Titans

2021-12-01 10:05:12

模型人工智能計算

2025-07-10 08:40:59

2023-04-03 14:27:58

框架數據

2025-05-23 10:04:25

2017-08-07 11:09:19

機器學習用戶推薦轉化率

2022-01-05 10:42:12

AI 數據人工智能

2024-11-26 13:30:00

2021-03-16 14:35:16

架構AI技術

2022-07-17 13:07:26

模型開源

2024-10-08 13:38:56

2019-10-12 11:10:32

AI 數據人工智能

2025-10-30 16:27:13

蘋果AI模型

2023-04-28 15:53:55

框架模型

2021-09-10 16:24:00

框架AI開發

2024-12-06 18:48:39

2024-11-01 16:46:48

2015-01-14 10:33:20

瞻博網絡

2009-03-26 18:46:20

戴爾Nehalem服務器
點贊
收藏

51CTO技術棧公眾號

日韩人体视频| 另类专区亚洲| 99久久久国产精品免费蜜臀| 欧洲亚洲免费在线| 日本一道本视频| 成人在线视频国产| 午夜精品久久久久久久| 五码日韩精品一区二区三区视频| 国产又粗又猛又黄| 亚洲毛片视频| 日韩在线观看精品| 亚洲天堂资源在线| 伦一区二区三区中文字幕v亚洲| 夜夜操天天操亚洲| 免费99视频| www.久久精品.com| 日本不卡不码高清免费观看| 欧美日韩电影在线观看| 国产黄色大片免费看| 高清日韩中文字幕| 88在线观看91蜜桃国自产| 国产黄视频在线| www在线观看播放免费视频日本| 91网上在线视频| 国产福利久久精品| 国产又粗又长视频| 首页国产欧美久久| 91精品国产91久久久| 欧美日韩在线国产| 欧美a级片视频| 国产亚洲欧美日韩精品| 久久性爱视频网站| 欧美a在线观看| 欧美日韩精品一区视频| 国产精品动漫网站| yellow在线观看网址| 亚洲精品欧美综合四区| 一区二区精品视频| 最新97超碰在线| 久久精品一区四区| 美乳视频一区二区| 韩国中文字幕hd久久精品| 国产在线国偷精品产拍免费yy| 国产精品国产亚洲伊人久久| 国产免费av一区| 亚洲深夜福利| 668精品在线视频| www成人在线| 亚洲人人精品| 97免费在线视频| 日韩精品――中文字幕| 伊人久久大香线蕉av超碰演员| 欧美日本在线视频中文字字幕| 性色av无码久久一区二区三区| 日韩欧美国产精品综合嫩v| 在线观看日韩www视频免费| 国产jk精品白丝av在线观看| 精品久久久中文字幕| 亚洲精品二三区| 特大黑人巨人吊xxxx| 亚洲成人一品| 亚洲丝袜av一区| 国产精品天天干| 久久精品国产99久久| 久久久国产精品x99av| 久久久久久视频| 欧美精品一卡| 97在线视频一区| 免费看一级视频| 日韩成人精品在线观看| 国产一区二区香蕉| 精品国产999久久久免费| 成人丝袜高跟foot| 欧美久久久久久久| 日本精品一区二区三区在线播放| 日韩美女视频一区| 久久亚洲国产成人精品无码区| free性护士videos欧美| 欧美日韩视频在线| 精品日韩久久久| 激情不卡一区二区三区视频在线| 欧美刺激午夜性久久久久久久| 中文字幕在线播放视频| 欧美禁忌电影| 久久亚洲春色中文字幕| 日本五十熟hd丰满| 日韩av二区在线播放| 成人激情在线播放| 在线观看xxx| 中文字幕一区二区三区不卡 | 丁香六月色婷婷| 久久综合99re88久久爱| 亚洲最大免费| 日韩大片免费观看| 欧美日韩美女一区二区| 香蕉视频免费网站| blacked蜜桃精品一区| 欧美大片在线看| 精品一区二区无码| 国产99久久久国产精品免费看| 久久久久久久久久久一区| 日本中文字幕电影在线免费观看 | 成人一级生活片| 久久久一本精品| 欧美va亚洲va国产综合| 日韩免费成人av| 亚洲精品字幕| 亚洲精品免费在线视频| 黄色片在线免费看| 亚洲一卡二卡三卡四卡无卡久久 | 国产奶水涨喷在线播放| 美日韩一区二区| 久久国产精品一区二区三区| 黄色在线免费| 91成人免费电影| 国产极品一区二区| 欧美 日韩 国产一区二区在线视频| 欧美一级黄色网| 亚洲第一页视频| 国产精品国产精品国产专区不片| 国产综合av在线| 哺乳一区二区三区中文视频| 日韩有码在线播放| 波多野结衣午夜| 99久久精品国产一区二区三区| 91精品国产吴梦梦| 亚瑟国产精品| 中文字幕在线观看亚洲| 无码人妻黑人中文字幕| 99热在这里有精品免费| 黄色激情在线视频| 精品视频一区二区三区| 日韩视频在线免费观看| 最近中文字幕在线观看| 亚洲国产精品av| 日韩免费高清在线| 奇米亚洲欧美| 国产精品成久久久久三级| 日本免费不卡| 懂色av中文一区二区三区天美| 日本人妻一区二区三区| 欧美一区91| 亚洲a中文字幕| 欧美午夜电影一区二区三区| 欧美三级一区二区| 亚洲一级片在线播放| 日韩和欧美一区二区三区| 欧洲精品码一区二区三区免费看| 欧美男人天堂| 亚洲精品视频播放| 99精品人妻国产毛片| 久久久亚洲午夜电影| 欧美成人精品欧美一级乱| 欧美日韩xxxx| 国产欧美在线播放| 国产盗摄在线观看| 欧美大片拔萝卜| 国产无套内射又大又猛又粗又爽| 国产成人精品免费| 91黄色在线看| 偷拍亚洲精品| 国产精品视频99| 毛片在线播放a| 日韩免费视频一区二区| 国产午夜小视频| 2023国产精品视频| 我看黄色一级片| 在线国产一区二区| 国产一区二区在线观看免费播放| 免费看av不卡| 日韩中文娱乐网| 午夜精品久久久久久久99| 亚洲成人资源在线| 四虎影成人精品a片| 久久99久久99| 人妻少妇精品久久| av一区二区高清| 91|九色|视频| gay欧美网站| 精品激情国产视频| 日本xxxxxwwwww| 欧美色视频一区| 久草免费在线观看视频| 久久久综合激的五月天| 欧美日韩中文不卡| 激情婷婷久久| 亚洲国产欧洲综合997久久| 午夜久久av| 国产成人精品视频| 四虎影视成人| 国产亚洲欧洲高清| 精品人妻一区二区三区蜜桃| 日韩欧美精品中文字幕| 中文字幕电影av| 国产亚洲短视频| 性生交大片免费看l| 日韩综合小视频| 日韩精品免费一区| 国产精品一在线观看| 波多野结衣成人在线| 视频二区不卡| 久久久久久这里只有精品| 成人jjav| 亚洲黄色有码视频| 99久久亚洲精品日本无码| 日韩欧美在线视频| 久久网中文字幕| 国产精品美女一区二区在线观看| 国产草草浮力影院| 国产精品亚洲成人| 色播五月激情五月| 六月丁香综合| www插插插无码视频网站| 91九色精品国产一区二区| 欧美精品中文字幕一区二区| 超碰在线一区| 99re在线视频上| 97久久精品一区二区三区的观看方式| 欧美与黑人午夜性猛交久久久| av网址在线播放| 最近2019中文字幕第三页视频 | 99国产一区二区三精品乱码| www.久久久久久久久久久| 老牛影视一区二区三区| 欧美深夜福利视频| 今天的高清视频免费播放成人| 一区二区三区av| 大片网站久久| 亚洲a∨一区二区三区| 免费不卡中文字幕在线| 精品国产_亚洲人成在线| 最新国产一区二区| 亚洲综合国产精品| 999久久久国产999久久久| 国产精品久久久久久久午夜| 激情开心成人网| 国产精品99久久久久久人 | 欧美性猛交xxxx黑人| 国产精品23p| 亚洲综合男人的天堂| 九九视频在线免费观看| 亚洲精品视频观看| 久久久久无码国产精品不卡| 最新久久zyz资源站| 国产suv精品一区二区68| 亚洲色图制服诱惑| 在线看的片片片免费| 伊人一区二区三区| 国产一级一级片| 亚洲va天堂va国产va久| 日产欧产va高清| 欧美日韩亚洲一区二区| 久久久久久少妇| 色爱区综合激月婷婷| 真实的国产乱xxxx在线91| 欧美日韩一区二区三区在线看 | 亚洲国产精品视频在线观看 | 99久久777色| 野外性满足hd| 国产欧美综合在线| 女人裸体性做爰全过| 亚洲欧美影音先锋| 久久精品性爱视频| 欧美日韩一区二区在线播放| 午夜精品久久久久久久蜜桃| 欧美日韩一区二区三区不卡| 国产免费黄色录像| 亚洲精品一区二区三区福利| 日韩三级电影网| 中文字幕av一区二区三区谷原希美| 亚洲1卡2卡3卡4卡乱码精品| 欧美精品在线播放| 中文字幕人成乱码在线观看 | 欧美大片在线播放| 日韩精品一级中文字幕精品视频免费观看 | 国产免费拔擦拔擦8x在线播放 | 视频精品一区二区三区| 韩国成人动漫在线观看| 欧美丝袜激情| 欧美黄色免费网址| 亚洲欧美日韩专区| 亚洲图色中文字幕| av成人老司机| 大吊一区二区三区| 亚洲午夜视频在线观看| 黄色av一级片| 欧美一区二区三区系列电影| 亚洲日本在线播放| 久久九九免费视频| 乡村艳史在线观看| 91九色国产社区在线观看| 久久电影在线| 在线观看日韩羞羞视频| 99在线|亚洲一区二区| 午夜精品免费看| 94色蜜桃网一区二区三区| 小泽玛利亚一区| 欧美视频在线观看 亚洲欧| 国产精品无码久久久久成人app| 亚洲国产第一页| 国精产品一区| 国产精品爱啪在线线免费观看| 亚洲一级大片| 色综合视频二区偷拍在线| 亚洲三级电影在线观看| 在线a免费观看| 国产区在线观看成人精品 | av毛片在线免费| 国产精品高潮视频| 亚洲欧洲av| 大陆av在线播放| 国产酒店精品激情| 天天干天天舔天天操| 欧美日韩在线第一页| 秋霞网一区二区| 久久91亚洲精品中文字幕| 日韩护士脚交太爽了| 日韩黄色影视| 噜噜噜在线观看免费视频日韩 | 国产精品亚洲二区在线观看| 懂色av噜噜一区二区三区av| 伊人久久久久久久久久久久久久| 日韩欧美在线一区| 手机看片1024国产| 欧美精品精品精品精品免费| 国产精品视频一区二区三区综合| 神马一区二区影院| 久久欧美肥婆一二区| 强迫凌虐淫辱の牝奴在线观看| 一区二区三区日韩在线观看| 91精品人妻一区二区三区果冻| 一区二区三区久久精品| 国产欧美一区二区三区精品酒店| 国产一区自拍视频| 亚洲欧洲日本mm| 日韩无码精品一区二区| 亚洲午夜久久久久| 人妻精品一区二区三区| 性色av一区二区三区| 国产精品中文字幕制服诱惑| 国产freexxxx性播放麻豆 | 国内精品久久久久久久果冻传媒| 欧美精品麻豆| 白嫩情侣偷拍呻吟刺激| 精品久久久久久久久久久久| 天堂网av2014| 欧美中文字幕在线播放| 日韩理论电影中文字幕| 国产精品宾馆在线精品酒店| 91蝌蚪国产九色| www.五月婷婷.com| 日韩一区二区三区xxxx| 麻豆国产精品| 国产曰肥老太婆无遮挡| 97精品久久久久中文字幕| 在线观看国产亚洲| 永久免费毛片在线播放不卡 | 国产精品美女久久久久av福利| 亚洲一级网站| 97香蕉碰碰人妻国产欧美| 色综合久久中文字幕| 黄色片免费在线| 国产日韩精品在线| 黄色成人在线网站| 人妻熟女aⅴ一区二区三区汇编| 日本久久电影网| 精品自拍一区| 国产一区国产精品| 全国精品久久少妇| 国内偷拍精品视频| 日韩国产精品视频| 97人人做人人爽香蕉精品| 福利在线小视频| 26uuu亚洲综合色| 中文字幕在线观看精品| 九九精品视频在线| 国产精品免费大片| 久久久久无码精品| 欧美性色xo影院| 黄色网址在线免费| 精品久久久久久一区二区里番| 日本中文字幕一区| 久久午夜无码鲁丝片午夜精品| 亚洲九九九在线观看| 成人在线日韩| 成人小视频在线看| 亚洲女同女同女同女同女同69| 亚洲人妻一区二区三区| 91久久久久久| 另类av一区二区| 激情四射综合网| 伊人男人综合视频网| 成人高潮视频| 91女神在线观看| 精品成人国产在线观看男人呻吟| 欧美午夜电影一区二区三区| 精品产品国产在线不卡| 国产麻豆一精品一av一免费| 国产乱码77777777| 91国产视频在线播放|