精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍

發布于 2024-4-3 12:26
瀏覽
0收藏

基于 Transformer 架構的大語言模型在 NLP 領域取得了令人驚艷的效果,然而,Transformer 中自注意力帶來的二次復雜度使得大模型的推理成本和內存占用十分巨大,特別是在長序列的場景中。


此前,研究者們提出了線性 Transformer、Mamba、RetNet 等。這些方案可以大幅降低 Transformer 計算成本,并且取得媲美原有模型的精度,但是由于架構更換,模型重訓練帶來的巨大成本令人望而卻步。


為了解決這一問題,最近的一篇論文提出了一種基于頻域的大語言模型架構 — 帝江(源于山海經的一種神話生物,以跑得快而聞名),同時解決了現有大模型的兩大痛點:推理成本和訓練成本。


華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區


  • 論文地址:https://arxiv.org/abs/2403.19928
  • 開源鏈接:https://github.com/YuchuanTian/DiJiang


該論文基于頻域自注意力變換核,尋找到一種原始自注意力的線性逼近,使得原有的 Transformer 模型可以經過少量數據(1/10-1/50)的微調,可以近乎無損地變形為論文提出的帝江模型。具體來說,在 LLaMA2-7B 上僅僅需要使用 40B 左右的訓練數據,就可以取得最多 5 倍的推理加速,且在各個評測集上取得相當的精度。


華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區

DiJIang-7B 模型和 LLaMA-7B 的精度對比


華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區

DiJIang-7B 模型和 LLaMA-7B 的速度對比

研究背景

Transformer 架構自從推出以來,徹底革新了自然語言處理(NLP)領域,并在多種任務中取得了杰出成果。這一成功導致了大型語言模型(LLMs)主導的時代的到來,在這個時代中,Transformer 結構被放大以處理越來越復雜的任務。然而,這種規模的擴大也帶來了巨大的計算需求,特別是由于需要每個 token 之間的計算的自注意力機制。


面對更高效 Transformer 模型的迫切需求,研究者們提出了線性 Transformer、Mamba、RetNet 等方案,雖然這些方案可以大幅降低 Transformer 計算成本,并且取得媲美原有模型的精度,但是由于架構更換,模型重訓練帶來的巨大成本令人望而卻步。


然而,大多數現有的優化 Transformers 方法,特別是與優化注意力機制有關的,需要對模型從頭重新訓練。這一重新訓練過程是一個巨大的挑戰,特別是對于參數龐大的模型,需要大量的計算資源和時間投入。例如,像 LLaMA-7B 這樣的大型模型的訓練需要大約 8 萬多 GPU hours。盡管有部分研究如 Performer 努力尋找注意力機制的快速近似方法,但這些方法在大型語言模型中還沒有得到徹底的驗證。


為了解決大型語言模型中快速注意力近似的問題,論文對現有的線性注意力方案和自注意力近似方案進行了徹底的分析。論文發現,這些方法中近似誤差的主要來源是基于蒙特卡洛方法的采樣。因此,論文提出采用加權擬蒙特卡洛采樣來代替蒙特卡洛采樣進行映射,論文進一步引入頻域離散余弦變換(DCT)來作為擬蒙特卡洛采樣的值,從而高效且準確地將 Transformer 的 query 和 key 映射到頻域。使得注意力機制中的 softmax 操作可以被去除,達到線性的計算復雜度。論文還從理論上證明了,這種頻域映射是與原始注意力機制的一個近似等效,從而使得帝江模型可以不需要從頭開始訓練,只需要少量數據就可以從 Transformer 的參數中進行微調繼承。論文的實驗表明,論文的方法達到了與原始 Transformer 相當的性能,但訓練成本大大減少(<1/10),同時也受益于更快的推理速度(在不同模型上最高約 10 倍)。

方法介紹

論文首先回顧了 Attention 的計算方式:


華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區


其中是一句話中 token 的數目,d 是隱藏層的維度,傳統的 Attention 計算復雜度是

華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區。

為了減少 Attention 的計算復雜度,線性 Attention 方案希望將 softmax 函數去掉,這樣 K 和 V 的計算可以提前進行,從而使得計算復雜度變為華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區

,由于 n 通常要遠大于 d,因此在變化后計算復雜度可以被大幅減小。例如,Performer 采用了 PRF 核來逼近原始 Attention 的計算,具體為:

華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區


然而,由于蒙特卡洛方案存在的近似誤差,Performer 等方案常常要將隱藏層從維度映射為更大的維度,這導致了線性注意力帶來的計算復雜度變為,使得計算加速的收益減少。


為了解決這個問題,論文首先提出一種基于加權擬蒙特卡洛的方案,具體的,論文提出了一種新的 WPFF 核映射:


和 PRF 映射不同,WPFF 核映射在兩點上進行了改進:1. 將原有的隨機映射 w 變為給定的均勻正交變換 v 和其模長部分 t ,即使用擬蒙特卡洛變換來代替蒙特卡洛變換,減少逼近誤差從華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區。2. 使用加權矩陣 D 來對映射進行加權求和,減少蒙特卡洛映射的誤差。


論文提供了理論證明,來表明提出的 WPFF 映射核是一種更優的映射方式,具體的證明內容詳見論文附錄:


華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區


基于 WPFF 核,論文又進一步對其進行改進,由于給定的均勻正交變換 v 可以使用任意的均勻正交變換,論文提出使用頻域 DCT 變換來進行計算,由于 DCT 變換具有特殊的形式,其計算復雜度僅為

華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區,相比其他的正交變換華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區要來的更低,最終,論文使用的 WDCF 映射為:


華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區


最終,帝江模型的自注意力計算被代替為:


華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區


華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區

帝江模型和傳統自注意力計算的區別


上圖展示了帝江模型和傳統自注意力計算的區別,在 Transformer 的注意力機制中,key 和 value 的計算通過快速離散余弦變換(DCT)高效地映射到頻域。這種映射有效地消除了 softmax 操作,從而顯著降低了 Transformer 的計算復雜度。

實驗結果

華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區

不同模型大小的對比


上表展示了提出的帝江模型在不同大小的 scale 上的結果,可以看到,提出的帝江模型可以取得和原始模型基本相同的精度,并且擁有更快的推理速度和更低的訓練成本,顯著解決了現有 LLM 遇到的訓推成本過大的問題。此外,模型在 1B 的模型量級上超越了 1.3B 大小的 Mamba 模型。需要注意的是,盡管傳統 Transformer 可以通過 Flash Attention 的方式進行進一步加速,但由于針對帝江模型的加速框架尚未開發,為了公平對比模型本身的速度,推理速度的測試都是在模型都不使用加速框架的前提下進行的。


華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區

與不同 Transformer 改進方案精度對比


論文還展示了帝江和其他 Transformer 模型的改進方案進行了進一步的對比,可以發現,帝江模型具有比其他模型更好的效果,這得益于其通過更好的核映射近似了原始的 Transformer 模型計算。


華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區

華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區


論文還同時提供了帝江 - 7B 模型的續寫樣例展示,可以看到,帝江 - 7B 的續寫結果,和 LLaMA2-7B 相比毫不遜色,甚至條理性上要略勝一籌。

總結

論文提出了一種新的 LLM 架構:帝江,在 7B 以下的模型量級,所提出的模型可以大幅降低 LLM 所需的訓練和計算成本,為未來 LLM 的高效部署提出了一種新的思路。帝江架構是否會在更大的模型與多模態 VLM 等其他 Transformer 的應用領域中大放光彩,讓我們拭目以待。


本文轉自 機器之心 ,作者:機器之心


原文鏈接:??https://mp.weixin.qq.com/s/3zdfuhNr_HjvcJAy8REayA??

標簽
收藏
回復
舉報
回復
相關推薦
精品极品在线| 天堂免费在线视频| 91久久偷偷做嫩草影院电| 亚洲一级电影视频| 久久久久久a亚洲欧洲aⅴ| 婷婷激情五月综合| 久久久9色精品国产一区二区三区| 欧美一区二区在线视频| 欧美精品久久久久久久自慰| 伦理片一区二区三区| 精品一区二区三区蜜桃| 97久久精品视频| 成人一级片免费看| jizz18欧美18| 欧美无乱码久久久免费午夜一区| 四虎永久免费网站| 欧美偷拍视频| 国产精品一区二区久久不卡| 日本精品一区二区三区在线| 69xx绿帽三人行| 嫩草一区二区三区| 日韩欧美国产三级电影视频| 日本999视频| 91九色在线播放| |精品福利一区二区三区| 久久精品国产一区二区三区日韩| 国产精品久久久久久无人区| 久久黄色影院| 久久久爽爽爽美女图片| 东京热无码av男人的天堂| 久久久久观看| 欧美一区二区三区日韩| 激情五月亚洲色图| 亚洲国产欧美日本视频| 亚洲国产美国国产综合一区二区| 在线亚洲美日韩| 免费国产在线视频| 成人高清视频在线| 3d动漫啪啪精品一区二区免费| 亚洲自拍一区在线观看| 亚洲国产高清一区二区三区| 久久777国产线看观看精品| 9色porny自拍视频一区二区| 亚洲自拍小视频免费观看| 中文字幕久久久久| 视频一区视频二区中文| 日本精品久久电影| 日韩av免费网址| 国内精品福利| 欧美激情xxxx性bbbb| 亚洲天堂黄色片| 婷婷中文字幕一区| 日韩中文字幕免费| 黄色av片三级三级三级免费看| 国产a久久精品一区二区三区| 日韩精品免费在线视频观看| 88av在线播放| 久久大胆人体视频| 亚洲国产成人av在线| 91porn在线| 99久久婷婷国产综合精品青牛牛| 欧美一级欧美一级在线播放| 三级网站免费看| 精品视频国内| 欧美成人性战久久| 少妇搡bbbb搡bbb搡打电话| 亚洲精品在线播放| 欧美精品一区二区三| 无码国产精品一区二区免费式直播 | 不卡影院免费观看| 99视频日韩| 日韩一级片免费在线观看| 成人深夜在线观看| 精品人伦一区二区三区| 天堂资源中文在线| 久久精品视频一区二区| 亚洲mv在线看| mm1313亚洲国产精品美女| 亚洲影视资源网| 性欧美大战久久久久久久| 中文不卡1区2区3区| 欧美综合亚洲图片综合区| 在线观看国产一级片| 国产一区二区三区免费观看在线 | 久久久久久美女精品| 久久成人18免费网站| 国产一级一片免费播放放a| 99精品国产99久久久久久福利| 国产成人av在线播放| 一级黄色片在线看| 国产成人av电影在线播放| 久久婷婷国产综合尤物精品| yiren22亚洲综合伊人22| 最新高清无码专区| 无码中文字幕色专区| 欧美日韩女优| 日韩欧美三级在线| 蜜桃传媒一区二区亚洲| 一级欧洲+日本+国产 | 成人国产精选| 精品久久久久一区| 青娱乐国产视频| 欧美精品一卡| 国产激情久久久| 亚洲av少妇一区二区在线观看| 91蜜桃网址入口| 免费观看国产视频在线| 忘忧草在线日韩www影院| 欧美老年两性高潮| 黄色短视频在线观看| 91精品国产麻豆国产在线观看| 欧美性在线观看| 精品国产伦一区二区三区| 久久五月婷婷丁香社区| 中国一级大黄大黄大色毛片| 欧美大片免费观看网址| 精品国产123| 三级黄色片在线观看| 国产精品一卡| 91大片在线观看| 欧美jizz18hd性欧美| 欧美午夜电影在线| 成年人看片网站| 欧美电影免费| 国产精品久久久久秋霞鲁丝| 少妇人妻偷人精品一区二区| 亚洲欧美电影一区二区| 久久久国产欧美| 欧美高清视频看片在线观看| 色综合男人天堂| 国产模特av私拍大尺度| 国产欧美日韩另类一区| 1024av视频| 国产suv精品一区| 久久国产精品久久久久| 亚洲无码精品在线播放| 日本一区免费视频| 可以在线看的黄色网址| 亚欧洲精品视频在线观看| 欧美精品18videos性欧美| aaa级黄色片| 日韩毛片一二三区| 亚洲最大综合网| 欧美午夜精品一区二区三区电影| 欧美亚洲第一页| 日本韩国在线观看| 亚洲一区成人在线| 亚洲一区和二区| 国产精品99一区二区| 亚洲自拍偷拍福利| 亚洲男同gay网站| 日韩西西人体444www| 天堂网avav| 国产麻豆精品95视频| 熟妇熟女乱妇乱女网站| 色综合视频一区二区三区日韩| 色悠悠久久久久| 亚洲天堂网视频| 国产精品久久久久久久久晋中 | 日本一区二区三区久久| 国产欧美一区二区三区在线老狼| 北条麻妃av高潮尖叫在线观看| 极品美女一区二区三区| 国产精品青青在线观看爽香蕉| av在线电影观看| 欧美另类变人与禽xxxxx| www欧美com| 国产69精品久久久久毛片| 隔壁人妻偷人bd中字| 日韩电影不卡一区| 国产成人一区二区三区小说| 成人在线观看黄色| 制服丝袜亚洲色图| 国产在线拍揄自揄拍无码视频| 成人一区二区三区| 亚洲爆乳无码专区| 久久久久亚洲| 国产高清精品一区二区| 中国色在线日|韩| 日韩中文视频免费在线观看| 精品国产av 无码一区二区三区| 一二三四社区欧美黄| 中文成人无字幕乱码精品区| 日本视频中文字幕一区二区三区| 中文字幕一区二区三区有限公司| 97久久超碰| 国产成人涩涩涩视频在线观看| 免费av不卡| 亚洲福利精品在线| 国产无遮挡又黄又爽又色视频| 亚洲欧美怡红院| 国产精品成人99一区无码| 日日噜噜夜夜狠狠视频欧美人| 黄瓜视频免费观看在线观看www| 成人福利一区| 国产精品久久久久久av| 男女视频在线| 中文一区二区视频| 亚洲AV午夜精品| 欧美性大战xxxxx久久久| www青青草原| 欧美国产精品一区二区| 韩国三级在线看| 日本va欧美va精品| 丁香花在线影院观看在线播放| 精品一区二区三区的国产在线观看| 97超碰人人看人人| 欧美最新精品| 国内偷自视频区视频综合| 成年人视频网站在线| 精品日韩在线一区| 国产精品久久久久久69| 欧美日韩中国免费专区在线看| 免费黄色激情视频| 久久综合久久99| 一二三区视频在线观看| 麻豆精品在线看| 国产真实乱子伦| 黄色日韩精品| 成人毛片100部免费看| 欧美色就是色| 欧美三日本三级少妇三99| 综合成人在线| 亚洲自拍小视频免费观看| 国产综合色在线观看| 青青久久av北条麻妃黑人| 高清电影在线观看免费| 欧美成人免费在线观看| 在线看av的网址| 一本一道久久a久久精品逆3p| 无码国产精品一区二区色情男同| 日韩一区二区免费电影| 亚洲自拍偷拍另类| 色猫猫国产区一区二在线视频| 国产精品7777777| 亚洲综合丁香婷婷六月香| 成年人二级毛片| 国产精品久久久久久户外露出 | 一区二区三区加勒比av| 成人一级黄色大片| 国产精品护士白丝一区av| 日韩影视一区二区三区| 久久网站最新地址| 色欲av无码一区二区三区| 99久久精品免费看| 中文字幕在线永久| eeuss鲁片一区二区三区在线观看| 亚洲精品久久一区二区三区777| 国产美女视频一区| 国产999免费视频| 国产精品一区三区| 国产调教打屁股xxxx网站| 国产一区免费电影| 亚洲av毛片在线观看| 国产东北露脸精品视频| 国产精品无码自拍| aaa国产一区| 90岁老太婆乱淫| 欧美国产精品v| 永久免费看片视频教学| 亚洲欧美日韩国产综合| 欧美成人综合色| 亚洲一二三四久久| 91精品国产乱码久久久张津瑜| 精品久久久久久久中文字幕| 久久精品国产成人av| 色婷婷综合久久久久中文一区二区 | av在线网址观看| 久久久久久久一| 乱人伦视频在线| 国产精品高潮在线| 国产视频网站一区二区三区| 成人91免费视频| 香蕉一区二区| 正在播放精油久久| 黄色成人在线网址| 动漫av网站免费观看| 青青草精品视频| 伊人五月天婷婷| 99精品桃花视频在线观看| 久久久久无码精品国产sm果冻| 中文字幕制服丝袜一区二区三区| 欧美成人一二三区| 色偷偷成人一区二区三区91 | 精品视频一区二区在线观看| 欧美日韩一区二区在线| 中文字幕+乱码+中文乱码91| 91精品欧美福利在线观看| 日本激情一区二区三区| 一本色道久久88精品综合| av片在线观看永久免费| 91精品国产乱码久久久久久蜜臀 | 日韩深夜视频| 91精品国产自产在线| 精品亚洲自拍| 致1999电视剧免费观看策驰影院| 亚洲经典视频在线观看| 色播五月综合网| av亚洲精华国产精华精华| 91免费在线看片| 欧美色道久久88综合亚洲精品| 国产又黄又粗又长| 国产婷婷97碰碰久久人人蜜臀| 毛片av在线| 国产精品999| 成人在线视频你懂的| 亚洲国产欧美日韩| 国产精品乱看| 深夜做爰性大片蜜桃| 国产日韩v精品一区二区| 久草免费在线观看视频| 欧美三级日韩在线| 天堂v视频永久在线播放| 久久影院资源网| 成人在线视频免费| 久久精品二区| 亚洲片区在线| 黄页网站在线看| 亚洲欧洲www| 一区二区视频在线免费观看| 日韩av在线直播| 国产蜜臀av在线播放| 91在线观看免费| 日本欧美国产| www.欧美日本| 久久人人超碰精品| 99视频在线看| 欧美精品一区二区在线观看| 国产激情视频在线| 国产欧美在线看| 欧美日韩伦理在线免费| 人妻少妇被粗大爽9797pw| 成人91在线观看| 久久精品亚洲无码| 精品少妇一区二区| 日本天码aⅴ片在线电影网站| 91精品中国老女人| 水蜜桃精品av一区二区| 中文av一区二区三区| 国产婷婷色一区二区三区| 麻豆精品久久久久久久99蜜桃| 亚洲福利视频免费观看| av漫画网站在线观看| 99视频日韩| 精品福利av| 国产视频精品视频| 亚洲成人精品一区| 性xxxx视频| 91福利视频网| 亚洲天堂日韩在线| 成人在线看视频| 久久综合成人精品亚洲另类欧美 | 日本成人在线不卡视频| 欧美老女人性生活视频| 欧美日韩免费观看一区三区| 91福利在线视频| 91牛牛免费视频| 亚洲欧美综合| 特级特黄刘亦菲aaa级| 香蕉成人啪国产精品视频综合网| 东京干手机福利视频| 国外色69视频在线观看| 婷婷精品视频| 国产熟人av一二三区| 国产精品免费视频一区| 国产又粗又猛又爽又黄的视频一| 久久久黄色av| 精品自拍偷拍| 成人免费xxxxx在线视频| 一区二区中文视频| 性生活黄色大片| 欧美亚洲一级片| 久久精品国产大片免费观看| 99久久99精品| 亚洲成人7777| 国产美女视频一区二区三区| 成人国产在线激情| 国产精品大片免费观看| 成年人网站免费看| 欧美日韩大陆一区二区| 色噜噜狠狠狠综合欧洲色8| 精品国产一区二区三区四区精华| 日韩黄色小视频| 国模无码国产精品视频| 日韩精品免费一线在线观看| 视频91a欧美| 美女日批免费视频| 日本一区二区久久| www日本高清| 国产成人精品久久久| 影视亚洲一区二区三区| 免费中文字幕av| 91精品久久久久久久久99蜜臂| 国产在线xxx| 亚洲免费视频一区| 福利一区二区在线| 这里只有精品国产| 97精品视频在线观看| 欧美hd在线| 精品少妇人妻一区二区黑料社区 |