精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

推理成本比MoE直降83%!字節最新大模型架構入圍ICLR 2025

人工智能 新聞
研究團隊提出的UltraMem具有極小的訪存,因此,相比 MoE 實現了最高達6倍的速度提升,推理成本最高可降低83%。

字節出了個全新架構,把推理成本給狠狠地打了下去!

有多狠?

推理速度相比MoE架構提升2-6倍,推理成本最高可降低83%

圖片

這個全新的稀疏模型架構叫做UltraMem,有效地解決了目前主流的MoE架構和PKM架構所存在的局限性。

例如MoE在做推理時,較小的batch size會激活全部專家,導致訪存急劇上升,推理延遲增加;而PKM雖然減少了訪存開銷,但效果較差且擴展能力有限。

實驗結果表明,訓練規模達2000 萬value的UltraMem模型,在同等計算資源下,可同時實現業界領先的推理速度和模型性能,為構建數十億規模value或expert開辟了新路徑。

這項研究目前已經被ICLR 2025接收。

圖片

那么UltraMem架構具體是如何做到這點的呢?我們繼續往下看。

兼顧訪存和模型效果

隨著大語言模型能力的提升,所需的計算資源呈指數級增長,這在實時應用等資源受限的環境中帶來了巨大挑戰。

為了應對計算資源的瓶頸,研究者們提出了多種解決方案,其中包括MoE和Product Key Memory (PKM)。

然而,這些方法各自存在一定的局限性。

MoE 通過稀疏激活專家(expert)的方式,將計算與參數解耦,從而在訓練時能夠有效減少計算量;但在推理場景中,MoE 的表現卻不盡如人意。

由于推理時模型需要逐字生成輸出,batch size和sequence length通常較小,而通常情況下,數量較少的token就可以激活幾乎所有的專家。

這種全專家激活的模式使得訪存需求急劇增加,進而引發嚴重的訪存瓶頸,最終導致推理延遲大幅上升。

另一方面,PKM提出了 large memory layer的概念,其中包含了大量的稀疏參數 value(每個 value 實際上是一個向量)。

在推理時,每個 token 會通過“行路由”和“列路由”定位到得分最高的幾個 value,并對其進行加權求和(weighted sum pooling),作為 memory layer 的輸出。

由于每個token在推理時僅激活極少數的value,PKM能夠有效避免訪存瓶頸。然而,盡管PKM在訪存效率上表現優異,其模型效果卻較差,且擴展能力(scaling)有限,難以應對更大規模的模型需求。

總的來說,MoE和PKM雖然在一定程度上緩解了計算資源的問題,但它們在推理效率、模型效果和擴展能力等方面仍存在明顯不足,亟需新的解決方案來進一步優化大模型的推理性能。

圖片

而UltraMem則是參考了PKM的設計,但針對PKM的3個缺陷予以補充,以實現更高效的訪存、更優質的value檢索,同時,降低了顯存和部署成本。

1、優化模型結構

PKM的設計中,memory layer只有1層,插在整個Transformer的中間層,這對大規模訓練并不友好,并且如此龐大的稀疏參數應該盡可能多的參與到每次的殘差連接中。

因此,研究團隊拆分出多個小memory layer,以固定的間隔分布在 Transformer layer中;并且增加了skip-layer的操作,即當前層的memory layer的輸出會加到后面某層Transformer layer 的輸出。

這使得模型可以并行地執行memory layer的訪存操作和Transformer layer的計算。

圖片

2、優化value檢索方式

在檢索時,只有score最高的m個value會被激活,PKM的score是通過“行score”+“列score”得到的。

團隊進一步探索了一種更復雜的乘法方法Tucker Decomposed Query-Key Retrieval(TDQKR)。

這一方法受啟發于Tucker Decomposition。具體來看,給定values,shape為(n,n,h),其中h為hidden size,那么values的score S_grid可以做如下分解:

圖片

其中Srow,Scol∈Rr×n,C∈Rr×r是可學習的tucker core。這個結構下,每個value的score由r個行score和r個列score的組合乘加獲得,具備更高的復雜度。

圖片

3、隱式擴展稀疏參數

更多的稀疏參數通常會帶來更好的效果,但過多的參數又會給顯存和部署帶來麻煩。

為此,研究團隊提出了Implicit Value Expansion (IVE)方法隱式地擴展稀疏參數,并引入了virtual memory和physical memory的概念。

以4倍擴展為例(如下圖所示),virtual memory的數量是physical memory的4倍,給定多對(score, index)后,首先按照virtual memory address table做查表,4個virtual block會查詢同一個physical memory table,之后各自做 weighted sum pooling,并經過不同的線性層,最后再求和輸出。

由于最后的Linear和取value之間沒有任何非線性操作,因此每個Linear都可以和physical memory table做融合,生成一個全新的memory table,這個例子下,實際上隱式擴展了4倍的value 數量。

圖片

較MoE最高提速6倍

1、模型性能評估

研究團隊在151M、680M、1.6B三個尺寸的激活參數上做了廣泛的實驗,其中MoE、PKM和UltraMem的總稀疏參數保持在激活參數的12倍。

如下表所示,可以發現 UltraMem在680M、1.6B上具有顯著的效果優勢

圖片

隨著稀疏參數的增加,UltraMem的效果和推理速度如何變化?

  • 下圖(b)展示了UltraMem的效果變化,橫軸為稀疏參數和稠密參數的比值,每個顏色的線代表了一種稀疏度。稀疏度定義為value的數量 / 每個token激活的value數量。觀察發現,持續增加稀疏參數和loss的下降呈對數關系;且稀疏度越小,模型效果越好;但是稀疏度持續降低帶來的收益在逐漸飽和。
  • 下圖(c)展示了UltraMem的推理時間變化,橫軸為稀疏參數和稠密參數的比值。觀察發現,UltraMem在持續增加稀疏參數時推理時間幾乎不變,反觀MoE有顯著增長的趨勢。

圖片

2、消融實驗

研究團隊在151M激活、1.5B總參數的稀疏模型上進行了全面的消融實驗。

從最原始的PKM開始,逐漸增加一些 trick 和上文提出的結構改進,最終能拿到C4 validation loss -0.092的顯著收益,同時稀疏參數和計算量幾乎不變。

圖片

綜上所述,研究團隊提出的UltraMem具有極小的訪存,因此,相比 MoE 實現了最高達6倍的速度提升,推理成本最高可降低83%。

同時,在性能方面,隨著模型容量的增加,在相同的參數和計算量情況下,UltraMem超過了MoE,表明其具有更強的擴展能力。

這項工作可以說是為開發更高效和可擴展的語言模型提供了一個有希望的方向。

論文地址:https://arxiv.org/abs/2411.12364

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-02-19 15:17:24

2025-10-11 09:06:52

2025-09-12 10:02:21

AI模型開源

2024-09-05 14:25:00

訓練代碼

2025-03-11 09:20:00

2024-01-26 13:18:00

AI訓練

2025-04-09 04:22:00

2025-04-30 09:00:00

模型推理AI

2024-02-06 10:38:10

昆侖萬維大模型

2025-07-10 09:06:13

2024-02-01 12:43:16

模型數據

2024-01-10 17:13:42

模型數據

2025-06-09 09:41:25

2025-03-14 11:56:52

2024-05-06 07:58:23

MoE模型系統

2025-02-24 08:45:00

模型架構AI
點贊
收藏

51CTO技術棧公眾號

蜜桃视频无码区在线观看| 亚洲综合在线做性| 国产伦理片在线观看| 电影一区电影二区| 亚洲精品成人天堂一二三| 国产91aaa| 一级久久久久久| 亚洲大全视频| 日韩黄色av网站| 五月花丁香婷婷| 24小时免费看片在线观看 | 网站一区二区三区| 黄色片免费在线观看| 99久精品国产| 成人淫片在线看| 亚洲日本韩国在线| 一个色综合网| 亚洲天堂男人的天堂| 91亚洲一区二区| 欧美magnet| 艳妇臀荡乳欲伦亚洲一区| 日韩精品不卡| 日韩一卡二卡在线| 国内久久精品视频| 国产aaa精品| 久久久久噜噜噜亚洲熟女综合| 最新亚洲精品| 亚洲国产精品va在线看黑人| 亚洲男人天堂av在线| 成人做爰视频www网站小优视频| 亚洲一区二区三区中文字幕在线| 亚洲欧美日韩精品在线| 色视频精品视频在线观看| 国产福利一区在线| 国产三级在线| 欧美另类激情| 狠狠综合久久av一区二区小说| 亚洲国产一区在线| 视频一区二区三区在线看免费看| 国产一区二区三区免费播放| 78m国产成人精品视频| 欧美在线视频第一页| 国产乱码精品一区二区三区四区| 欧美精品一区二区三区蜜桃视频| 黄色片免费网址| 日本黄色成人| 欧美无砖专区一中文字| 久草精品在线播放| 小h片在线观看| 香蕉加勒比综合久久| 波多野结衣 作品| 成人免费在线| 亚洲欧美日韩系列| 亚洲欧美一二三| 亚洲欧美视频一区二区| 日本一区二区不卡视频| 日韩欧美一区二区三区四区| 日韩国产福利| 久久久国际精品| 欧美国产二区| 国内在线精品| 欧美激情一区二区三区全黄| 日韩hmxxxx| 成人欧美一区| 亚洲欧洲三级电影| 法国空姐在线观看免费| 色帝国亚洲欧美在线| 一区二区欧美精品| 国产美女主播在线播放| 爱草tv视频在线观看992| 亚洲成av人片观看| 成人在线免费在线观看| 成人啊v在线| 欧美日韩三级一区| 国产美女18xxxx免费视频| 亚洲图片小说区| 精品国产网站在线观看| 国产乱了高清露脸对白| 国产探花在线精品一区二区| 在线日韩日本国产亚洲| 亚洲精品久久久久久国| 欧美三级视频| 欧亚精品在线观看| 成人黄色片在线观看| 国内精品伊人久久久久av一坑 | 亚洲级视频在线观看免费1级| 亚洲视频在线播放免费| 精品一区亚洲| 久久久精品久久| 日本少妇久久久| 日韩综合在线视频| 成人精品一区二区三区| 欧美视频一二区| 国产亚洲欧美色| 久久99国产精品一区| 深夜福利视频一区二区| 欧美日韩美女一区二区| 免费不卡的av| 成人羞羞动漫| 韩国欧美亚洲国产| 中文字幕人妻丝袜乱一区三区| 国产成人福利片| 欧美18视频| 成年人黄视频在线观看| 黑人巨大精品欧美一区二区三区 | 国产一级在线观看视频| 天堂va蜜桃一区二区三区漫画版 | 日韩精选在线| www.国产一区| 久久99国产综合精品免费| 精品亚洲免费视频| 免费h精品视频在线播放| 精品孕妇一区二区三区| 欧美性开放视频| 性色av浪潮av| 欧洲福利电影| 91精品国产高清久久久久久| 国产精品久久久久毛片| 久久久久久久久岛国免费| www婷婷av久久久影片| 人人视频精品| 亚洲精品按摩视频| 欧美日韩成人免费观看| 久久精品国产在热久久| 久久一区二区三区欧美亚洲| 丝袜在线视频| 67194成人在线观看| xxxx日本黄色| 美女诱惑一区| 久久免费99精品久久久久久| 欧洲中文在线| 欧美一区二区三区男人的天堂| 性欧美精品中出| 亚洲欧美日韩国产一区二区| 国产一区二区黄色| 在线观看电影av| 欧美三级一区二区| 国产精品高清无码在线观看| 国产精品视频| 久久久人人爽| 三级中文字幕在线观看| 亚洲第一区中文字幕| 九九九久久久久| 国产精品一二三四| 欧美a级黄色大片| 秋霞午夜一区二区三区视频| 久久这里有精品视频| 国产伦理一区二区| 亚洲欧洲一区二区三区| 中文av字幕在线观看| 99久久九九| 成人精品一区二区三区电影黑人| 午夜视频在线观看免费视频| 欧美色中文字幕| 色偷偷男人天堂| 久久精品国产亚洲aⅴ| 一区二区三区国| 国产高清日韩| 欧美日韩国产成人在线| 亚洲卡一卡二卡三| 午夜精品久久久| v8888av| 玖玖视频精品| 亚洲高清视频一区二区| 不卡的国产精品| 九九久久综合网站| 国精产品一品二品国精品69xx| 亚洲愉拍自拍另类高清精品| 国产老熟女伦老熟妇露脸| 国产精品人人爽人人做我的可爱| 欧美一区二区影视| 免费视频观看成人| 久久久精品欧美| 国产高清视频免费| 亚洲18色成人| 色欲狠狠躁天天躁无码中文字幕 | 日韩欧美亚洲系列| 欧美色窝79yyyycom| 特级片在线观看| 成人性生交大片免费看中文| 国产淫片免费看| 欧美色爱综合| 97超级碰碰| 亚洲欧洲美洲av| 中文字幕日韩免费视频| www.麻豆av| 欧美午夜精品久久久久久久| 99久久99久久精品免费| 国产成人精品一区二区三区网站观看| 日韩少妇内射免费播放18禁裸乳| 日本精品三区| 国产99在线播放| 日韩高清在线| 欧美日本高清一区| 国产小视频在线观看| 91精品国产乱| 婷婷激情五月综合| 一区二区国产视频| 日韩中文字幕有码| 国产成人精品www牛牛影视| 别急慢慢来1978如如2| 自拍偷拍欧美专区| 欧美三级网色| 97超碰成人| 国产精品免费一区豆花| 国产高清视频色在线www| 亚洲欧美在线播放| 亚洲AV午夜精品| 欧美在线视频不卡| 久久精品国产亚洲av无码娇色| 国产三级久久久| 无码国产精品一区二区免费式直播| 日韩avvvv在线播放| 妞干网在线观看视频| 91精品国产乱码久久久久久久| 欧美日韩国产不卡在线看| 午夜视频一区二区在线观看| 国产精品久久久久久久7电影| av午夜在线观看| 不卡av电影在线观看| 国产三级在线观看| 日韩精品免费在线视频观看| 99热精品在线播放| 欧美日韩亚洲综合一区二区三区 | 黄色网页网址在线免费| 亚洲午夜精品视频| 天堂在线中文网| 日韩精品一区二区三区四区| 91精品视频免费在线观看| 91久久精品一区二区二区| 日本午夜精品理论片a级app发布| 国产精品高潮呻吟| 国产精品成人一区二区三区电影毛片| 成人av一区二区三区| www.com污| 久久国产欧美日韩精品| 手机在线免费观看毛片| 久久久天天操| 99精品视频在线看| 国产婷婷精品| 免费看国产一级片| 亚洲激情国产| www插插插无码视频网站| 欧美体内she精视频在线观看| 日本一级淫片演员| 99精品美女| 国产精品88久久久久久妇女| 99国产精品一区二区| 二级片在线观看| 99re66热这里只有精品8| 中文字幕成人一区| 五月激情综合| 亚洲av综合色区| 欧美日韩三级电影在线| 青草视频在线观看视频| 在线免费高清一区二区三区| 自拍日韩亚洲一区在线| 国产婷婷精品| 日本888xxxx| 蜜桃av噜噜一区| 亚洲无在线观看| 国产高清不卡一区| 亚洲最大免费视频| 国产午夜亚洲精品羞羞网站| 亚洲天堂最新地址| 亚洲三级小视频| 免费在线观看黄视频| 亚洲va欧美va国产va天堂影院| 国产精品成人久久| 色综合一区二区| 亚洲国产无线乱码在线观看| 91精品欧美福利在线观看| 性欧美一区二区三区| 亚洲国产中文字幕久久网| 黄网在线免费| 久久精品成人欧美大片| av手机免费在线观看| 国产99久久精品一区二区永久免费| 国产成人a视频高清在线观看| 91精品国产自产在线老师啪| 综合激情五月婷婷| 老牛影视免费一区二区| 91日韩在线| www.99热这里只有精品| 日本成人中文字幕| 农村末发育av片一区二区| 91亚洲精华国产精华精华液| 亚洲最大成人综合网| 一区二区高清在线| 国产精品男女视频| 51精品久久久久久久蜜臀| 四虎在线视频免费观看| 中文字幕亚洲自拍| av美女在线观看| 国产精品中文在线| 欧美xxxx在线| 中文字幕综合在线观看| 亚洲精品护士| 色18美女社区| 久久久青草青青国产亚洲免观| 1024手机在线视频| 色哦色哦哦色天天综合| 亚洲精品无码专区| 色婷婷综合久久久久| 黄色污网站在线观看| 成人激情视频在线播放| 一区二区美女| 一卡二卡三卡视频| 国产在线不卡视频| 中文字幕在线1| 亚洲成精国产精品女| 91中文字幕在线视频| 国产视频自拍一区| 欧美极品少妇videossex| 国产精自产拍久久久久久| 日本成人中文| 国产片侵犯亲女视频播放| 美腿丝袜亚洲色图| 丝袜美腿中文字幕| 亚洲香肠在线观看| 99视频国产精品免费观看a | 人与嘼交av免费| 欧美日韩一区二区三区在线免费观看| 国产aⅴ爽av久久久久成人| 永久免费精品影视网站| 无遮挡爽大片在线观看视频 | 亚洲九九爱视频| 中国老头性行为xxxx| 日韩精品福利在线| 大黄网站在线观看| 999视频在线观看| 无需播放器亚洲| 亚洲免费av一区| 国产精品女人毛片| 成人黄色三级视频| 国产亚洲成av人片在线观看桃| 蜜臀久久精品| 久久久久久国产精品免费免费| 最新国产乱人伦偷精品免费网站| 中国老熟女重囗味hdxx| 亚洲美女视频在线观看| 国产免费高清av| 久久综合色88| 欧美国产中文高清| 亚洲精品国产suv一区88| 国产精品一区一区| 污软件在线观看| 欧美一二三区在线| 欧美wwww| 国产三区精品| 国产精品日本| av网在线播放| 精品视频资源站| 九七久久人人| www.成人av.com| 亚洲激情午夜| 欧美成人午夜精品免费| 91久久免费观看| 欧美成人二区| 91久久精品www人人做人人爽 | 久久免费成人精品视频| 你懂的在线观看一区二区| 国产a级一级片| 日本一区二区免费在线观看视频| 中日精品一色哟哟| 久久久国产成人精品| 日韩成人精品| 成人免费观看cn| 国产亚洲一区字幕| 91av国产精品| 久久久久国产视频| 天天躁日日躁狠狠躁欧美| 91蝌蚪视频在线观看| 国产精品不卡视频| 亚洲精品喷潮一区二区三区| 欧美亚洲国产视频小说| 欧美3p在线观看| www.黄色网| 日本韩国精品一区二区在线观看| 欧美性猛交xxx乱大交3蜜桃| 懂色一区二区三区av片| 久久精品人人做人人爽电影蜜月| 日韩av片在线免费观看| 精品对白一区国产伦| free欧美| 国产精品免费看久久久无码| 91麻豆6部合集magnet| 96亚洲精品久久久蜜桃| 久久露脸国产精品| 久久国产影院| 免费中文字幕av| 欧美色视频在线观看| 成av人片在线观看www| 亚洲欧美精品在线观看| www.亚洲在线| 一级α片免费看刺激高潮视频| 国语自产偷拍精品视频偷| 日韩电影二区| jizz欧美性20| 日韩一级二级三级|