精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Seed Research | 全新超稀疏架構,推理成本較 MoE 最高可降 83%!

人工智能
近期,字節跳動豆包大模型團隊提出了全新的稀疏模型架構 UltraMem,該架構有效解決了 MoE 推理時高額的訪存問題,推理速度較 MoE 架構提升 2-6 倍,推理成本最高可降低 83%。

隨著模型規模的擴大,推理成本和訪存效率已成為限制大模型規模應用的關鍵瓶頸。近期,字節跳動豆包大模型團隊提出了全新的稀疏模型架構 UltraMem,該架構有效解決了 MoE 推理時高額的訪存問題,推理速度較 MoE 架構提升 2-6 倍,推理成本最高可降低 83%。該研究還揭示了新架構的 Scaling Law,證明其不僅具備優異的 Scaling 特性,更在性能上超越了 MoE。

實驗結果表明,訓練規模達 2000 萬 value 的 UltraMem 模型,在同等計算資源下,可同時實現業界領先的推理速度和模型性能,為構建數十億規模 value 或 expert 開辟了新路徑。

在 Transformer 架構下,模型的性能與其參數數量和計算復雜度呈對數關系。隨著 LLM 規模不斷增大,推理成本會急劇增加,速度變慢。

盡管 MoE 架構已經成功將計算和參數解耦,但在推理時,較小的 batch size 就會激活全部專家,導致訪存急劇上升,進而使推理延遲大幅增加。

為此,字節跳動豆包大模型 Foundation 團隊提出 UltraMem,一種同樣將計算和參數解耦的稀疏模型架構,在保證模型效果的前提下解決了推理的訪存問題。

實驗結果表明,在參數和激活條件相同的情況下,UltraMem 在模型效果上超越了 MoE,并將推理速度提升了 2-6 倍。此外,在常見 batch size 規模下,UltraMem 的訪存成本幾乎與同計算量的 Dense 模型相當。

圖片

目前,該論文已被 ICLR 2025 接收。



Ultra-Sparse Memory Network

論文鏈接:https://arxiv.org/abs/2411.12364



1. MoE 與 PKM 的局限性 

LLM 的能力增長需要指數級增長的計算資源,這在實時應用等資源有限的環境中頗具挑戰。為了解決計算問題,先前的研究者提出了 MoE 和 Product Key Memory(PKM)方案,但它們都有各自的局限性。

MoE 通過稀疏激活 expert 解耦了計算和參數,但在推理場景中,速度其實很慢。原因在于,模型在推理時只能一個字一個字的生成,因此 batch size 和 sequence length 都很小,在這個場景下,MoE 的所有專家通常會被全部訪問到,極其容易遇到訪存瓶頸,導致推理延遲激增

PKM 最早提出 large memory layer,其中包含了數量龐大的稀疏參數 value,這里 value 其實就是一個向量,每個 token 會根據一個「行路由」和一個「列路由」定位到得分最高的幾個 value,激活這些 value 后做 weighted sum pooling 作為 memory layer 的輸出。這種方法因為每個 token 在推理時僅僅只激活極少數的 value,所以推理時不會遇到訪存瓶頸,但其效果很差,且 scaling 能力差。

圖片


2. UltraMem 兼顧訪存和效果 

UltraMem 參考了 PKM 的設計,但針對 PKM 的 3 個缺陷予以補充,以實現更高效的訪存、更優質的 value 檢索,同時,降低了顯存和部署成本。

① 優化模型結構

PKM 的設計中,memory layer 只有 1 層,插在整個 Transformer 的中間層,這對大規模訓練并不友好,并且如此龐大的稀疏參數應該盡可能多的參與到每次的殘差連接中。

因此,研究團隊拆分出多個小 memory layer,以固定的間隔分布在 transformer layer 中;并且增加了 skip-layer 的操作,即當前層的 memory layer 的輸出會加到后面某層 transformer layer 的輸出。這使得模型可以并行地執行 memory layer 的訪存操作和 transformer layer 的計算。

圖片

② 優化 value 檢索方式

在檢索時,只有 score 最高的 m 個 value 會被激活,PKM 的 score 是通過「行 score」+「列 score」得到的。團隊進一步探索了一種更復雜的乘法方法 Tucker Decomposed Query-Key Retrieval(TDQKR)。這一方法受啟發于 Tucker Decomposition。具體來看,給定 values,shape 為(n,n,h),其中 h 為 hidden size,那么 values 的 score S_grid 可以做如下分解:

圖片

其中圖片是可學習的 tucker core。這個結構下,每個 value 的 score 由 r 個行 score 和 r 個列 score 的組合乘加獲得,具備更高的復雜度。

圖片

③ 隱式擴展稀疏參數

更多的稀疏參數通常會帶來更好的效果,但過多的參數又會給顯存和部署帶來麻煩。為此,研究團隊提出了 Implicit Value Expansion (IVE)方法隱式地擴展稀疏參數,并引入了 virtual memory 和 physical memory 的概念。

以 4 倍擴展為例(如下圖所示),virtual memory 的數量是 physical memory 的 4 倍,給定多對(score,index)后,首先按照 virtual memory address table 做查表,4 個 virtual block 會查詢同一個 physical memory table,之后各自做 weighted sum pooling,并經過不同的線性層,最后再求和輸出。

由于最后的 Linear 和取 value 之間沒有任何非線性操作,因此每個 Linear 都可以和 physical memory table 做融合,生成一個全新的 memory table,這個例子下,實際上隱式擴展了 4 倍的 value 數量。

圖片


3. 實驗結果:推理速度較 MoE 最高提升 6 倍 

① 模型性能評估

研究團隊在 151M、680M、1.6B 三個尺寸的激活參數上做了廣泛實驗,其中 MoE、PKM 和 UltraMem 的總稀疏參數保持在激活參數的 12 倍。

如下表所示,可以發現 UltraMem 在 680M、1.6B 上具有顯著的效果優勢

圖片

隨著稀疏參數的增加,UltraMem 的效果和推理速度如何變化?

下圖(b)展示了 UltraMem 的效果變化,橫軸為稀疏參數和稠密參數的比值,每個顏色的線代表了一種稀疏度。稀疏度定義為 value 的數量 / 每個 token 激活的 value 數量。觀察發現,持續增加稀疏參數和 loss 的下降呈對數關系;且稀疏度越小,模型效果越好;但是稀疏度持續降低帶來的收益在逐漸飽和。

下圖(c)展示了 UltraMem 的推理時間變化,橫軸為稀疏參數和稠密參數的比值。觀察發現,UltraMem 在持續增加稀疏參數時推理時間幾乎不變,反觀 MoE 有顯著增長的趨勢。

圖片

② 消融實驗

研究團隊在 151M 激活、1.5B 總參數的稀疏模型上進行了全面的消融實驗。從最原始的 PKM 開始,逐漸增加一些 trick 和上文提出的結構改進,最終能拿到 C4 validation loss -0.092 的顯著收益,同時稀疏參數和計算量幾乎不變。

圖片

綜上所述,研究團隊提出的 UltraMem 具有極小的訪存,因此,相比 MoE 實現了最高達 6 倍的速度提升,推理成本最高可降低 83%。同時,在性能方面,隨著模型容量的增加,在相同的參數和計算量情況下,UltraMem 超過了 MoE,表明其具有更強的擴展能力。這項工作為開發更高效和可擴展的語言模型提供了一個有希望的方向。

4. 寫在最后 

UltraMem 能有效地應用于對延遲要求較高的推理場景(例如代碼補全),避免了類似 MoE 的訪存瓶頸。即使在通用場景下,UltraMem 相較于 MoE 都展現出了顯著的速度優勢,除非 batch size 上萬的極端場景。

當前,針對 UltraMem 的技術演進仍存在若干值得探索的方向,包括但不限于:如何高效優化稀疏參數、如何提升稀疏模型推理能力、如何更優地激活稀疏參數等。這些技術方向或將成為后續研究的重要切入點。

責任編輯:龐桂玉 來源: 字節跳動技術團隊
相關推薦

2025-02-12 09:20:12

2025-10-11 09:06:52

2025-10-14 09:00:00

AI架構模型

2025-03-11 09:20:00

2025-09-12 10:02:21

AI模型開源

2024-02-04 12:22:28

模型數據

2025-02-14 09:30:00

視頻生成模型開源機器人

2024-09-05 14:25:00

訓練代碼

2025-02-24 08:45:00

模型架構AI

2025-06-09 09:41:25

2025-03-14 11:56:52

2021-12-10 14:50:26

微軟Windows 11Windows

2021-08-10 15:37:45

AI 數據機器學習

2024-01-26 13:18:00

AI訓練

2019-11-27 10:21:32

融云

2024-01-08 12:51:34

AI數據
點贊
收藏

51CTO技術棧公眾號

国产一二三在线观看| 日韩在线 中文字幕| 伊人久久影院| 欧美日韩国产精品一区| 日韩国产一区久久| 99国产揄拍国产精品| 在线观看的日韩av| 一本色道久久88综合亚洲精品ⅰ | 国产精品99久久久久久成人| 日本在线成人| 欧美午夜电影在线| 椎名由奈jux491在线播放| 黑人精品一区二区三区| 首页综合国产亚洲丝袜| 欧美成人免费大片| 男人舔女人下部高潮全视频 | 亚洲欧美久久| 久久久成人的性感天堂| 中文字幕狠狠干| 欧美久久亚洲| 欧美色图免费看| 无码播放一区二区三区| 超碰公开在线| 日本一区二区三级电影在线观看| 国产精品免费一区二区三区四区 | 日韩av网站在线播放| 农村少妇一区二区三区四区五区 | 理论片中文字幕| 美女视频网站久久| 日韩免费av在线| 精品一区在线视频| 天天av综合| 亚洲无线码在线一区观看| 伊人网综合视频| 日韩欧美高清一区二区三区| 欧美视频三区在线播放| 国产91对白刺激露脸在线观看| 在线电影福利片| 国产精品久久久久四虎| 日韩精品欧美一区二区三区| 天天综合天天综合| 成人黄色一级视频| 春色成人在线视频| 精品国自产在线观看| 精品系列免费在线观看| 国产精品自拍偷拍| 中日精品一色哟哟| 日本vs亚洲vs韩国一区三区 | 国产宾馆实践打屁股91| 成人看片人aa| 亚洲一区二区激情| 美女网站一区二区| 国产一区二区丝袜高跟鞋图片| 亚洲 欧美 中文字幕| 性伦欧美刺激片在线观看| 午夜精品久久久久久99热| 精品少妇一二三区| 在线精品一区| 97在线视频国产| 国产大片aaa| 亚洲激情亚洲| 97超碰蝌蚪网人人做人人爽| 日本三级欧美三级| 中文亚洲欧美| 欧洲s码亚洲m码精品一区| 国产又黄又猛又粗又爽| 久久亚洲一区| 国产精品美乳在线观看| 在线亚洲欧美日韩| 国产主播一区二区| 国产精品v欧美精品v日韩| 女人18毛片一区二区三区| 97se亚洲国产综合自在线| 欧美亚洲免费高清在线观看| 国产午夜在线视频| 亚洲人成小说网站色在线| 日韩精品福利片午夜免费观看| 色a资源在线| 精品国产乱码久久久久久虫虫漫画| 成年人视频观看| 99精品国自产在线| 日韩一区二区三区电影| 精品无码国产一区二区三区51安| 国产伦精品一区二区三区视频| 中文字幕日韩欧美| 精品99在线观看| 国产农村妇女精品一区二区| 国产成人在线视频| 国产夫绿帽单男3p精品视频| 99久久精品久久久久久清纯| 日韩中文字幕一区| 色呦呦在线资源| 一本到不卡免费一区二区| 中文字幕天天干| 99久热这里只有精品视频免费观看| 日韩av有码在线| 自拍偷拍第9页| 亚洲精选成人| 91久久精品在线| 三级理论午夜在线观看| 日韩一区欧美一区| 国产原创中文在线观看| 亚洲伊人伊成久久人综合网| 亚洲大胆人体av| 日韩一区二区三区四区视频| 在线成人黄色| 成人av.网址在线网站| 无码精品视频一区二区三区| 一色屋精品亚洲香蕉网站| 97国产精东麻豆人妻电影| 四虎国产精品免费久久| 日韩电影在线观看中文字幕| 黑人操日本美女| 久久久久国产精品午夜一区| av一本久道久久波多野结衣| 成人激情电影在线看| 亚洲国产精品自拍| 日韩成人av免费| 国产午夜一区| 97在线看福利| 成人黄色免费视频| 国产精品美女久久久久久久久久久 | 欧美丰满少妇xxxxx| 中文字幕免费高清网站| 不卡视频在线观看| 51xx午夜影福利| 亚洲天堂1区| 日韩精品亚洲元码| 久久精品视频国产| 国产精品1024| 亚洲午夜在线观看| 欧美影视资讯| 亚洲欧美在线看| 青青草免费观看视频| 成人国产免费视频| 丁香婷婷综合激情| 亚洲一区二区三区中文字幕在线观看| 波霸ol色综合久久| 亚洲最大成人在线视频| 国产欧美日韩在线观看| 日日碰狠狠躁久久躁婷婷| 欧美成a人免费观看久久| 久久久久久有精品国产| 亚洲av无码乱码国产精品| 中文字幕欧美一| 免费黄频在线观看| 91精品婷婷色在线观看| 91亚洲午夜在线| 国产cdts系列另类在线观看| 欧美精品久久天天躁| 精品视频第一页| 老鸭窝一区二区久久精品| 先锋影音一区二区三区| 成人黄色免费网站| 日韩亚洲成人av在线| 国产又粗又黄又爽的视频| 亚洲欧洲性图库| 中文字幕一区二区在线观看视频| 亚洲不卡av不卡一区二区| 亚洲伊人第一页| 超碰在线无需免费| 亚洲精品一区二区三区99| 国产在线视频第一页| 99免费精品视频| aa在线免费观看| 精品美女视频| 国产精品精品国产| 麻豆网在线观看| 日韩一级视频免费观看在线| 18精品爽视频在线观看| 99国产欧美久久久精品| 亚洲人成无码www久久久| 欧美亚洲高清| 亚洲自拍av在线| segui88久久综合| 日韩精品视频在线| 自拍偷拍色综合| 亚洲精品ww久久久久久p站 | 国产亚洲精久久久久久| 中文字幕有码av| 欧美一区久久| 久久精品第九区免费观看| 欧美va视频| 久久国产精品电影| 天天操天天干天天插| 91福利社在线观看| 久久中文免费视频| 99精品国产热久久91蜜凸| 99sesese| 亚洲片区在线| 亚洲图色在线| 精品亚洲免a| 国产主播喷水一区二区| f2c人成在线观看免费视频| 一区二区三区视频观看| www香蕉视频| 欧美一a一片一级一片| 久久久国产精品黄毛片| 久久免费视频色| 被黑人猛躁10次高潮视频| 久久av一区二区三区| 最新视频 - x88av| 久久爱www成人| 亚洲自拍av在线| 日韩精品免费观看视频| 欧美大片免费观看| 1pondo在线播放免费| 亚洲高清福利视频| 国产美女免费视频| 欧美专区日韩专区| 中日韩精品视频在线观看| 亚洲私人黄色宅男| 91中文字幕永久在线| 国产98色在线|日韩| 亚洲精品午夜在线观看| 午夜亚洲精品| 无码人妻少妇伦在线电影| 国产大片一区| 日本成人黄色免费看| 精品成人自拍视频| 亚洲最大福利视频网| 成人高清一区| 国产精品九九久久久久久久| av今日在线| 欧美精品videofree1080p| 日本不卡不卡| 在线视频一区二区| 国产在线网站| 亚洲欧美日韩一区在线| 西西人体44www大胆无码| 精品国产免费人成电影在线观看四季 | 天堂日韩电影| 国产经品一区二区| 欧美激情三级| 91精品久久久久久蜜桃| 中文成人在线| 成人激情在线观看| 欧美午夜三级| 国产精品久久久久久久久久ktv| 吉吉日韩欧美| 国产精品99久久久久久久久 | 国产日产久久高清欧美一区| 日韩新的三级电影| 日本在线观看天堂男亚洲| 欧美日韩在线观看首页| 97热精品视频官网| 欧美aaaaa性bbbbb小妇| 欧美一级大片在线免费观看| 日本а中文在线天堂| 91av在线网站| 欧美电影h版| 国产精品69久久| 巨胸喷奶水www久久久 | 盗摄系列偷拍视频精品tp| 成人在线看片| 久久精品福利| 久久久www免费人成黑人精品| 欧美黑白配在线| 麻豆成人av| 精品成av人一区二区三区| 日韩一本精品| 婷婷久久综合| 隔壁人妻偷人bd中字| 一本色道久久综合亚洲精品不卡 | 在线人成日本视频| 国产精品88a∨| 国产一区一区| 国产精品大全| 一区二区美女| 亚洲一区二区三区涩| 在线观看国产精品入口| 男人天堂av片| 性欧美精品高清| 网站一区二区三区| 国产精品资源在线看| 日韩少妇一区二区| 欧美激情一二三区| 欧美精品一级片| 欧美日韩国产区| 一道本无吗一区| 亚洲国内精品在线| 超碰免费97在线观看| 美女性感视频久久久| www.色在线| 国产欧美日韩中文字幕在线| 天堂av一区| 欧美重口乱码一区二区| 亚洲成人精品| 精品99在线视频| 国产一区二区三区精品欧美日韩一区二区三区 | 加勒比av一区二区| 秘密基地免费观看完整版中文 | 深田咏美在线x99av| 正在播放日韩欧美一页 | 色女人综合av| 国产一区亚洲| 韩国视频一区二区三区| 国产成人免费视| 人妻熟人中文字幕一区二区| 亚洲资源在线观看| 亚洲综合精品在线| 亚洲女同精品视频| 午夜成年人在线免费视频| 国产成人激情小视频| 国产福利资源一区| 在线视频精品一区| 久久国产日韩| 国产伦精品一区二区三区88av| 国产精品国产三级国产普通话三级| 国产精品7777777| 日韩欧美国产一区二区三区| jzzjzzjzz亚洲成熟少妇| 欧美一区二区.| 成人av影音| 国产精品一二三在线观看| 欧美aⅴ一区二区三区视频| 中文字幕第3页| 亚洲精品乱码久久久久久久久| 凹凸精品一区二区三区| 亚洲精品久久久久久久久久久久 | 91亚洲精品久久久蜜桃借种| 久久亚洲欧美国产精品乐播| 国产精品16p| 日韩一级精品视频在线观看| 日韩在线免费电影| 国产精品成av人在线视午夜片| 久久男人av| 2018国产在线| 国产69精品久久久久毛片| 51精品免费网站| 6080日韩午夜伦伦午夜伦| 91青青在线视频| 国产精品亚洲精品| 国产探花在线精品| 国产免费人做人爱午夜视频| 93久久精品日日躁夜夜躁欧美| 日本一区二区不卡在线| 精品99一区二区| caoprom在线| 国产乱人伦精品一区二区| 亚洲二区在线| 好吊色视频一区二区三区| 亚洲午夜在线视频| 丰满人妻一区二区| 久久欧美在线电影| 久久精品凹凸全集| 精品人妻一区二区三区四区在线 | 欧美高清视频一二三区 | 国内精品视频在线| 久久国产精品免费精品3p| 欧美成人一区二区在线观看| 99精品国产一区二区三区不卡 | 欧美另类久久久品| 国产黄a三级三级三级av在线看 | 国产精品久久夜| 一区二区三区播放| 美女少妇精品视频| 成人在线视频中文字幕| 俄罗斯av网站| 国产欧美日韩在线看| 亚洲天堂自拍偷拍| 欧美成人免费观看| 国产主播性色av福利精品一区| 欧美啪啪免费视频| 国产日韩精品一区二区三区| 亚洲一区中文字幕在线| 欧美xxxx18性欧美| 成人盗摄视频| 热久久精品国产| 亚洲欧美在线视频观看| 亚洲精品国产精品国| 57pao精品| 久久精品国产www456c0m| 天天爽夜夜爽视频| 狠狠干狠狠久久| 男人天堂久久久| 国产福利久久精品| 久久久久中文| 色欲人妻综合网| 日韩精品视频在线播放| 日本黄色成人| 国产日本在线播放| 国产精品人人做人人爽人人添| av资源免费看| 日本道色综合久久影院| 亚洲成av人电影| 日韩人妻无码一区二区三区| 欧美日韩国产电影| 国产高清视频色在线www| 亚洲精品一区二区三区四区五区| 国产精品影视网| 日韩免费av网站| 欧美激情a在线| 国产调教一区二区三区| 久久精品无码专区| 欧美日韩一区二区在线观看 | 国产精品久久色| 亚洲午夜一级| 国产一二三av| 精品调教chinesegay|