精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

為MoE解綁:全新「專家即服務」推理架構發布,超細粒度擴展銳減37.5%成本

人工智能 新聞
本文作者提出了一種全新的 MoE 模型推理系統 ——Expert-as-a-Service (EaaS),旨在通過架構層面的創新來提升大規模 MoE 推理的效率、擴展性和魯棒性。

本文第一作者劉子銘為新加坡國立大學三年級博士生,本科畢業于北京大學,研究方向為機器學習系統中的并行推理與訓練效率優化。通信作者為上海創智學院馮思遠老師和新加坡國立大學尤洋老師。共同作者來自于上海奇績智峰智能科技有限公司,北京基流科技有限公司等。

近年來,大型語言模型的參數規模屢創新高,隨之而來的推理開銷也呈指數級增長。如何降低超大模型的推理成本,成為業界關注的焦點之一。Mixture-of-Experts (MoE,混合專家) 架構通過引入大量 “專家” 子模型,讓每個輸入僅激活少數專家,從而在參數規模激增的同時避免推理計算量同比增長。這一稀疏激活策略使模型能擴展到數萬億參數規模,但也給推理系統帶來了新的挑戰:

  • 擴展性差:現有主流 MoE 推理框架大多要求使用大規模同步通信組來部署模型,一次性占用大量 GPU 資源,使彈性資源伸縮變得十分困難。這種粗粒度伸縮方式導致資源供給無法嚴格按照當前用戶流量進行調整,只能按整塊單元增加或減少,造成資源浪費。
  • 容錯性低:傳統 MoE 推理采用全局緊耦合架構,各 GPU 間通過 All-to-All 等大規模集體通信協同工作。在這種高度依賴統一通信組的設計下,任意一個節點故障都可能迫使整個服務集群重啟,導致服務中斷。也就是說,系統缺乏容錯能力,一處故障即全局崩潰。
  • 負載不均:MoE 中的專家調用是動態稀疏的,哪個專家被激活取決于輸入內容,在不同的工作負載下被激活的分布有很大區別。固定的專家映射和資源分配策略難以適應這種波動。某些專家所在 GPU 因頻繁命中而過載,而其他專家節點長期閑置,造成資源利用低下。

通過觀察,作者發現這些問題其實有共同的根本原因:整個系統被當作一個龐大的 “有狀態整體” 去管理。事實上,專家層本質上是無狀態的,它對輸入執行純函數計算,不依賴歷史上下文。作者利用這一特性,將專家層的計算抽象為獨立的無狀態服務,與維護 KV 緩存的 Attention 前端解耦部署。盡管近期也有研究嘗試解耦 Attention 層與專家層、按不同組件拆分部署,但仍未根本解決伸縮僵化、大規模容錯等問題。為此,本文作者提出了一種全新的 MoE 模型推理系統 ——Expert-as-a-Service (EaaS),旨在通過架構層面的創新來提升大規模 MoE 推理的效率、擴展性和魯棒性。

方法

EaaS 的 “專家即服務” 的架構轉變,使 MoE 推理能夠像微服務一樣靈活調度。在這一前提下,作者對系統進行了如下設計:

  • 專家服務化、無狀態設計:EaaS 將每個專家拆分成獨立服務模塊,專家不維護會話狀態,僅根據請求計算輸出。Attention 層(客戶端)通過 gating 動態選取需要調用的專家服務。由于專家之間相互獨立,整個模型不再是一個龐大的緊耦合應用,而是由許多可獨立擴展的服務組成,為精細擴展奠定基礎。在這種架構下,模型初始部署規模可以很小(例如 16 塊 GPU 起步),可以一次增加 / 減少一塊 GPU 來精確匹配負載需求。

EaaS 專家服務器的動態批處理機制。

  • 解耦 Attention 層與專家層:在傳統架構中,Attention 計算和專家計算放置在同一組計算節點內,而 EaaS 將 Attention 客戶端與專家服務端職責解耦開來,二者通過高效通信機制銜接。這樣一方面減少了全局同步點,Attention 端可以異步等待專家結果,同時著手處理下一批次計算,從而提升流水線利用率;另一方面 Attention 和專家可以獨立擴展,互不影響,突破了傳統架構中必須同步擴容的限制。

EaaS 利用 InfiniBand GPUDirect Async (IBGDA) 來實現低通信延遲,并通過完全 CUDA graph 捕獲來最小化內核啟動開銷,從而實現無 CPU 控制的通信。

  • 高性能異步通信 (IBGDA):為支撐上述解耦架構,EaaS 研發了定制的無通信組、非對稱、異步點對點通信庫。該庫基于 InfiniBand GPUDirect Async (IBGDA) 技術,實現了 GPU 直連網絡的通信模式,完全繞過 CPU 參與。具體來說,GPU 可以直接通過 InfiniBand 網卡收發數據,不需經由 CPU 協調。此外,該通信庫支持單邊 RDMA 操作和靈活的緩沖管理,不要求通信雙方對稱協同,突破了 NCCL 和 NVSHMEM 等通信庫需整組同步的限制。借助 IBGDA 通信,EaaS 實現了真正的 CPU-free 數據傳輸:網絡通信由 GPU 主動驅動,能夠與 CUDA Graph 等機制結合,將整個端到端計算過程封裝為單一調度單元,最大程度減少通信對計算流水線的干擾。
  • 動態負載均衡:由于專家服務彼此獨立,EaaS 可以方便地引入實時負載均衡策略。例如,當監測到某個專家被請求的頻率過高(“熱” 專家)時,系統可動態增添該專家服務的實例來分攤流量;反之對于長期 “冷門” 的專家,可減少其實例以節省資源。


  • 容錯與故障恢復機制:EaaS 通過客戶端 - 服務端的松耦合通信取代了集體通信,天然具備更強的容錯性。系統設置了一個中央監控組件,實時追蹤各實例健康狀態。當某個專家服務發生故障停止響應時,通知相關的 Attention 客戶端自動切換到該專家的其他可用實例繼續服務,無需重建全局通信組。同樣地,如果某個 Attention 客戶端節點故障,其他客戶端不會直接中斷,新客戶端加入也不會擾亂正在運行的專家服務。

實驗

論文通過一系列大規模實驗,利用端到端的 benchmark 對比了 EaaS 與當前主流 MoE 推理方案(如 SGLang + DeepEP、vLLM + DeepEP 以及 SGLang + TP 等組合)的性能,在擴展性和容錯等方面展現出 EaaS 的優勢。

  • 擴展能力:在隨請求密度進行擴展(也即弱擴展)的實驗中,隨著 GPU 節點數從 32 增加到 64,EaaS 的總吞吐量幾乎按比例提升。同時,EaaS 打破了傳統架構對 GPU 數量整除比的要求。使用傳統專家并行的系統只能在 GPU 數量是既定專家總數因子的情況下擴容,而 EaaS 由于專家服務松耦合,支持任意數量 GPU 的部署組合,可以細粒度地按需增減算力。這意味著云服務商可以靈活地為 MoE 模型調配資源,例如在負載下降時將推理集群從 64 GPU 縮減到 40 GPU 仍保持同等吞吐。實驗顯示,與靜態架構相比,EaaS 能夠實現同等性能下最高約 37.5% 的 GPU 資源節省。

  • 容錯與魯棒性:在模擬故障場景中,EaaS 展現出卓越的服務連續性。當實驗中隨機失效 GPU 節點時,EaaS 幾乎不中斷地完成了請求處理,吞吐量僅略微下降不到 2%。相比之下,采用 DeepEP 等傳統方案的系統由于所有解碼 GPU 綁定在單一通信組內,任一節點故障都會使整個組停止服務,無法在故障期間繼續推理。EaaS 中有故障的專家請求被即時路由到備用副本處理,客戶端自身故障也被其他實例接管,整個服務保持了高可用性。

  • 高吞吐與低延遲兼顧:在端到端推理吞吐量上,EaaS 與現有最優系統表現相當,能夠達到媲美 SOTA 的生成速度。同時,EaaS 在響應延遲上保持穩定,得益于高效通信與動態資源調配,能將每個 token 的平均生成延遲維持在較低水平。整體評估顯示,EaaS 在吞吐 - 延遲權衡上達到優秀平衡,在保證用戶響應及時性的同時提供了強勁的處理能力。

1 對 3 往返通信平均延遲

2 對 2 往返通信平均延遲

除此以外,作者也將 EaaS 的通信庫與當前開源的 Step3 中 StepMesh 使用的通信庫進行了 torch 側調用從端到端的延遲比較,并發現在對稱與非對稱的場景下,EaaS 的通信庫通過 IBGDA 本身的高效通信模式與僅 CPU-free 的結構支持的 CUDA graph 帶來的 kernel launch 開銷的 overlap,最多將延遲降低了 49.6%。

總結

面向未來,EaaS 展現出在云端大模型推理和模型即服務(MaaS)等場景中的巨大潛力。其細粒度的資源調配能力意味著云服務提供商可以根據實時負載彈性地調整 MoE 模型的算力分配,從而以更低的成本提供穩定可靠的模型推理服務。這種按需伸縮、平滑容錯的設計非常契合云計算環境下的多租戶和持續交付需求。另一方面,EaaS 的服務化架構具有良好的可運營和可演化特性:模塊化的專家服務便于獨立升級和維護,通信調度組件也可以逐步優化迭代,從而使整套系統能夠隨著模型規模和應用需求的變化不斷演進。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-02-19 15:17:24

2024-06-27 08:00:00

存儲數據庫細粒度

2010-04-14 11:04:53

Oracle細粒度

2010-04-19 09:35:58

Oracle細粒度

2009-04-16 17:59:25

細粒度權限

2025-09-01 08:10:09

細粒度圖像分類細粒度視覺分類FGVC

2009-10-27 09:31:24

Windows Ser口令策略

2024-04-26 12:13:45

NameNodeHDFS核心

2018-02-25 04:05:16

2025-10-21 12:40:05

2010-04-16 16:39:25

Oracle細粒度

2010-04-22 13:39:31

Oracle細粒度訪問

2016-09-26 14:45:46

微服務

2018-02-07 14:53:42

2010-12-30 14:34:43

云計算供應商

2010-10-20 15:09:05

2025-02-18 09:10:00

2022-11-07 12:15:13

開源深度學習

2022-06-27 17:58:42

pwrueBPF工具

2025-03-04 04:00:00

擴散模型DDPM
點贊
收藏

51CTO技術棧公眾號

自拍视频在线| 国产精品视频一区在线观看| 国产人与zoxxxx另类91| 亚洲国产精品一区二区久久| 欧美极品日韩| 97在线公开视频| 99精品福利视频| 日韩中文字幕网| 黄色免费视频网站| 国产在视频一区二区三区吞精| 亚洲免费观看高清完整版在线观看熊 | 青青草国产精品97视觉盛宴| 欧美二区乱c黑人| 亚洲性猛交xxxx乱大交| 日韩一区二区三区精品| 色婷婷av一区二区| 无码熟妇人妻av在线电影| 黄色大片在线看| 从欧美一区二区三区| 国产福利成人在线| 日韩av在线电影| 婷婷亚洲图片| 国产一区二区三区直播精品电影| 久久久久国产免费| 亚洲国产aⅴ精品一区二区三区| 午夜伊人狠狠久久| 国产日韩欧美大片| 天堂中文а√在线| 久久久久国产精品厨房| 国产精品免费视频一区二区| 国产孕妇孕交大片孕| 日韩精品乱码免费| 91极品视频在线| 九九在线观看视频| 99国内精品久久久久久久| 亚洲欧美国产一区二区三区| 日本一级大毛片a一| 亚洲成人a级片| 欧美日韩亚洲不卡| 黄色aaa级片| 影视一区二区三区| 色综合一区二区| 91免费视频网站在线观看| 丰满诱人av在线播放| 亚洲男人的天堂av| 黄色网zhan| 黄色网页在线免费看| 欧美激情一区二区三区四区| 欧美在线一二三区| 天天摸天天干天天操| 国产成人8x视频一区二区| 91丨九色丨国产在线| 一级日韩一级欧美| 久久精品国产亚洲高清剧情介绍| 日韩av毛片网| 国产伦精品一区二区三区视频我| 亚洲在线黄色| 国产精品第10页| 中文字幕一区二区免费| 美女精品自拍一二三四| 国产精品免费在线免费| 国产精品777777| 久久综合亚州| 国产精品亚洲综合天堂夜夜| 伊人网视频在线| 韩日欧美一区二区三区| 亚洲一区免费网站| 成人乱码一区二区三区| 99热精品一区二区| 久久久www免费人成黑人精品| 亚洲欧洲成人在线| 国产日产欧美一区| 99亚洲精品视频| 黄色成人在线网| 精品欧美一区二区三区| 一本久道综合色婷婷五月| 亚洲mmav| 欧美一级视频精品观看| 国产一卡二卡三卡四卡| 亚洲人成网www| www.久久撸.com| 欧美精品色哟哟| 午夜一区在线| 成人黄色av免费在线观看| 草逼视频免费看| 99久久精品国产一区| 青青草成人激情在线| 欧美日韩欧美| 亚洲高清视频在线| 99视频在线视频| 秋霞一区二区| 亚洲欧美精品在线| 999精品视频在线观看播放 | 北条麻妃在线视频观看| 午夜激情成人网| 欧美一级xxx| 丝袜美腿中文字幕| 91精品精品| 日韩免费观看视频| www.日本在线观看| 国产日韩欧美制服另类| 中文字幕色呦呦| 国产经典一区| 亚洲电影免费观看高清完整版在线 | 人人妻人人爽人人澡人人精品| 国内精品自线一区二区三区视频| 精品一区二区三区视频日产| 二区三区在线观看| 一本色道综合亚洲| 成人做爰www看视频软件 | 国产一区二区三区毛片| 久草成人在线视频| 日韩高清不卡一区二区三区| 国产精品一区二区免费看| 99视频在线观看地址| 偷拍与自拍一区| 超碰中文字幕在线观看| 蜜臀av免费一区二区三区| 欧美xxxx18国产| 中文字幕av久久爽| 久久亚洲一区二区三区四区| www.69av| 国产欧美日韩电影| 日韩专区在线播放| 午夜精品久久久久久久蜜桃| 99国产精品久久| www.亚洲视频.com| 久久久久毛片免费观看| 中文字幕综合在线| 毛片在线免费播放| 国产视频在线观看一区二区三区| 少妇人妻无码专区视频| 成人av影音| 色综合久久悠悠| 97人妻精品一区二区三区动漫| 国产欧美综合在线| 国产成人久久777777| 国偷自产视频一区二区久| 欧美精品中文字幕一区| 91国偷自产中文字幕久久| 日本一区二区三区四区在线视频| 日本天堂免费a| 国产精品xnxxcom| 麻豆乱码国产一区二区三区| 国产精品久久久久久免费免熟| 国产精品欧美久久久久无广告 | 亚洲视频在线观看免费视频| 国产日韩精品视频一区| 国产成人手机视频| 精品久久影视| 国产精品视频26uuu| av国产在线观看| 欧美日韩国产123区| 午夜激情福利电影| 国产精品自拍毛片| 国产精品无码电影在线观看| 欧美a在线观看| 欧美精品videosex牲欧美| 黄色片网站免费在线观看| 亚洲高清免费观看高清完整版在线观看| 中国特级黄色片| 在线亚洲观看| 日韩精品一区二区三区丰满| 78精品国产综合久久香蕉| 日韩中文字幕精品视频| 精品人妻无码一区二区色欲产成人 | 在线观看欧美日韩| 国产又粗又长又黄| 亚洲成av人影院在线观看网| 免费在线观看你懂的| 蜜臀av性久久久久蜜臀aⅴ四虎| 手机成人av在线| www.国产精品一区| 日韩免费观看网站| 国产在线观看av| 精品免费一区二区三区| 中日韩黄色大片| 国产三级久久久| 天美一区二区三区| 国产日韩一区| 在线视频不卡国产| 欧美电影在线观看免费| 国产精品久久91| 性欧美1819sex性高清大胸| 亚洲精品xxx| 中文在线字幕免费观| 亚洲一区二区三区视频在线播放| 丰满少妇高潮一区二区| 激情综合色丁香一区二区| 精品少妇在线视频| 水蜜桃久久夜色精品一区| 成人自拍视频网站| 成人久久网站| 国内伊人久久久久久网站视频 | 国产精品丝袜白浆摸在线 | 欧洲熟妇的性久久久久久| 久久亚洲不卡| 人妻无码一区二区三区四区| 免费不卡中文字幕在线| 99三级在线| 日本成人福利| 97香蕉超级碰碰久久免费软件 | 亚洲欧美日韩久久| 国产黄色网址在线观看| 国产成人免费网站| 鲁一鲁一鲁一鲁一av| 亚洲免费高清| 最新av在线免费观看| 精品久久久久久久久久久下田| 国产精品国产三级国产专区53| 成人在线视频观看| 国产91精品久久久久久| 在线观看操人| 三级精品视频久久久久| 青青视频在线观| 精品对白一区国产伦| 国产精品无码在线播放| 欧美性一二三区| 欧美性猛交bbbbb精品| 午夜精品123| 久久久久久久蜜桃| 一区二区三区高清| 亚洲精品一区二区三区在线播放| 国产女人水真多18毛片18精品视频| 中国特级黄色大片| 国产老肥熟一区二区三区| 手机看片一级片| 日韩精品久久理论片| 国产v亚洲v天堂无码久久久| 欧美亚洲一级| 欧美日韩性生活片| 亚洲一级特黄| 轻点好疼好大好爽视频| 中文字幕免费一区二区| 亚洲最新免费视频| 成人免费在线播放| 亚洲区一区二区三区| av中文一区| 亚洲一区二区四区| 欧美第一精品| 一区二区在线观看网站| 久久免费大视频| 一本一本久久a久久精品综合妖精| 欧美亚洲激情| 亚洲看片网站| 999视频精品| 欧美aaa在线观看| 亚洲无中文字幕| 日韩成人午夜影院| 欧美日韩亚洲一区三区 | 神马午夜精品91| 成人免费一区二区三区视频| 亚洲综合网在线| 亚洲综合一区二区| 日本熟女一区二区| 欧美日韩国产影院| 国产午夜麻豆影院在线观看| 91久久精品一区二区三区| 黄色大全在线观看| 欧美剧情片在线观看| 国产女无套免费视频| 日韩欧美国产一区二区三区 | 黄色www网站| 亚洲男人影院| 国内自拍视频网| 国产在线视频一区二区| 美女流白浆视频| 99精品桃花视频在线观看| 少妇真人直播免费视频| 日本一区二区免费在线观看视频 | 久久久久久国产精品mv| japanese国产精品| 四虎4hu永久免费入口| 亚洲精品护士| 一道本视频在线观看| 国产精品主播直播| 韩国无码一区二区三区精品| 国产欧美精品一区二区色综合朱莉| 中文字幕第69页| 亚洲国产成人av| 国产天堂第一区| 欧美成人一级视频| 欧美理论在线观看| 久久成人精品电影| 欧美男体视频| 亚洲一区制服诱惑| 国产成人精品免费视| 蜜臀av.com| 视频一区二区中文字幕| 中文写幕一区二区三区免费观成熟| 99久久综合99久久综合网站| 亚洲AV成人无码网站天堂久久| 亚洲一区二区在线免费观看视频| 久久久久在线视频| 欧美一区二区不卡视频| 精品欧美不卡一区二区在线观看 | 欧美国产1区2区| 国产性猛交普通话对白| 91国偷自产一区二区三区成为亚洲经典 | 欧美videos大乳护士334| 狠狠狠综合7777久夜色撩人| 欧美激情影音先锋| 丁香婷婷久久| 精品一区二区国产| 中文字幕乱码亚洲无线精品一区| 激情网站五月天| av资源站一区| 国产免费无码一区二区视频 | 亚洲综合av在线播放| 99视频在线观看一区三区| 东方av正在进入| 欧美日韩中文字幕精品| 亚洲 精品 综合 精品 自拍| 欧美成人性色生活仑片| 国产电影一区二区三区爱妃记| 国内精品视频在线播放| 欧美精品国产一区二区| 久久6免费视频| 国产精品视频第一区| 亚洲国产成人无码av在线| 亚洲精品在线免费观看视频| 视频一区二区三区不卡| 国产精品h片在线播放| 欧洲亚洲视频| 超碰成人免费在线| 国产精品影视在线| 国产中文字幕久久| 欧美视频精品在线观看| 九色网友自拍视频手机在线| 性欧美xxxx视频在线观看| 97成人在线| 黄色激情在线视频| 国产69精品久久99不卡| tube国产麻豆| 日韩一卡二卡三卡| a篇片在线观看网站| 91在线国产电影| 亚洲综合中文| 超碰在线超碰在线| 综合久久久久综合| 国产人妖一区二区| 久久成人精品一区二区三区| 免费一级欧美片在线观看网站| 欧美性视频在线播放| 国内外成人在线| avtt天堂在线| 精品国产乱码91久久久久久网站| 欧美亚洲系列| 国产亚洲第一区| 亚洲专区一区| 亚洲一区二区三区日韩| 欧美视频一区二| 嫩草在线视频| 亚洲aⅴ男人的天堂在线观看| 欧美一区二区三区久久精品茉莉花 | 精人妻无码一区二区三区| 亚洲欧洲美洲在线综合| 久久亚洲精品人成综合网| 亚洲国产精品女人| 国产成人99久久亚洲综合精品| 国产精品 欧美 日韩| 日韩高清欧美高清| 视频在线日韩| 最新黄色av网站| 成人h精品动漫一区二区三区| 毛片视频网站在线观看| 亚洲视频自拍偷拍| 色成人综合网| 国产freexxxx性播放麻豆| 久久人人97超碰com| 中文字幕黄色av| 欧美成人免费观看| 任你躁在线精品免费| 无码少妇一区二区三区芒果| 国产精品麻豆欧美日韩ww| 99国产精品久久久久99打野战| 久久久久久亚洲| 欧美一站二站| 97免费公开视频| 欧美午夜精品在线| 在线视频91p| 国产一区二区免费电影| 日本不卡免费在线视频| 婷婷色中文字幕| 亚洲视频一区二区| 麻豆国产一区二区三区四区| 91精品91久久久中77777老牛| 中文字幕中文乱码欧美一区二区| 国产91免费看| 国产精品视频最多的网站| 亚洲激情社区| 三级av在线免费观看| 日韩av在线看| 国产精品白丝久久av网站| 干日本少妇首页| 玉足女爽爽91| av在线电影免费观看| 国产女主播一区二区| 久久国产精品99久久人人澡| 国产成人精品片|