精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

聊聊大模型推理系統之Hetis:如何讓“高低配”GPU集群跑出2.25倍吞吐?

人工智能
Hetis 的出現,為異構算力環境下的大模型部署提供了全新的技術范式。它標志著 LLM 服務正從粗放式的資源堆砌,邁向精細化、動態化的智能調度時代。這一思路與國家倡導的綠色計算和算力普惠政策高度契合,有助于盤活存量算力資產,降低 AI 應用門檻。

在大模型時代,算力需求如潮水般上漲。然而,現實中的生產集群往往并非清一色的頂級顯卡,而是由A100、3090甚至老舊的P100等不同性能和內存配置的 GPU 混搭而成——這種異構 GPU 集群雖能降低成本,卻給大語言模型(LLM)服務帶來了巨大挑戰:高配 GPU 空轉等待,低配 GPU 內存耗盡,整體效率大打折扣。

面對這一行業痛點,最新研究提出了一套顛覆性解決方案。來自澳門大學與中山大學的研究團隊在 SC '25 上發表論文,推出了名為 Hetis 的新型 LLM 服務系統。該系統不僅將服務吞吐量最高提升了2.25 倍,還將推理延遲降低了1.49 倍,其背后究竟有何創新玄機?

核心看點

圖片圖片

Hetis 的核心突破在于徹底改變了傳統 LLM 服務中“一刀切”的并行策略。它首次提出了細粒度動態并行機制,精準匹配異構硬件資源與模型模塊特性。具體而言,Hetis 通過主工作節點并行化(Primary Worker Parallelism)優化計算密集型模塊(如 MLP),僅在高性能 GPU 間進行協作;同時引入動態頭級注意力并行化(Dynamic Head-wise Attention Parallelism),將輕量級的Attention計算靈活分發至所有 GPU,包括低性能設備。在此基礎上,系統還設計了在線調度算法,實時平衡網絡、計算與內存負載,從而實現了資源利用率的全局最優化。

研究背景

當前主流的 LLM 服務系統在異構環境下面臨兩大核心瓶頸:內存效率低下與計算資源錯配。以 Splitwise 為代表的階段拆分方案,將預填充(Prefill)與解碼(Decode)任務分別交給高/低性能 GPU 執行,雖緩解了計算壓力,卻導致 KV 緩存空間嚴重不足。而 Hexgen 等采用非對稱參數劃分的系統,則因計算能力與內存容量的不匹配,造成高端 GPU 內存大量閑置。

圖片圖片

更深層的問題在于,現有方法普遍采用靜態并行策略,無法適應請求長度、批次大小等動態變化。例如,MLP 模塊在 A100 與 P100 上的運算速度差距可達 24.5 倍,若強行統一并行,低效設備將成為拖累整體性能的“短板”。與此同時,Attention 模塊因其無參數特性和較低的計算強度,在各類 GPU 上表現相對均衡,具備更高的并行靈活性。Hetis 正是抓住了這一關鍵差異,開啟了精細化調度的新思路。

核心貢獻

方法創新:模塊級差異化并行架構

圖片圖片

Hetis 的核心是“按需分配”的并行哲學。對于計算密集的 MLP 和預填充階段的 Attention,系統通過一個層次化搜索過程,自動篩選出最優的主工作節點組合,并在此子集內應用數據、流水線與張量并行(DP/PP/TP),力求最小化通信開銷與計算延遲。那些未被選中的低端 GPU 則被劃為注意力工作節點(Attention Workers),專司 Attention 計算任務。

圖片圖片

針對 Attention 模塊,Hetis 創新性地采用頭維度(head-wise)進行分割。相比按請求或序列長度拆分,頭級并行能顯著減少跨設備通信量。實驗表明,在僅卸載 20%負載時,頭級分割的通信開銷比序列級分割降低近2.68 倍;當使用 4 個注意力工作節點時,延遲優勢可達3.55 倍。

實證成果:吞吐與延遲雙重突破

在包含 A100、3090 和 P100 的真實異構集群上,Hetis 展現了卓越性能。測試涵蓋Llama-13B、OPT-30B和Llama-70B等多種模型及真實工作負載(聊天、代碼生成、長文本摘要)。結果顯示:

圖片圖片

  • 吞吐量最高提升至基線系統的2.25 倍(對比 Splitwise)和1.33 倍(對比 Hexgen);
  • 推理延遲方面,P95 的TTFT(首令牌時間)和TPOT(每令牌處理時間)分別改善最多1.47 倍和1.39 倍;
  • KV 緩存空間利用率提升顯著,最大可用緩存空間比基線多出1.87 倍,有效支持更多并發請求。

這些數據充分驗證了 Hetis 在復雜動態環境下的魯棒性與高效性。

圖片圖片

在方法創新的基礎上,團隊進一步驗證了系統的自適應能力。Hetis 內置的在線調度器(Dispatcher)基于對計算與通信成本的顯式建模,實時決策每個請求的注意力頭分配方案。當遇到超長上下文導致負載不均時,系統還能觸發重調度機制(Re-dispatching),動態遷移部分計算任務,避免單點瓶頸。

此外,為支撐頭級并行,Hetis 實現了頭粒度 KV 緩存管理,開發了新的 CUDA 內核以高效索引與傳輸緩存塊。盡管存儲元數據開銷增加13% ,但得益于 CPU 多核加速,緩存獲取時間反而減少了26% ,實現了總體性能凈增益。

行業意義

Hetis 的出現,為異構算力環境下的大模型部署提供了全新的技術范式。它標志著 LLM 服務正從粗放式的資源堆砌,邁向精細化、動態化的智能調度時代。這一思路與國家倡導的綠色計算和算力普惠政策高度契合,有助于盤活存量算力資產,降低 AI 應用門檻。

未來,Hetis 所驗證的模塊感知并行(Module-aware Parallelism)理念有望推動整個分布式推理技術路線的演進。無論是邊緣計算中的混合芯片,還是云平臺上的搶占式實例,此類動態適配機制都將成為提升資源利用效率的關鍵。可以預見,隨著大模型應用場景的不斷下沉,像 Hetis 這樣的智能調度系統,將在構建高效、可持續的 AI 基礎設施中扮演變革性角色。

論文原文:Hetis: Serving LLMs in Heterogeneous GPU Clusters with Fine-grained and Dynamic Parallelism[1]

參考資料

[1] Hetis: Serving LLMs in Heterogeneous GPU Clusters with Fine-grained and Dynamic Parallelism: https://arxiv.org/abs/2509.08309

責任編輯:武曉燕 來源: 機智流
相關推薦

2025-08-29 01:15:00

大模型Arrow自適應

2023-12-11 15:40:32

PyTorch代碼大模型

2024-10-21 12:30:52

2025-11-04 16:01:56

英偉達模型AI

2023-06-27 13:49:00

GPU通信RLHF

2023-05-30 14:17:00

模型推理

2025-10-28 08:50:00

AI模型訓練

2024-07-19 09:59:31

2024-11-02 10:28:03

2025-07-30 08:40:00

AI編程模型

2023-06-21 13:20:14

系統模型

2025-09-12 09:03:00

2025-04-08 00:40:00

谷歌合成數據大模型

2023-11-30 18:25:57

數據訓練

2024-12-27 13:59:33

數據訓練模型

2024-11-01 20:25:28

2024-01-24 13:11:00

AI模型

2024-07-08 13:04:01

點贊
收藏

51CTO技術棧公眾號

色婷婷精品久久二区二区蜜臀av| 夜夜爽av福利精品导航| 欧美亚洲一区二区在线| 少妇特黄a一区二区三区 | 欧美一性一交| 色丁香久综合在线久综合在线观看 | 成人免费视频国产免费| 欧美aaaa视频| 精品成人在线观看| 国语对白做受xxxxx在线中国| av网站大全在线观看| 国产在线一区二区综合免费视频| 韩国一区二区电影| 公侵犯人妻一区二区三区| 亚洲免费资源| 黑人巨大精品欧美一区免费视频 | 欧美性猛交xxxx免费看| 日本公妇乱淫免费视频一区三区| 亚洲国产av一区二区| 久久黄色影院| 久久久久久一区二区三区| 中文字幕在线观看免费高清| jizz性欧美23| 欧美日韩aaaaaa| 各处沟厕大尺度偷拍女厕嘘嘘| 黄色精品在线观看| 久久精品欧美一区二区三区麻豆| 91手机在线观看| 中文字幕视频二区| 国产精品久久777777毛茸茸| 欧美精品在线免费| 欧美精品日韩在线| 亚洲妇女av| 精品sm捆绑视频| 韩国一区二区在线播放| 日本美女一区| 疯狂做受xxxx高潮欧美日本| 人人妻人人澡人人爽欧美一区| 91se在线| 中文字幕欧美日本乱码一线二线| 久久精品国产综合精品| 丰满肉嫩西川结衣av| 国产综合色精品一区二区三区| 国产成人精品一区二区三区| 五月婷婷开心网| 久久精品亚洲人成影院| 中文字幕日韩专区| 性欧美一区二区| 亚洲国产精品嫩草影院久久av| 欧美成人综合网站| 999在线精品视频| 欧美视频在线视频精品| 91久久奴性调教| 久久国产色av免费观看| 欧美成人a交片免费看| 欧美日韩在线免费观看| 一女被多男玩喷潮视频| 国产激情视频在线看| 亚欧色一区w666天堂| 国产一区二区99| 国产精成人品2018| 色综合天天综合给合国产| 国产九九九九九| 99久久精品免费看国产小宝寻花| 亚洲精品自拍动漫在线| 肉大捧一出免费观看网站在线播放 | 麻豆91蜜桃| 日色在线视频| 国产三级精品在线| 日韩中文字幕一区| av在线三区| 亚洲婷婷综合色高清在线| 国产又黄又爽免费视频| 羞羞网站在线免费观看| 亚洲国产欧美日韩另类综合| 日韩精品 欧美| 亚洲国产福利| 欧美性色aⅴ视频一区日韩精品| 欧美日韩亚洲自拍| 欧美亚洲人成在线| 日韩一区二区三区视频在线 | 无码粉嫩虎白一线天在线观看| 国产粉嫩在线观看| 欧美在线你懂的| www.51色.com| 极品国产人妖chinesets亚洲人妖| 日韩av网址在线观看| 新91视频在线观看| 91精品久久久久久久蜜月| 欧美激情xxxx性bbbb| 成人精品免费在线观看| 奇米影视在线99精品| 999精品视频一区二区三区| 日本加勒比一区| 国产无一区二区| 在线观看三级网站| 涩涩视频在线免费看| 欧美视频一区二区三区四区| 特黄特色免费视频| 国产亚洲精品美女久久久久久久久久| 中文字幕欧美视频在线| 国产一级二级三级视频| 丝袜亚洲另类欧美综合| 99精品国产一区二区| 你懂得网站在线| 亚洲男女毛片无遮挡| 国产亚洲综合视频| 国产精品1区在线| 亚洲精品中文字| 久久久久久久久精| 免费久久99精品国产| 国产66精品久久久久999小说| 韩国中文字幕2020精品| 一级日本不卡的影视| 黄色三级视频在线| 欧美一级一片| 欧美日韩福利在线观看| 中文字幕免费高清在线观看| 99久久久久免费精品国产 | 欧美日韩精品三区| 男人网站在线观看| 亚洲一区二区三区| 国产精品男人爽免费视频1| 人人妻人人澡人人爽久久av| 国产精品久久久久久久久免费桃花| 三上悠亚久久精品| 欧美日本三级| 日韩中文字幕国产| 成人免费毛片男人用品| 波多野结衣精品在线| 成人手机在线播放| 欧美视频第一| 中文字幕日韩在线视频| 人人妻人人爽人人澡人人精品 | 久久不射中文字幕| 成人资源av| 色老头在线观看| 欧美一区二区人人喊爽| 992在线观看| 蜜臀av性久久久久蜜臀aⅴ流畅| 狠狠爱一区二区三区| 久草在线资源站资源站| 日韩一区二区不卡| 澳门黄色一级片| 国产在线观看一区二区| 中文字幕综合在线观看| 欧美一级做a| 色妞一区二区三区| 中文字幕欧美人妻精品一区蜜臀| 国产日韩一级二级三级| 91av俱乐部| 国产综合久久久| 国产精品第七十二页| 可以在线观看的av| 色婷婷久久综合| 久久久久久久久福利| 青青草国产精品97视觉盛宴| 无码免费一区二区三区免费播放 | 亚洲xxx自由成熟| www.久久ai| 日韩欧美国产1| 久久免费视频99| www.欧美亚洲| 男人的天堂99| 成人在线国产| 亚洲a中文字幕| 久久香蕉一区| 亚洲精品久久在线| 无码人妻丰满熟妇奶水区码| 国产欧美视频在线观看| 狠狠操狠狠干视频| 欧美国产精品| 国产一区二区不卡视频在线观看| 亚洲风情在线资源| 国产一区二区日韩| 亚洲综合精品视频| 亚洲一区二区三区在线看 | 欧美国产精品v| 亚洲精品mv在线观看| 欧美一区亚洲| 麻豆91av| 精品国产不卡一区二区| 午夜精品久久久久久99热软件| 青青久在线视频免费观看| 欧美亚洲自拍偷拍| 老女人性淫交视频| 久久综合狠狠综合久久激情| 亚洲欧美国产中文| 国产精品www994| 欧洲亚洲一区二区三区四区五区| 国产精品亚洲成在人线| 欧美人与性动交| 欧美色视频免费| 制服视频三区第一页精品| 国产精品美女毛片真酒店| 久久久久99精品一区| 中文字幕12页| 欧美一级视频| 国产在线拍揄自揄拍无码| 欧美亚洲国产日韩| 国产日韩欧美中文在线播放| av岛国在线| 久久久国产精品x99av| 四虎成人免费在线| 日韩三级视频中文字幕| 在线观看亚洲黄色| 亚洲丶国产丶欧美一区二区三区| www.涩涩爱| 91在线视频官网| 国产男女无遮挡猛进猛出| 久久综合图片| 日韩网站在线免费观看| 91精品国产调教在线观看| 茄子视频成人在线观看| 日韩最新av| 国产情人节一区| 免费福利视频一区二区三区| 欧美国产精品va在线观看| a√资源在线| 亚洲欧美国产一本综合首页| www.热久久| 欧美精品国产精品| 香蕉污视频在线观看| 午夜影院久久久| 国产va在线播放| 国产精品久久久久久妇女6080 | 极品粉嫩美女露脸啪啪| 日日摸夜夜添夜夜添精品视频| 国产毛片视频网站| 欧美精品一级| 麻豆视频传媒入口| 99精品在线| 一本一本久久a久久精品综合妖精| 台湾色综合娱乐中文网| 国产一区免费视频| 99亚洲乱人伦aⅴ精品| 亚洲永久在线观看| 91精品网站在线观看| 国产精品中文久久久久久久| 三级成人黄色影院| 57pao成人永久免费视频| 77thz桃花论族在线观看| 久久久久久久久国产精品| a黄色片在线观看| 欧美成人免费全部观看天天性色| 男人天堂手机在线| www国产精品com| 亚洲成人三级| 日韩中文字幕在线| 毛片在线播放a| 久久久97精品| 最近中文字幕免费mv2018在线| 久久国产精品电影| 曰本三级在线| 久久人人爽人人爽人人片av高清| 激情网站在线| 91精品国产一区| 亚洲国产福利| 国产精品色婷婷视频| 四虎成人精品一区二区免费网站| 91精品国产综合久久香蕉最新版| 亚洲18在线| 99在线免费观看视频| 国语一区二区三区| 美脚丝袜一区二区三区在线观看| 亚洲宅男一区| 亚洲精品电影在线一区| 一区二区三区中文| 久久久久久久9| 国产午夜精品一区二区三区欧美 | 成人免费av资源| 日韩Av无码精品| 国产亚洲欧洲997久久综合| 日本人亚洲人jjzzjjz| 1区2区3区精品视频| 久久久一区二区三区四区| 午夜精品一区二区三区三上悠亚| 成人免费a视频| 欧美日韩你懂的| 国产成人毛毛毛片| 亚洲电影第1页| 国产精品一二三区视频| 久久这里有精品| 日本不良网站在线观看| 国产精品老牛影院在线观看| 国产一区 二区| 久久精品日韩精品| 欧美高清在线| 日本福利视频在线| 麻豆freexxxx性91精品| 久草视频福利在线| 日本一区二区免费在线观看视频| 2021亚洲天堂| 色噜噜夜夜夜综合网| 97精品人妻一区二区三区在线| 欧美sm美女调教| 成年人视频在线看| 久久久久久久97| 成人1区2区| 久久精品国产精品青草色艺| 亚洲高清影视| 黄色av免费在线播放| 风间由美一区二区三区在线观看| 69视频在线观看免费| 亚洲国产精品久久人人爱蜜臀| 性高潮视频在线观看| 亚洲电影免费观看| fc2ppv国产精品久久| 国产精品第一页在线| 精品中国亚洲| 激情五月五月婷婷| 日韩高清在线观看| 日本道中文字幕| 亚洲天堂av老司机| 波多野结衣激情视频| 亚洲成人黄色网址| a视频在线观看| 国产精品视频在线播放| 天天躁日日躁狠狠躁欧美巨大小说 | 久久激情电影| 成人小视频在线看| www.日韩大片| 精品亚洲永久免费| 欧美一二三区精品| 午夜在线免费观看视频| 国产精品扒开腿做爽爽爽的视频| 精品资源在线| 日韩精品视频在线观看视频| 国产在线乱码一区二区三区| 极品尤物一区二区| 日本韩国精品在线| 日本中文字幕电影在线观看| 国产做受高潮69| 成人av综合网| 无码 制服 丝袜 国产 另类| 国产一区二区电影| 久草福利资源在线| 欧美色成人综合| 欧美日韩在线看片| 国产精品色婷婷视频| 色婷婷色综合| 污污网站在线观看视频| 国产精品乱人伦中文| 一区二区视频网站| 社区色欧美激情 | 成人国产精品| 国产精品av免费| 国产精品一区二区久久精品爱涩| 欧美日韩色视频| 欧美一区二区精品在线| a级影片在线| 国产91视觉| 亚洲经典三级| 国产精品无码网站| 日韩欧美在线视频免费观看| 国产在线观看精品一区| 国产精品福利在线| 成人午夜av| 亚洲天堂av一区二区三区| 亚洲男人的天堂在线aⅴ视频| 国产激情久久久久久熟女老人av| 欧美成人精品三级在线观看| 亚洲一区二区三区在线免费| 国内精品视频一区二区三区| www成人在线观看| 中日韩av在线| 欧美成人激情在线| 久久悠悠精品综合网| 黄色高清无遮挡| 国产精品无人区| 精品国产九九九| 91精品国产99久久久久久| 怕怕欧美视频免费大全| 亚洲欧美国产日韩综合| 亚洲麻豆国产自偷在线| 天天射天天操天天干| 国产精品av免费在线观看| 99精品国产一区二区三区| 日本少妇一级片| 一本一道波多野结衣一区二区| 在线视频自拍| 国产乱码精品一区二区三区卡| 美女精品一区| 国产免费无码一区二区视频| 精品夜色国产国偷在线| 成人国产激情| 日本a在线免费观看| 欧美激情一区二区三区蜜桃视频| 精品国产区一区二| 国产69久久精品成人| 欧美独立站高清久久| 艳妇乳肉豪妇荡乳xxx| 欧美性三三影院| ririsao久久精品一区| 色播五月综合| 成人永久aaa| 在线观看国产一区二区三区| 午夜精品久久久久久久99黑人| 热久久天天拍国产| 色综合久久五月|